Bilimsel literatürün hızla artan hacmi ve karmaşıklığı karşısında, araştırmacılar etkili düzenleme yöntemleri geliştirmeye odaklanıyor. Yeni bir araştırma, bilimsel makaleleri otomatik olarak gruplandırma ve sınıflandırma konusunda farklı yapay zeka yaklaşımlarını kapsamlı şekilde test etti.
Çalışmada, dört farklı belge temsil yöntemi karşılaştırıldı: sadece özet metni, yapılandırılmış bilgi üçlüleri (özne-yüklem-nesne), özet ve üçlülerin kombinasyonu, ve hibrit yaklaşım. Araştırmacılar, arXiv veri tabanından seçilen makaleler üzerinde MiniLM, MPNet, SciBERT ve SPECTER gibi dört transformer modelini test etti.
Beklenmedik şekilde, en basit yaklaşım olan sade özet metinleri en yüksek performansı gösterdi. Bu yöntem 0.923 doğruluk oranı ve 0.923 makro-F1 skoru ile diğer karmaşık yöntemleri geride bıraktı. Yapılandırılmış bilgi üçlüleri içeren yaklaşımlar ise tutarlı bir üstünlük sağlayamadı.
Bu sonuçlar, bilim insanlarının literatür tarama araçlarını geliştirirken sadeliğin gücünü göz ardı etmemeleri gerektiğini ortaya koyuyor. Araştırma, karmaşık bilgi yapılarının her durumda daha iyi sonuç vermediğini kanıtlayarak, gelecekteki çalışmalar için yol gösterici nitelikte.