Yapay zeka destekli belge arama sistemlerinde kullanılan mevcut yöntemler, bilimsel literatür için ciddi eksiklikler barındırıyor. Son yıllarda geliştirilen birçok sistem, bilimsel makaleleri görsel olarak işliyor - yani sayfa görüntüleri üzerinden analiz yapıyor.
Ancak bu yaklaşım, bilimsel metinlerin doğasıyla uyuşmuyor. Bilimsel makaleler sadece düz metin içermiyor; tablolar, grafikler, formüller ve çeşitli yapısal öğeler kritik bilgileri taşıyor. Bu öğeler arasındaki ilişkileri anlamak, görsel analiz ile mümkün olmuyor.
Araştırmacılar sorunu test etmek için ArXivDoc adında yeni bir değerlendirme sistemi geliştirdi. Bu sistem, makalelerin PDF versiyonları yerine orijinal LaTeX kaynak kodlarını kullanıyor. LaTeX formatı, belgenin yapısal öğelerine - bölümler, tablolar, şekiller, denklemler - doğrudan erişim sağlıyor.
Karşılaştırmalı testler, metin tabanlı ve karma yöntemlerin görsel yaklaşımlardan belirgin şekilde daha başarılı olduğunu gösterdi. Bu bulgular, bilimsel belge arama sistemlerinin yeniden tasarlanması gerektiğine işaret ediyor.
Sonuçlar, gelecekte geliştirilecek akademik arama motorları ve araştırma asistanları için önemli ipuçları sunuyor. Görsel analizin yanında yapısal metin işleme yöntemlerinin de kullanılması gerekiyor.