Teknoloji & Yapay Zeka

Görsel Belgelerde Arama Yapan Yeni Yapay Zeka Sistemi HEAVEN Geliştirildi

Araştırmacılar, görsel açıdan zengin belgeler üzerinde arama yapmak için yeni bir hibrit sistem olan HEAVEN'ı geliştirdi. Bu sistem, hukuki araştırmalar, bilimsel doküman tarama ve kurumsal bilgi yönetimi gibi alanlarda kullanılmak üzere tasarlandı. Geleneksel yöntemlerin hız ve doğruluk arasındaki ikilemini çözmek için iki aşamalı bir yaklaşım benimseyen HEAVEN, önce tek vektör yöntemiyle hızlı tarama yapıyor, ardından çok vektörlü yöntemle sonuçları hassas bir şekilde sıralıyor. Sistem, görsel düzeni özetleyen sayfalar oluşturarak hesaplama maliyetini düşürürken doğruluğu koruyor. Araştırmacılar ayrıca sistemlerini test etmek için ViMDoc adlı yeni bir değerlendirme standardı da tanıttılar.

Stanford ve diğer kurumlardan araştırmacılar, görsel açıdan karmaşık belgelerde arama yapmak için yenilikçi bir yapay zeka sistemi geliştirdi. HEAVEN (Hybrid-Vector Framework) adı verilen bu sistem, özellikle hukuki belge tarama, bilimsel literatür araştırması ve büyük şirketlerin bilgi yönetimi sistemleri için tasarlandı.

Mevcut belge arama sistemlerinin temel sorunu, hız ile doğruluk arasındaki dengeyi kuramaması. Tek vektör kullanan sistemler hızlı çalışıyor ancak ayrıntıları kaçırıyor, çok vektör kullanan sistemler ise çok doğru sonuçlar veriyor ancak hesaplama açısından oldukça pahalı.

HEAVEN bu sorunu iki aşamalı hibrit yaklaşımla çözüyor. İlk aşamada, sisteme özgü 'Görsel Özetlenmiş Sayfalar' kullanarak hızlı bir ön tarama yapıyor. Bu sayfalar, birden çok belgeden temsili görsel düzenleri bir araya getiriyor. İkinci aşamada ise, aday sonuçları çok vektörlü yöntemle yeniden sıralıyor ve gereksiz hesaplamaları azaltmak için sorgu kelimelerini dilbilimsel önemine göre filtreliyor.

Araştırmacılar ayrıca sistemlerini gerçekçi koşullarda test etmek için ViMDoc adlı yeni bir değerlendirme standardı da geliştirdi. Bu standart, görsel açıdan zengin, çoklu ve uzun belgeler üzerinde arama performansını ölçmeye odaklanıyor.

Özgün Kaynak
arXiv (CS + AI)
Hybrid-Vector Retrieval for Visually Rich Documents: Combining Single-Vector Efficiency and Multi-Vector Accuracy
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.