Stanford ve diğer kurumlardan araştırmacılar, görsel açıdan karmaşık belgelerde arama yapmak için yenilikçi bir yapay zeka sistemi geliştirdi. HEAVEN (Hybrid-Vector Framework) adı verilen bu sistem, özellikle hukuki belge tarama, bilimsel literatür araştırması ve büyük şirketlerin bilgi yönetimi sistemleri için tasarlandı.
Mevcut belge arama sistemlerinin temel sorunu, hız ile doğruluk arasındaki dengeyi kuramaması. Tek vektör kullanan sistemler hızlı çalışıyor ancak ayrıntıları kaçırıyor, çok vektör kullanan sistemler ise çok doğru sonuçlar veriyor ancak hesaplama açısından oldukça pahalı.
HEAVEN bu sorunu iki aşamalı hibrit yaklaşımla çözüyor. İlk aşamada, sisteme özgü 'Görsel Özetlenmiş Sayfalar' kullanarak hızlı bir ön tarama yapıyor. Bu sayfalar, birden çok belgeden temsili görsel düzenleri bir araya getiriyor. İkinci aşamada ise, aday sonuçları çok vektörlü yöntemle yeniden sıralıyor ve gereksiz hesaplamaları azaltmak için sorgu kelimelerini dilbilimsel önemine göre filtreliyor.
Araştırmacılar ayrıca sistemlerini gerçekçi koşullarda test etmek için ViMDoc adlı yeni bir değerlendirme standardı da geliştirdi. Bu standart, görsel açıdan zengin, çoklu ve uzun belgeler üzerinde arama performansını ölçmeye odaklanıyor.