Yapay zeka alanında video anlama teknolojilerinin gelişimi, araştırmacıları yeni test yöntemleri geliştirmeye yönlendirdi. Mevcut değerlendirme sistemlerinin çoğu, yapay zekanın videolarda doğrudan görülebilen bilgileri tespit etme becerisine odaklanıyor. Ancak gerçek dünya uygulamaları için daha karmaşık yetenekler gerekiyor.
Yeni geliştirilen VAEX-BENCH sistemi, çok modlu büyük dil modellerinin soyut uzamsal-zamansal akıl yürütme kapasitesini ölçmek için tasarlandı. Bu sistem, yapay zekanın farklı zaman dilimlerindeki gözlemleri birleştirme, dağınık ipuçlarını toplama ve dolaylı uzamsal yapıları çıkarım yaparak anlama becerisini değerlendiriyor.
Araştırmacılar, kontrollü bir şekilde üretilmiş sentetik egosantrik video veri seti oluşturarak, nesne, oda ve kat planı seviyelerinde farklı karmaşıklık düzeylerinde test senaryoları hazırladı. Bu yaklaşım, yapay zekanın sadece görsel tanıma değil, uzamsal ilişkileri anlama ve zamansal bağlantıları kurma yeteneğini sistematik olarak test etmeyi mümkün kılıyor.
Bu gelişme, özellikle robotik ve otonomus sistemler gibi fiziksel dünyayla etkileşim gerektiren yapay zeka uygulamaları için kritik önem taşıyor. Gelecekte bu tür değerlendirme sistemleri, yapay zekanın gerçek dünya senaryolarında daha güvenilir performans göstermesine katkı sağlayabilir.