Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar embodied AI (somutlaşmış yapay zeka) sistemlerinin 3D ortamlardaki görsel arama becerilerini test etmek için yenilikçi bir benchmark geliştirdi. E3VS-Bench adı verilen bu test sistemi, mevcut sistemlerin eksikliklerini gidermeyi amaçlıyor.
Geleneksel görsel arama testleri genellikle statik gözlemler veya sınırlı hareket kabiliyetlerine dayanıyor. Ancak gerçek dünyada karşılaştığımız durumlar çok daha karmaşık: bir nesnenin özelliklerini görmek için farklı açılardan bakmak, rafların arkasını kontrol etmek veya kapların içeriğini incelemek gerekebiliyor. E3VS-Bench tam da bu ihtiyacı karşılıyor.
Sistem, 3D Gaussian Splatting teknolojisi kullanılarak oluşturulmuş 99 yüksek kaliteli 3D sahne içeriyor. Bu sahnelerde yapay zeka ajanları, 5 serbestlik derecesinde (5-DoF) hareket ederek bakış açılarını değiştirebiliyor. Dikey hareketlerle görünürlük değişimlerini test edebiliyor, nesnelerin içeriğini keşfedebiliyor ve sadece belirli açılardan görülebilen özellikleri ayırt edebiliyor.
Test sistemi toplam 2.014 soru içeriyor ve ajanların bu sorulara cevap verebilmek için aktif olarak çevrelerini keşfetmesini gerektiriyor. Bu yaklaşım, yapay zeka sistemlerinin gerçek dünya koşullarındaki performansını değerlendirmek için daha doğru bir ölçüm sağlıyor.