Teknoloji & Yapay Zeka

Yapay Zeka Ajanları İçin Yeni 3D Görsel Arama Testi Geliştirildi

Araştırmacılar, yapay zeka ajanlarının 3D ortamlarda görsel arama yeteneklerini değerlendirmek için E3VS-Bench adlı yeni bir test sistemi geliştirdi. Bu sistem, ajanların farklı açılardan bakarak nesneleri incelemesi, kapların içini görmesi ve açıya bağlı özellikleri ayırt etmesi gibi gerçek dünyada karşılaştığımız karmaşık durumları simüle ediyor. Mevcut testlerin aksine, bu yeni sistem ajanların 5 serbestlik derecesinde hareket ederek bakış açılarını değiştirmesine olanak tanıyor. 3D Gaussian Splatting teknolojisi kullanılarak 99 yüksek kaliteli 3D sahne ve 2.014 soru ile oluşturulan bu test, yapay zeka ajanlarının gerçek dünya koşullarında nasıl performans gösterebileceğini daha doğru bir şekilde ölçmeyi hedefliyor.

Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar embodied AI (somutlaşmış yapay zeka) sistemlerinin 3D ortamlardaki görsel arama becerilerini test etmek için yenilikçi bir benchmark geliştirdi. E3VS-Bench adı verilen bu test sistemi, mevcut sistemlerin eksikliklerini gidermeyi amaçlıyor.

Geleneksel görsel arama testleri genellikle statik gözlemler veya sınırlı hareket kabiliyetlerine dayanıyor. Ancak gerçek dünyada karşılaştığımız durumlar çok daha karmaşık: bir nesnenin özelliklerini görmek için farklı açılardan bakmak, rafların arkasını kontrol etmek veya kapların içeriğini incelemek gerekebiliyor. E3VS-Bench tam da bu ihtiyacı karşılıyor.

Sistem, 3D Gaussian Splatting teknolojisi kullanılarak oluşturulmuş 99 yüksek kaliteli 3D sahne içeriyor. Bu sahnelerde yapay zeka ajanları, 5 serbestlik derecesinde (5-DoF) hareket ederek bakış açılarını değiştirebiliyor. Dikey hareketlerle görünürlük değişimlerini test edebiliyor, nesnelerin içeriğini keşfedebiliyor ve sadece belirli açılardan görülebilen özellikleri ayırt edebiliyor.

Test sistemi toplam 2.014 soru içeriyor ve ajanların bu sorulara cevap verebilmek için aktif olarak çevrelerini keşfetmesini gerektiriyor. Bu yaklaşım, yapay zeka sistemlerinin gerçek dünya koşullarındaki performansını değerlendirmek için daha doğru bir ölçüm sağlıyor.

Özgün Kaynak
arXiv (CS + AI)
E3VS-Bench: A Benchmark for Viewpoint-Dependent Active Perception in 3D Gaussian Splatting Scenes
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.