Teknoloji & Yapay Zeka

XEmbodied: Robotlara 3D Dünyayı Anlama Yetisi Kazandıran Yeni Model

Araştırmacılar, otonom robotlar için geliştirilen XEmbodied adlı yeni bir yapay zeka modeli sundu. Mevcut görü-dil modelleri sadece 2D görüntülerle eğitildikleri için gerçek dünyada fiziksel etkileşim konusunda yetersiz kalıyordu. XEmbodied, robotlara 3D geometrik farkındalık kazandırarak bu sorunu çözmeyi hedefliyor. Model, 3D kutu bilgileri ve doluluk haritaları gibi fiziksel ipuçlarını anlayabiliyor. Özel adaptörler sayesinde geometrik verileri işleyebilen sistem, 18 farklı test ortamında başarılı performans gösterdi. Bu gelişme, gelecekteki otonom robotların çevrelerini daha iyi anlamasını ve fiziksel dünyayla etkileşimde bulunmasını sağlayacak.

Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar robotların gerçek dünyada daha etkili çalışabilmesi için XEmbodied adlı yenilikçi bir model geliştirdi. Bu çalışma, mevcut görü-dil-eylem modellerindeki kritik bir eksikliği gidermeyi amaçlıyor.

Günümüzde kullanılan görü-dil modelleri genellikle 2D görüntü ve metin verilerle eğitildiği için, gerçek dünyada fiziksel etkileşim gerektiren durumlarla karşılaştıklarında yetersiz kalıyor. Bu modeller geometrik akıl yürütme konusunda zayıf ve fiziksel çevre dinamiklerini anlama kapasiteleri sınırlı.

XEmbodied, bu sorunu çözmek için özel olarak tasarlanmış iki yenilikçi bileşen sunuyor. İlk bileşen olan Yapılandırılmış 3D Adaptör, geometrik bilgileri model içine entegre ediyor. İkinci bileşen ise Verimli Görüntü-Fiziksel Adaptör, doluluk haritaları ve 3D kutu bilgileri gibi fiziksel sinyalleri bağlam tokenlarına dönüştürüyor.

Model, aşamalı alan müfredatı ve pekiştirmeli öğrenme teknikleri kullanılarak geliştirildi. Bu yaklaşım, sistemin genel yeteneklerini korurken fiziksel dünya anlayışını güçlendiriyor. Test sonuçları, XEmbodied'in 18 farklı kamu veri setinde güçlü performans sergilediğini gösteriyor.

Bu gelişme, gelecekteki otonom robotların ev ortamından endüstriyel uygulamalara kadar geniş bir yelpazede daha etkili çalışabilmesinin yolunu açıyor.

Özgün Kaynak
arXiv (CS + AI)
XEmbodied: A Foundation Model with Enhanced Geometric and Physical Cues for Large-Scale Embodied Environments
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.