Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar robotların gerçek dünyada daha etkili çalışabilmesi için XEmbodied adlı yenilikçi bir model geliştirdi. Bu çalışma, mevcut görü-dil-eylem modellerindeki kritik bir eksikliği gidermeyi amaçlıyor.
Günümüzde kullanılan görü-dil modelleri genellikle 2D görüntü ve metin verilerle eğitildiği için, gerçek dünyada fiziksel etkileşim gerektiren durumlarla karşılaştıklarında yetersiz kalıyor. Bu modeller geometrik akıl yürütme konusunda zayıf ve fiziksel çevre dinamiklerini anlama kapasiteleri sınırlı.
XEmbodied, bu sorunu çözmek için özel olarak tasarlanmış iki yenilikçi bileşen sunuyor. İlk bileşen olan Yapılandırılmış 3D Adaptör, geometrik bilgileri model içine entegre ediyor. İkinci bileşen ise Verimli Görüntü-Fiziksel Adaptör, doluluk haritaları ve 3D kutu bilgileri gibi fiziksel sinyalleri bağlam tokenlarına dönüştürüyor.
Model, aşamalı alan müfredatı ve pekiştirmeli öğrenme teknikleri kullanılarak geliştirildi. Bu yaklaşım, sistemin genel yeteneklerini korurken fiziksel dünya anlayışını güçlendiriyor. Test sonuçları, XEmbodied'in 18 farklı kamu veri setinde güçlü performans sergilediğini gösteriyor.
Bu gelişme, gelecekteki otonom robotların ev ortamından endüstriyel uygulamalara kadar geniş bir yelpazede daha etkili çalışabilmesinin yolunu açıyor.