Stanford Üniversitesi araştırmacıları, robot planlamasında karşılaşılan temel sorunlardan birine çözüm getiren VeriGraph sistemini tanıttı. Mevcut görü-dil modelleri robotlar için görev planları oluşturabilse de, bu planlar çoğu zaman fiziksel olarak gerçekleştirilemez eylemler içeriyor.
VeriGraph'ın ayırt edici özelliği, sahne grafiklerini ara temsil olarak kullanması. Sistem, kamera görüntülerinden nesneleri ve aralarındaki uzamsal ilişkileri haritalandırarak detaylı bir sahne grafiği oluşturuyor. Bu grafik sayesinde, bir robotun belirli bir eylemi gerçekleştirip gerçekleştiremeyeceğini önceden değerlendiriyor.
Çalışma metodolojisi oldukça sistemli: Büyük dil modeli önce bir görev planı oluşturuyor, ardından VeriGraph her eylemi sahne grafiğine göre kontrol ediyor. Eğer bir eylem fiziksel kısıtlamaları ihlal ediyorsa, sistem alternatif çözümler öneriyor ve planı yeniden düzenliyor.
Deneysel sonuçlar, teknolojinin potansiyelini gözler önüne seriyor. Farklı manipülasyon senaryolarında test edilen sistem, klasik yöntemlere kıyasla kayda değer performans artışları gösterdi. Özellikle karmaşık puzzle çözümlerinde %56'lık başarı artışı, sistemin uzamsal akıl yürütme kabiliyetinin gücünü ortaya koyuyor.
Bu gelişme, otonom robotların daha güvenilir ve etkili çalışmasının önünü açarak, endüstriyel otomasyon ve kişisel robot asistanları alanlarında yeni olanaklar sunuyor.