Robotik alanında devrim niteliğinde bir gelişme yaşanıyor. Araştırmacılar, robotların öğrenme sürecini iyileştirmek için DeFI (Decoupled Forward and Inverse dynamics) adlı yeni bir framework geliştirdi. Bu sistem, geleneksel vision-language-action modellerinin karşılaştığı temel sorunları çözmeyi hedefliyor.
Mevcut robotik sistemlerde en büyük sorunlardan biri, 2D görüntü işleme ile 3D hareket kontrolü arasındaki uyumsuzluk. DeFI, bu iki süreci birbirinden ayırarak her birinin kendi alanında uzmanlaşmasını sağlıyor. Framework, iki ana bileşenden oluşuyor: Genel İleri Dinamik Modeli (GFDM) ve Genel Ters Dinamik Modeli (GIDM).
GFDM, çeşitli insan ve robot videolarından gelecekteki durumları tahmin etmeyi öğreniyor. GIDM ise video geçişlerinden hareket bilgilerini çıkarsamayı hedefliyor ve kendi kendine öğrenme yöntemiyle eğitiliyor. Bu yaklaşımın en önemli avantajı, hareket bilgisi içermeyen internet videolarından da öğrenebilmesi.
Bu yenilik, robotik alanında büyük bir veri darboğazını çözüyor. Geleneksel yöntemler sadece etiketli robot verilerine bağımlıyken, DeFI sistemleri internet üzerindeki milyonlarca video içeriğinden faydalanabiliyor. Bu durum, robotların çevreyi anlama ve hareket planlama yeteneklerini önemli ölçüde geliştiriyor.
Araştırma, genel amaçlı robot sistemlerinin geliştirilmesi yolunda önemli bir adım olarak değerlendiriliyor ve gelecekte daha akıllı, adaptif robotik uygulamaların önünü açıyor.