Yapay Zeka Robotlarının Çevresel Değişikliklere Adaptasyonu İyileştiriliyor

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Görme-Dil-Eylem modellerinde (VLA) yaşanan çevresel değişikliklere karşı kırılganlık sorunu çözüm buluyor. Araştırmacılar, robotların küçük nesne pozisyon değişikliklerinde bile başarısız olma problemini 'yörünge aşırı öğrenme' olarak tanımlıyor. Bu durumda robotlar, eylemler ve nesneler arasındaki sahte korelasyonlara odaklanarak ezberledikleri kalıpları tekrarlıyor. Yeni geliştirilen PDF (Perturbation learning with Delayed Feedback) yöntemi, temel modelde ince ayar yapmadan test zamanında adaptasyon sağlıyor. Bu yaklaşım, belirsizlik tabanlı veri artırma ve eylem oylama ile sahte korelasyonları azaltırken, adaptif bir zamanlayıcı performans-verimlilik dengesini koruyor. Hafif bir pertürbasyon modülü de gecikmeli geri bildirimle eylem güvenilirliğini retrospektif olarak ayarlıyor.

Görme-Dil-Eylem modelleri (VLA), robotik uygulamalarda ardışık karar verme süreçlerinde dikkat çekici başarılar elde ediyor. Ancak bu sistemler, nesne pozisyonundaki küçük değişiklikler gibi çevresel kaymalara karşı beklenmedik bir kırılganlık gösteriyor.

Araştırmacılar bu problemi 'yörünge aşırı öğrenme' kavramıyla açıklıyor. Bu durumda VLA modelleri, eylemler ve çevresel unsurlar arasındaki yanıltıcı korelasyonlara aşırı odaklanıyor ve öğrenme sürecinde ezberledikleri eylem kalıplarını körü körüne tekrarlama eğilimi gösteriyor.

Bu soruna çözüm olarak geliştirilen Perturbation learning with Delayed Feedback (PDF) yöntemi, temel modelde herhangi bir ince ayarlama yapmadan test sırasında adaptasyon imkanı sunuyor. PDF sistemi, belirsizlik temelli veri zenginleştirme ve eylem oylama tekniklerini kullanarak sahte korelasyonları minimize ediyor.

Sistemin dikkat çeken özelliklerinden biri adaptif zamanlayıcı mekanizması. Bu bileşen, performans ve hesaplama verimliliği arasında denge kurarak zenginleştirme bütçelerini akıllıca dağıtıyor. Ayrıca hafif bir pertürbasyon modülü, gecikmeli geri bildirim rehberliğinde eylem olasılıklarını geriye dönük olarak düzenleyerek aşırı güven problemini düzeltiyor.

LIBERO test ortamında yapılan deneyler, PDF yönteminin robot karar verme performansında önemli iyileştirmeler sağladığını gösteriyor.

Etiketler

#yapay zeka #robotik #makine öğrenmesi #adaptasyon #bilgisayar görüsü

Özgün Kaynak

Test-Time Perturbation Learning with Delayed Feedback for Vision-Language-Action Models

https://arxiv.org/abs/2604.18107

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.