Yapay zeka araştırmacıları, internet videolarından 3D insan hareketlerini ve insan-nesne etkileşimlerini yeniden oluşturabilen yenilikçi bir sistem geliştirdi. AnyLift adı verilen bu teknoloji, büyük ölçekli insan davranış veri setleri oluşturmanın önündeki önemli engelleri aşmayı hedefliyor.

Mevcut yöntemler, özellikle dinamik kameralar altında küresel olarak tutarlı 3D hareketleri kurtarmakta zorlanıyor. Bu durum, mevcut hareket yakalama veri setlerinde yeterince temsil edilmeyen hareket türleri için daha da problemli hale geliyor. AnyLift, bu zorluklara iki aşamalı bir çerçeve ile çözüm getiriyor.

Sistemin ilk aşamasında, internet videolarından çıkarılan 2D anahtar noktalar kullanılarak her alan için çok görüşlü 2D hareket verileri sentezleniyor. Bu yaklaşım, geleneksel hareket yakalama veri setlerinde nadiren görülen insan hareketlerini sisteme dahil etmeyi mümkün kılıyor.

İkinci aşamada ise, kameraya bağlı çok görüşlü 2D hareket difüzyon modeli, alana özgü sentetik veriler üzerinde eğitiliyor. Bu sayede dünya uzayında 3D insan hareketi ve 3D insan-nesne etkileşimleri başarıyla kurtarılıyor.

Bu gelişme, sanal gerçeklik uygulamaları, oyun endüstrisi ve robotik sistemler için önemli fırsatlar yaratıyor. İnternet videolarından elde edilen zengin hareket çeşitliliği, daha gerçekçi ve kapsamlı 3D animasyonların üretilmesini sağlayabilir.