Stanford ve diğer kurumlardan araştırmacılar, humanoid robotların doğal dil komutlarını anlayarak hareket etmesini sağlayacak CLAW (Composable Language-Annotated Whole-body Motion Generation) sistemini geliştirdi. Bu sistem, robot eğitimi için gerekli olan büyük ölçekli hareket-dil veri setlerinin üretimindeki mevcut sorunlara çözüm sunuyor.
Geleneksel yaklaşımlar hareket yakalama teknolojisine dayanıyor ancak bu yöntem hem maliyetli hem de hareket çeşitliliği açısından sınırlı. Diğer yandan, metinden harekete dönüştürme modelleri fiziksel gerçekçilikten uzak sonuçlar üretiyor. CLAW ise bu iki sorunu da çözerek Unitree G1 humanoid robotu için özelleştirilmiş bir çözüm sunuyor.
Sistem, hareket, yön, hız, pelvis yüksekliği ve süre gibi parametrelerle tanımlanan temel hareket bileşenlerini birleştirerek çalışıyor. İki farklı arayüz sunan sistem, gerçek zamanlı klavye modu ve zaman çizelgesi tabanlı sıralama editörü ile hem keşifsel hem de toplu veri toplama imkanı sağlıyor.
Düşük seviyeli kontrol sistemi, bu hareketleri MuJoCo simülasyon ortamında takip ederek fiziksel olarak mümkün olan yörüngeler üretiyor. Aynı zamanda, şablon tabanlı bir motor çeşitli doğal dil açıklamaları oluşturuyor. Bu yaklaşım, robotik alanında dil-tabanlı kontrol sistemlerinin gelişimi için önemli bir adım teşkil ediyor.