Teknoloji & Yapay Zeka

Humanoid robotlar için dil komutlu hareket üretimi sistemi geliştirildi

Araştırmacılar, humanoid robotlara doğal dil komutlarıyla karmaşık hareketler öğretmek için CLAW adlı yenilikçi bir sistem geliştirdi. Sistem, fiziksel olarak mümkün olan hareketleri dil açıklamalarıyla eşleştirerek büyük ölçekli veri setleri oluşturuyor. Geleneksel hareket yakalama yöntemlerinin pahalı ve sınırlı olması, yapay zeka modellerinin ise fiziksel gerçekçilikten uzak sonuçlar üretmesi sorununu çözen CLAW, Unitree G1 humanoid robotu için özel olarak tasarlandı. Sistem, temel hareket bileşenlerini birleştirerek gerçekçi robot hareketleri üretiyor ve bunları doğal dilde açıklıyor. Bu gelişme, robotların insan komutlarını anlayıp karmaşık görevleri yerine getirebilmesi için kritik bir adım teşkil ediyor.

Stanford ve diğer kurumlardan araştırmacılar, humanoid robotların doğal dil komutlarını anlayarak hareket etmesini sağlayacak CLAW (Composable Language-Annotated Whole-body Motion Generation) sistemini geliştirdi. Bu sistem, robot eğitimi için gerekli olan büyük ölçekli hareket-dil veri setlerinin üretimindeki mevcut sorunlara çözüm sunuyor.

Geleneksel yaklaşımlar hareket yakalama teknolojisine dayanıyor ancak bu yöntem hem maliyetli hem de hareket çeşitliliği açısından sınırlı. Diğer yandan, metinden harekete dönüştürme modelleri fiziksel gerçekçilikten uzak sonuçlar üretiyor. CLAW ise bu iki sorunu da çözerek Unitree G1 humanoid robotu için özelleştirilmiş bir çözüm sunuyor.

Sistem, hareket, yön, hız, pelvis yüksekliği ve süre gibi parametrelerle tanımlanan temel hareket bileşenlerini birleştirerek çalışıyor. İki farklı arayüz sunan sistem, gerçek zamanlı klavye modu ve zaman çizelgesi tabanlı sıralama editörü ile hem keşifsel hem de toplu veri toplama imkanı sağlıyor.

Düşük seviyeli kontrol sistemi, bu hareketleri MuJoCo simülasyon ortamında takip ederek fiziksel olarak mümkün olan yörüngeler üretiyor. Aynı zamanda, şablon tabanlı bir motor çeşitli doğal dil açıklamaları oluşturuyor. Bu yaklaşım, robotik alanında dil-tabanlı kontrol sistemlerinin gelişimi için önemli bir adım teşkil ediyor.

Özgün Kaynak
arXiv (CS + AI)
CLAW: Composable Language-Annotated Whole-body Motion Generation
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.