Teknoloji & Yapay Zeka

Yapay zeka artık metin talimatıyla insan hareketini anlayıp üretebiliyor

Araştırmacılar, insan hareketlerini anlama ve üretme süreçlerini birleştiren yenilikçi bir yapay zeka sistemi geliştirdi. CoAMD adlı bu sistem, yazılı açıklamaları iskelet koordinatlarına dönüştürerek gerçekçi insan hareketleri oluşturabiliyor. Sistemin kalbi olan çok modlu hareket tanıyıcısı (MAR), metin ve hareket arasında köprü kurarak her iki süreci de optimize ediyor. Bu çalışma, bilgisayarlı görü alanında hareket tanıma ve hareket üretiminin ayrı ayrı çalışıldığı geleneksel yaklaşımdan farklı olarak, bu iki alanı birleştirerek daha etkili sonuçlar elde etmeyi hedefliyor. Araştırma, animasyon endüstrisi, robotik ve sanal gerçeklik uygulamaları için önemli potansiyel taşıyor.

Bilim insanları, insan hareketlerini anlama ve üretme konularında çığır açan bir yapay zeka sistemi geliştirdi. CoAMD (Koordinat Tabanlı Otoregresif Hareket Difüzyonu) olarak adlandırılan bu sistem, metin açıklamalarından yola çıkarak gerçekçi insan hareketleri oluşturabiliyor.

Araştırmacılar, geleneksel yaklaşımların hareket tanıma ve hareket üretimini ayrı problemler olarak ele aldığını belirterek, bu iki alanın aslında ortak bir paydada buluştuğunu keşfetti. Her iki süreç de temelinde hareketin anlamsal olarak anlaşılmasını gerektiriyor.

Sistemin en önemli bileşeni olan Çok Modlu Hareket Tanıyıcısı (MAR), metin ve hareket verilerini birlikte işleyerek her iki süreci de güçlendiriyor. Bu yaklaşım sayesinde CoAMD, kaba hatlardan ince detaylara doğru ilerleyerek hareketleri aşamalı olarak sentezliyor.

Araştırma ekibi, iskelet koordinatlarını kullanarak hem hareket anlama hem de hareket üretme işlemlerini gerçekleştiren bu sistemle, animasyon endüstrisi, robotik ve sanal gerçeklik alanlarında yeni olanaklar yaratmayı hedefliyor. Sistem, dört farklı görevde test edilerek başarılı sonuçlar verdiği kanıtlandı.

Özgün Kaynak
arXiv (CS + AI)
Marrying Text-to-Motion Generation with Skeleton-Based Action Recognition
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.