Teknoloji & Yapay Zeka

Yapay Zeka İnsan Hareketlerini 3D Olarak Daha Doğru Tahmin Edebiliyor

Bilgisayar görüşü alanında önemli bir yenilik gerçekleşti. Araştırmacılar, 2D görüntülerden 3D insan pozlarını tahmin etmek için hibrit bir yapay zeka modeli geliştirdi. MixTGFormer adı verilen bu sistem, geleneksel Transformer ağlarını grafik sinir ağları ile birleştirerek hem global hem de lokal özellikleri etkili şekilde analiz ediyor. Yeni yaklaşım, insan iskelet yapısının uzamsal ve zamansal ilişkilerini iki paralel kanal üzerinden aynı anda modelleyebiliyor. Bu teknoloji, spor analizi, sağlık izleme, sanal gerçeklik uygulamaları ve hareket yakalama sistemleri gibi birçok alanda devrim yaratma potansiyeli taşıyor. Sistem, özellikle iskelet eklemlerinin birbirleriyle olan yerel bağlantılarını ve farklı kanallar arası bilgi akışını daha iyi anlayarak, mevcut yöntemlere göre daha hassas sonuçlar üretiyor.

Bilgisayar görüşü alanında çığır açan bir gelişme yaşandı. Araştırmacılar, 2D görüntülerden 3D insan pozlarını tahmin etmek için yeni bir yapay zeka modeli geliştirdi. MixTGFormer olarak adlandırılan bu sistem, mevcut teknolojilerin eksikliklerini gidererek daha doğru sonuçlar üretiyor.

Geleneksel Transformer tabanlı yöntemler, global zamansal ve uzamsal ilişkilere odaklanırken, yerel iskelet bağlantılarını ve kanal arası bilgi etkileşimini göz ardı ediyordu. Yeni geliştirilen hibrit sistem bu sorunu çözerek, hem büyük resmi hem de detayları aynı anda analiz edebiliyor.

MixTGFormer'ın temel özelliği, iki paralel kanal üzerinden çalışması. Bu kanallar sayesinde insan iskeletinin uzamsal ve zamansal ilişkileri eş zamanlı olarak modelleniyor. Sistemin çekirdeğini oluşturan Mixformer blokları, çeşitli insan iskelet bilgilerini çıkarıp birleştiriyor.

Bu teknolojinin uygulama alanları oldukça geniş. Spor performans analizi, sağlık izleme sistemleri, sanal gerçeklik uygulamaları, oyun endüstrisi ve hareket yakalama teknolojileri bu gelişmeden doğrudan faydalanabilir.

Araştırmacılar, sistemin özellikle iskelet eklemlerinin yerel bağlantılarını daha iyi anladığını ve bu sayede insan hareketlerini daha hassas şekilde 3D uzayda yeniden oluşturabildiğini belirtiyor.

Özgün Kaynak
arXiv (CS + AI)
Dual-stream Spatio-Temporal GCN-Transformer Network for 3D Human Pose Estimation
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.