Bilgisayar görüşü alanında çığır açan bir gelişme yaşandı. Araştırmacılar, 2D görüntülerden 3D insan pozlarını tahmin etmek için yeni bir yapay zeka modeli geliştirdi. MixTGFormer olarak adlandırılan bu sistem, mevcut teknolojilerin eksikliklerini gidererek daha doğru sonuçlar üretiyor.
Geleneksel Transformer tabanlı yöntemler, global zamansal ve uzamsal ilişkilere odaklanırken, yerel iskelet bağlantılarını ve kanal arası bilgi etkileşimini göz ardı ediyordu. Yeni geliştirilen hibrit sistem bu sorunu çözerek, hem büyük resmi hem de detayları aynı anda analiz edebiliyor.
MixTGFormer'ın temel özelliği, iki paralel kanal üzerinden çalışması. Bu kanallar sayesinde insan iskeletinin uzamsal ve zamansal ilişkileri eş zamanlı olarak modelleniyor. Sistemin çekirdeğini oluşturan Mixformer blokları, çeşitli insan iskelet bilgilerini çıkarıp birleştiriyor.
Bu teknolojinin uygulama alanları oldukça geniş. Spor performans analizi, sağlık izleme sistemleri, sanal gerçeklik uygulamaları, oyun endüstrisi ve hareket yakalama teknolojileri bu gelişmeden doğrudan faydalanabilir.
Araştırmacılar, sistemin özellikle iskelet eklemlerinin yerel bağlantılarını daha iyi anladığını ve bu sayede insan hareketlerini daha hassas şekilde 3D uzayda yeniden oluşturabildiğini belirtiyor.