Bilim insanları, çoklu kamera sistemleri kullanarak üç boyutlu nesne tespiti yapan gelişmiş bir yapay zeka modeli geliştirdi. CAM3DNet olarak adlandırılan bu yenilikçi sistem, özellikle otonom araçlar ve robotik uygulamalar için kritik öneme sahip görüntü işleme yeteneklerini önemli ölçüde geliştiriyor.
Geleneksel çok kameralı 3D nesne tespit yöntemleri, farklı ölçeklerdeki dinamik bilgileri verimli şekilde kullanmakta zorlanıyordu. Bu sistemler, nesne özellikleri ile geometrik sorgular arasındaki ilişkileri yeterince öğrenemiyor ve çok boyutlu uzay-zaman özelliklerini keşfetmek için aşırı hesaplama gücü gerektiriyordu.
Yeni geliştirilen CAM3DNet sistemi, bu sorunları çözmek için üç farklı modülü birleştiriyor. İlk modül olan 'composite query', çok ölçekli projeksiyon stratejisi kullanarak 2D sorguları 3D uzaya dönüştürüyor. 'Adaptive self-attention' modülü ise uzay-zaman çok ölçekli sorgular arasındaki etkileşimleri öğreniyor.
Sistemin üçüncü bileşeni olan 'multi-scale hybrid sampling' modülü, deformable attention mekanizmasını kullanarak çok ölçekli sorguları, piramit özellik haritalarını ve 2D kamera ön bilgisini dikkate alarak nesne bilgilerini örnekliyor.
Bu teknolojik gelişme, makine görüsü alanında önemli bir ilerleme kaydederek, yapay zekanın gerçek dünya uygulamalarında daha etkili çalışmasının yolunu açıyor.