Modern makine görüşünün en kritik ihtiyaçlarından biri olan üç boyutlu hedef algılama konusunda çığır açan bir gelişme yaşandı. Bilim insanları, metayüzey kodlayıcı teknolojisi ile entegre edilmiş optoelektronik sinir ağı mimarisi geliştirerek bu alandaki mevcut zorlukları aşmaya yönelik yenilikçi bir çözüm sundular.
Mevcut 3D algılama sistemleri genellikle çok görüşlü görüntülerin veya LiDAR nokta bulutlarının karmaşık işlenmesine dayanıyor. Bu durum önemli hesaplama yükü, yüksek güç tüketimi ve gecikme sorunları yaratıyor. Yeni geliştirilen sistem ise bu problemleri ortadan kaldırmak için farklı bir yaklaşım benimsiyor.
Sistemin kalbi, metayüzey tarafından üretilen çift sarmal nokta yayılım fonksiyonu kullanarak derinlik bilgisini kodlayan teknolojide yatıyor. Bu yöntemle 3D bilgiler iki boyutlu görüntülere sıkıştırılabiliyor. Derinlik kodlu görüntüler geleneksel tek lens kamerayla yakalanıyor ve ardından hafif shadow ResNet sinir ağı tarafından işleniyor.
Araştırma ekibi, geliştirdikleri mimariyi MNIST veri setinde deneysel olarak doğruladıklarını bildiriyor. Bu yenilik, otonom sistemler, robotik manipülasyon, artırılmış gerçeklik ve akıllı gözetleme gibi gelecek teknolojileri için kritik öneme sahip.