Yapay zeka ve bilgisayarlı görü alanında önemli bir gelişme yaşanırken, araştırmacılar otonom robotlar ve artırılmış gerçeklik sistemleri için kritik olan derinlik algısı problemine yeni bir çözüm getirdi. MODEST (Multi-Optics Depth-of-Field Stereo Dataset) adlı bu yeni veri seti, yapay zeka modellerinin gerçek dünya koşullarında daha başarılı performans göstermesini hedefliyor.
Veri seti, 5472x3648 piksel çözünürlüğünde toplam 18 bin stereo görüntü içeriyor. Bu görüntüler, iki özdeş profesyonel DSLR kamera düzeneği kullanılarak sistematik olarak çekildi. Araştırmacılar, 28-70mm arasında 10 farklı odak uzaklığı ve f/2.8 ile f/22 arasında 5 farklı diyafram değeri kullanarak toplam 50 farklı optik konfigürasyon oluşturdu.
Çalışmada 9 farklı sahne kullanılarak, değişen karmaşıklık seviyeleri, aydınlatma koşulları ve arka plan düzenlemeleri test edildi. Bu çeşitlilik, yapay zeka modellerinin gerçek dünya senaryolarına daha iyi uyum sağlamasını mümkün kılıyor.
Mevcut araştırmalarda, sentetik veri setleriyle eğitilen modellerin gerçek dünya uygulamalarında performans kaybı yaşadığı gözlemlenmişti. MODEST veri seti, bu soruna profesyonel kamera sistemlerinin optik gerçekçiliğini ve karmaşıklığını yakalayan gerçek görüntüler sunarak çözüm getiriyor. Bu gelişme, otonom araçlar ve artırılmış gerçeklik uygulamaları için daha güvenilir derinlik algısı sistemlerinin geliştirilmesine katkı sağlayacak.