Yapay Zeka Artık Çifte Gözle Görüyor: SENSE ile Gelişmiş Görüntü Anlama

20 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zekanın görüntülerdeki nesneleri daha doğru tanıması için stereo görüş kullanan yenilikçi bir sistem geliştirdi. SENSE adlı bu yöntem, tıpkı insan gözleri gibi iki farklı açıdan çekilen görüntüleri birlikte analiz ederek, nesnelerin konumlarını ve sınırlarını çok daha hassas şekilde belirleyebiliyor. Geleneksel yöntemler tek görüntü kullanırken, SENSE'in çift görüş yaklaşımı özellikle engellenmiş nesneler ve kenar bölgelerinde büyük avantaj sağlıyor. Sistem, önceden programlanmış kategorilerle sınırlı kalmayıp, doğal dille tanımlanan herhangi bir nesneyi tanıyabiliyor. Test sonuçları, mevcut en iyi yönteme kıyasla %0.76 daha yüksek doğruluk oranı gösteriyor. Bu gelişme, otonom araçlardan robotik uygulamalara kadar birçok alanda yapay zeka sistemlerinin çevre algısını önemli ölçüde iyileştirme potansiyeli taşıyor.

Stanford Üniversitesi araştırmacıları, yapay zekanın görsel algı yeteneklerinde çığır açan bir yöntem geliştirdi. SENSE (Stereo OpEN Vocabulary SEmantic Segmentation) adlı sistem, ilk kez stereo görüş teknolojisini açık kelime dağarcığı ile birleştirerek, makinelerin çevreyi anlama biçimini köklü şekilde değiştiriyor.

Geleneksel görüntü segmentasyon sistemleri, önceden tanımlanmış nesne kategorileriyle sınırlı kalıyor ve tek görüntü kullanarak çalışıyor. SENSE ise insan görme sistemine benzer şekilde, aynı sahnenin iki farklı açıdan çekilmiş görüntülerini eşzamanlı analiz ediyor. Bu yaklaşım, nesnelerin uzamsal konumları hakkında geometrik ipuçları sağlayarak, özellikle engellenmiş alanlar ve nesne kenarlarında çok daha hassas sonuçlar üretiyor.

Sistemin en önemli özelliği, doğal dille verilen herhangi bir tanımı anlayabilmesi. Önceden programlanmış kategoriler yerine, kullanıcılar 'mavi araba' ya da 'çiçekli vazo' gibi açıklamalarla nesneleri tanımlatabiliyor. PhraseStereo veri seti üzerinde yapılan testlerde, SENSE temel yönteme kıyasla %2.9, en iyi rakip sisteme göre %0.76 oranında daha yüksek doğruluk gösterdi.

Bu teknoloji, otonom araçların trafikteki nesneleri daha güvenli tanıması, robotların karmaşık ortamlarda navigasyon yapması ve artırılmış gerçeklik uygulamalarının daha gerçekçi etkileşimler sunması gibi alanlarda devrim yaratma potansiyeli taşıyor.

Etiketler

#yapay zeka #stereo görüş #görüntü işleme #makine öğrenmesi #bilgisayar görüşü

Özgün Kaynak

SENSE: Stereo OpEN Vocabulary SEmantic Segmentation

https://arxiv.org/abs/2604.15946

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.