Stanford Üniversitesi araştırmacıları, insan görüş sisteminin benzersiz özelliklerinden ilham alarak yeni bir yapay zeka arayüzü geliştirdi. FOVI (Foveated Vision Interface) adlı bu sistem, retina ve birincil görsel korteksin (V1) çalışma prensiplerini bilgisayarlı görüş modellerine adapte ediyor.
İnsan gözü, merkez bölgede yüksek çözünürlük sağlarken çevresel alanlarda düşük çözünürlük kullanarak etkili bir enerji dengesi kurur. Bu foveal görüş sistemi, göz hareketleriyle farklı alanları odak noktasına getirirken diğer bölgeleri bağlamsal bilgi olarak korur. Mevcut bilgisayarlı görüş sistemleri ise tüm görüntüyü uniform çözünürlükte işleyerek gereksiz hesaplama yükü oluşturuyor.
Yeni sistem, değişken çözünürlüklü retina benzeri sensör dizisini, V1 korteksine benzer uniform yoğunlukta bir sensör manifolduna dönüştürüyor. Araştırmacılar, k-en yakın komşu (kNN) algoritmasını kullanarak receptive field'ları tanımlayıp, yenilikçi kernel haritalama tekniğiyle kNN-konvolüsyon işlemini gerçekleştiriyor.
FOVI'nin iki temel kullanım alanı test edildi: uçtan uca kNN-konvolüsyonel mimari ve DINOv3 ViT foundation modelinin foveal adaptasyonu. Bu teknoloji, yüksek çözünürlüklü görüntülerin daha verimli işlenmesini sağlayarak yapay zeka sistemlerinin enerji tüketimini azaltıp performansını artırıyor.