Günümüzün gelişmiş yapay zeka modelleri, gerçeğe yakın görüntüler üretmekte oldukça başarılı. Ancak yeni bir araştırma, bu modellerin deyimsel ifadelerin soyut anlamlarını kavramada ciddi eksiklikleri olduğunu ortaya koyuyor.
Araştırmacılar, DIVA adlı özel bir test sistemi geliştirerek bu sorunu inceledi. Bu sistem, yüksek görsel ayrıntılar yerine şematik simgeler kullanarak, kelime birleşimlerinin hem somut hem de deyimsel anlamlarını görselleştiriyor. Örneğin 'beyaz fil' ifadesinin hem gerçek hayvan hem de 'gereksiz yük' anlamlarını test ediyor.
Sekiz farklı görsel-dil modeli üzerinde yapılan testlerde çarpıcı bir sonuç ortaya çıktı: Tüm modeller 'Literal Üstünlük Önyargısı' sergiliyor. Bu, modellerin sürekli olarak somut, yüzeysel anlamları tercih ettiği anlamına geliyor.
Araştırmanın en ilginç bulgusu, model boyutunun artması ya da görsel kalitesinin iyileştirilmesinin bu sorunu çözmediği. Hatta yüksek görsel ayrıntının, soyut düşünmeyi engelleyebileceği öne sürülüyor.
Bu keşif, yapay zekanın gerçek dil anlayışına ulaşması için yeni yaklaşımlara ihtiyaç olduğunu gösteriyor. Araştırmacılar, gelecekteki modellerin sadece görsel kaliteyi değil, soyut anlam kavrama yetisini de geliştirmesi gerektiğini vurguluyor.