Yapay zeka teknolojisinin günlük yaşamımızdaki rolü arttıkça, bu sistemlerin sosyal ilişkileri anlama kapasitesi kritik bir önem kazanıyor. Yeni bir araştırma, mevcut büyük dil modellerinin bu alandaki yetersizliklerini gözler önüne seriyor.
Araştırmacılar, yapay zeka modellerinin sosyal akıl yürütme yeteneklerini değerlendirmek için SCRIPTS adlı özel bir veri seti oluşturdular. Film senaryolarından derlenmiş 1100 diyaloğu içeren bu veri seti, İngilizce ve Korece olmak üzere iki dilde hazırlandı. Modellerin görevi, diyaloglardaki konuşmacılar arasındaki sosyal ilişkileri - arkadaşlık, romantik ilişki, aile bağları gibi - doğru şekilde tespit etmekti.
Dokuz farklı model üzerinde yapılan testlerin sonuçları düşündürücü: İngilizce diyaloglarda başarı oranı %75-80 seviyesinde kalırken, Korece'de bu oran %58-69'a düştü. Daha da çarpıcı olanı, modellerin %10-25 oranında 'olası olmayan' ilişki tahminleri yapması oldu.
Araştırmanın dikkat çeken bulguları arasında, düşünce zinciri gibi gelişmiş yöntemlerin sosyal akıl yürütmede beklenen katkıyı sağlamaması yer alıyor. Hatta bazı durumlarda bu yaklaşımların sosyal önyargıları artırdığı gözlemlendi.
Bu sonuçlar, yapay zeka sistemlerinin insan etkileşimlerindeki incelikleri anlama konusunda hâlâ önemli sınırlarının bulunduğunu gösteriyor.