Yapay Zeka Sosyal İlişkileri Anlama Konusunda Yetersiz Kalıyor

Araştırmacılar, büyük dil modellerinin (LLM) sosyal ilişkileri anlama yetisini test etmek için SCRIPTS adlı yeni bir veri seti geliştirdiler. Film senaryolarından alınan 1100 diyaloğu içeren bu veri setiyle yapılan testlerde, yapay zeka modellerinin konuşmacılar arasındaki ilişkileri (arkadaş, sevgili, aile vb.) tespit etme başarısı İngilizce için %75-80, Korece için ise sadece %58-69 seviyesinde kaldı. Özellikle düşünce zinciri yönteminin sosyal akıl yürütmede beklenen faydayı sağlamadığı, hatta bazen sosyal önyargıları artırdığı gözlemlendi. Bu bulgular, yapay zekanın insan etkileşimlerinde kritik olan sosyal anlayış konusundaki sınırlarını ortaya koyuyor.

Yapay zeka teknolojisinin günlük yaşamımızdaki rolü arttıkça, bu sistemlerin sosyal ilişkileri anlama kapasitesi kritik bir önem kazanıyor. Yeni bir araştırma, mevcut büyük dil modellerinin bu alandaki yetersizliklerini gözler önüne seriyor.

Araştırmacılar, yapay zeka modellerinin sosyal akıl yürütme yeteneklerini değerlendirmek için SCRIPTS adlı özel bir veri seti oluşturdular. Film senaryolarından derlenmiş 1100 diyaloğu içeren bu veri seti, İngilizce ve Korece olmak üzere iki dilde hazırlandı. Modellerin görevi, diyaloglardaki konuşmacılar arasındaki sosyal ilişkileri - arkadaşlık, romantik ilişki, aile bağları gibi - doğru şekilde tespit etmekti.

Dokuz farklı model üzerinde yapılan testlerin sonuçları düşündürücü: İngilizce diyaloglarda başarı oranı %75-80 seviyesinde kalırken, Korece'de bu oran %58-69'a düştü. Daha da çarpıcı olanı, modellerin %10-25 oranında 'olası olmayan' ilişki tahminleri yapması oldu.

Araştırmanın dikkat çeken bulguları arasında, düşünce zinciri gibi gelişmiş yöntemlerin sosyal akıl yürütmede beklenen katkıyı sağlamaması yer alıyor. Hatta bazı durumlarda bu yaklaşımların sosyal önyargıları artırdığı gözlemlendi.

Bu sonuçlar, yapay zeka sistemlerinin insan etkileşimlerindeki incelikleri anlama konusunda hâlâ önemli sınırlarının bulunduğunu gösteriyor.