Yapay zeka araştırmacıları, AI sistemlerinin insanları anlama kapasitesini test etmek için tamamen yeni bir yaklaşım geliştirdi. KnowMe-Bench adı verilen bu test sistemi, kısa diyaloglar yerine detaylı yaşam hikayelerini kullanarak daha derinlemesine bir değerlendirme yapıyor.
Geleneksel testler genellikle yapay senaryolar veya kısa konuşmalar kullanırken, bu yeni sistem gerçek otobiyografik anlatımlardan yararlanıyor. Bu hikayeler, kişilerin eylemlerini, düşüncelerini ve motivasyonlarını anlamak için zengin bir veri kaynağı sunuyor.
Test üç farklı seviyede değerlendirme yapıyor: basit bilgi hatırlama, kişinin o andaki duygusal durumunu anlama ve en zorlusu da kişinin temel karar verme ilkelerini çıkarma. Araştırma sonuçları, mevcut AI sistemlerinin temel bilgileri hatırlamada oldukça başarılı olduğunu gösteriyor.
Ancak sistem, zamanla ilgili açıklamalar yapma ve kişinin davranış kalıplarını anlama konularında yetersiz kalıyor. Bu durum, sadece bilgi arama tabanlı sistemlerin ötesinde, daha sofistike hafıza mekanizmalarına ihtiyaç olduğunu ortaya koyuyor.
Bu çalışma, gelecekte insanlarla uzun süreli etkileşim kuracak dijital asistanların geliştirilmesi için kritik öneme sahip.