Yapay zeka modellerinin kendilerini ne kadar iyi tanıdıkları sorusu, teknoloji dünyasının en önemli araştırma alanlarından biri haline geldi. Yeni bir çalışma, bu konuya bilimsel bir yaklaşım getirerek yapay zekanın 'öz-farkındalığını' ölçen kapsamlı bir test sistemi geliştirdi.
Araştırmacılar, insan psikolojisinde kullanılan üst-bilişsel değerlendirme yöntemlerini yapay zeka alanına uyarladı. Geliştirdikleri test bataryası, öğrenme, sosyal biliş, dikkat, yönetici işlevler gibi altı farklı bilişsel alanda toplam 524 soru içeriyor.
Test sisteminin en özgün yanı, her sorudan sonra modellere iki kritik soru sorulması: 'Bu cevabınızı korumak mı, geri çekmek mi istiyorsunuz?' ve 'Bu cevabınıza bahse girer misiniz?' Bu yaklaşım, modellerin kendi performansları hakkındaki güven seviyelerini objektif olarak ölçmeyi mümkün kılıyor.
20 farklı gelişmiş yapay zeka modelinde yapılan 10.480 değerlendirme, çarpıcı sonuçlar ortaya koydu. Modeller arasında kendi doğru ve yanlış cevaplarını ayırt etme konusunda büyük farklılıklar bulundu. Bu 'geri çekme farkı' adı verilen metrik, hangi modellerin kendi sınırlarını daha iyi tanıdığını gösteriyor.
Bu araştırma, yapay zeka güvenliği açısından büyük önem taşıyor. Kendi hatalarını fark edebilen modeller, yanlış bilgi yayma riskini azaltabilir ve daha güvenilir yapay zeka sistemleri geliştirilmesine katkıda bulunabilir.