Yapay zeka destekli eğitim araçları giderek yaygınlaşırken, bu sistemlerin değerlendirilme şekli önemli bir tartışma konusu haline geliyor. Yeni bir araştırma, mevcut testlerin sadece doğru-yanlış odaklı yaklaşımının yetersiz olduğunu ve etkili bir AI öğretmenin çok daha fazla beceriye sahip olması gerektiğini ortaya koyuyor.
Araştırmacılar tarafından geliştirilen pedagogik tanı çerçevesi, İngilizce standart testlerindeki problem çözme sürecini bilişsel bir yolculuk olarak modelliyor. Bu yaklaşımın ürünü olan ESTBook benchmark'ı, beş büyük sınavdan toplanan 10.576 soru ve 29 farklı görev türüyle kapsamlı bir değerlendirme imkânı sunuyor.
ESTBook'un en ayırt edici özelliği, geleneksel veri toplama yöntemlerinin ötesine geçmesi. Her soru, formalize edilmiş mantık yürütme yolları ve öğrencilerin düşebileceği bilişsel tuzakları yakalayan yanıltıcı seçenek açıklamalarıyla zenginleştiriliyor. Bu sayede yapay zeka sistemlerin sadece doğru cevabı bulması değil, öğrencilerin neden yanlış seçenekleri tercih edebileceğini anlaması da ölçülüyor.
Kapsamlı değerlendirmeler, bu tanı çerçevesinin pratik faydasını ampirik olarak kanıtlıyor. Sonuçlar, gelecekteki AI öğretmenlerin öğrencilerin düşünce süreçlerini anlayabilme ve öğrenme zorluklarını teşhis edebilme konusunda daha sofistike yeteneklere sahip olması gerektiğini gösteriyor.