Yapay Zeka Sohbet Botlarının Kaynak Kullanım Kalitesi Araştırıldı

Bilim insanları, ChatGPT gibi yapay zeka sohbet sistemlerinin verdikleri cevaplarda kullandıkları kaynakları inceleyerek önemli farklılıklar keşfetti. Dokuz farklı AI sisteminden toplanan 1517 kaynağın analiz edildiği araştırmada, ChatGPT'nin yanıt başına ortalama 9,5 kaynak gösterdiği ve kalite puanının 15,48/20 olduğu belirlendi. Buna karşılık Hunyuan-TurboS sistemi sadece 4 kaynak gösterip 11,65/20 kalite puanı aldı. Kullanıcı çalışması ise insanların bu kaynakları nadiren incelediğini ortaya koydu. Bu bulgular, AI sistemlerinin güvenilirliği için kaynak kalitesinin kritik önemini vurguluyor.

Yapay zeka destekli sohbet sistemlerinin bilgi arama ve soru-cevap alanında yaygınlaşmasıyla birlikte, bu sistemlerin verdikleri cevapların güvenilirliği de kritik hale geldi. Yeni bir araştırma, popüler AI sohbet botlarının kaynak kullanım kalitesini sistematik olarak inceleyerek dikkat çekici sonuçlar ortaya koydu.

Araştırmacılar, dokuz farklı yapay zeka sisteminden 30 soru-cevap çiftinde toplam 1517 kaynağı analiz etti. İnceleme, kaynakların kullanıcı arayüzündeki sunumu ve CRAAP kriterlerine göre kalite değerlendirmesini kapsıyordu. CRAAP kriterleri, kaynakların güncellik, uygunluk, yetki, doğruluk ve amaç açısından değerlendirilmesini sağlayan akademik bir standart.

Bulgular, sistemler arasında kaynak sayısı ve kalitesinde belirgin farklılıklar olduğunu gösterdi. ChatGPT, yanıt başına ortalama 9,5 kaynak sunarak en yüksek kalite puanını (20 üzerinden 15,48) alırken, Hunyuan-TurboS sistemi sadece 4 kaynak göstererek 11,65 kalite puanıyla geride kaldı.

Araştırmanın kullanıcı davranışı bölümü de ilginç sonuçlar verdi. Ön çalışma, insanların AI sistemlerinin sunduğu kaynaklarla nadiren etkileşime geçtiğini ve davranışlarının sistemlere göre değiştiğini ortaya koydu. Bu durum, AI sistemlerinin kaynak sunma yöntemlerinin iyileştirilmesi gerektiğini vurguluyor.