Yapay zeka ile etkileşimimizde nezaketin gerçekten fark yaratıp yaratmadığı sorusunu yanıtlayan yeni bir araştırma, büyük dil modellerinin insan gibi nezaket beklentilerine sahip olduğunu gösterdi.
Araştırma ekibi, Gemini-Pro, GPT-4o Mini, Claude 3.7 Sonnet, DeepSeek-Chat ve Llama 3 modellerini test ederek kullanıcı tonunun AI performansı üzerindeki etkilerini inceledi. Üç farklı dilde gerçekleştirilen kapsamlı deneylerde, 22.500 farklı etkileşim analiz edildi.
Sonuçlar oldukça çarpıcı: nazik bir üslupla yazılan promptlar, AI modellerinin yanıt kalitesini ortalama %11 oranında artırdı. Bunun tersine, kaba ve saygısız bir ton kullanılması performansta düşüşe neden oldu. Araştırmacılar yanıtları tutarlılık, netlik, derinlik, duyarlılık, bağlam korunması, toksiklik, özlülük ve okunabilirlik gibi sekiz farklı kritere göre değerlendirdi.
Özellikle dikkat çeken bulgu, farklı dillerin farklı nezaket tepkileri göstermesi oldu. Bu durum, AI modellerinin kültürel nezaket normlarını öğrendiğini ve buna göre davrandığını işaret ediyor. Geçmiş etkileşim tarihinin de model davranışlarını şekillendirdiği gözlemlendi.