Yapay zeka teknolojisinin yaygınlaşmasıyla birlikte, büyük dil modelleri çocuk hikayeleri dahil çeşitli anlatı içerikleri üretmek için kullanılıyor. Ancak bu alandaki güvenlik ve adalet değerlendirmeleri çoğunlukla İngilizce odaklı kalıyor.
Araştırmacılar bu eksikliği gidermek için BiasedTales-ML adlı kapsamlı bir veri seti geliştirdi. Proje kapsamında, tipik olarak ve kültürel açıdan birbirinden farklı sekiz dilde yaklaşık 350 bin çocuk hikayesi üretildi. Araştırmada tam permütasyon istekleme tasarımı kullanılarak, yapay zekanın farklı sosyal koşullarda nasıl hikayeler yarattığı incelendi.
Çalışmanın en çarpıcı bulgusu, yapay zeka modellerinin diller arası davranışlarında önemli farklılıklar göstermesi oldu. İngilizce'de gözlenen anlatı dağılımları ve kalıpları, diğer dillerde aynı şekilde tekrarlanmıyor. Bu durum, yapay zekanın her dilde kendine özgü önyargılar ve anlatı tercihleri geliştirdiğini gösteriyor.
Araştırmacılar, hikaye üretim sürecini analiz etmek için yapılandırılmış bir üretici-çıkarıcı boru hattı ve çok boyutlu dağıtım analizi çerçevesi önerdi. Bu yöntemle anlatı özelliklerinin diller, modeller ve sosyal koşullar arasında nasıl değiştiği sistematik olarak incelendi.
Bulgular, yapay zeka güvenliği alanında çok dilli yaklaşımların gerekliliğini vurguluyor ve gelecekteki değerlendirmelerin daha geniş bir dil yelpazesini kapsaması gerektiğini ortaya koyuyor.