Yapay zeka alanında önemli bir gelişme kaydedildi. Araştırmacılar, metinden görsel üreten AI modellerinin çok kültürlü sahneler yaratma yeteneğini sistematik olarak incelemek için yeni bir metodoloji geliştirdi.

Çalışma kapsamında oluşturulan kapsamlı veri seti, 9 bin görüntü içeriyor ve beş farklı ülkeden öğeler, üç yaş grubundan karakterler, iki cinsiyet, 25 tarihi anıt ve beş dil barındırıyor. Bu çeşitlilik, AI modellerinin farklı kültürel unsurları ne kadar başarılı bir şekilde bir araya getirebildiğini değerlendirmeye olanak tanıyor.

Araştırma sonuçları, günümüzün en gelişmiş metin-to-görsel AI modellerinin tek kültürlü içeriklerde yüksek performans gösterdiğini, ancak farklı kültürlerden öğeleri harmanlama konusunda zorlandığını ortaya koydu. Modeller, görsel uyum, görüntü kalitesi, estetik, bilgi doğruluğu ve adalet kriterleri açısından değerlendirildi.

Bu sorunu çözmek için araştırmacılar MosAIG (Multi-Agent framework for multicultural Image Generation) sistemini geliştirdi. Bu yenilikçi yaklaşım, farklı kültürel kimlikler taşıyan büyük dil modellerini kullanarak daha zengin ve kapsayıcı prompt'lar oluşturuyor.

Çalışma, AI teknolojilerinin kültürel çeşitliliği daha iyi anlayabilmesi ve yansıtabilmesi açısından önemli bir kilometre taşı niteliği taşıyor.