Yapay Zeka Artık Çok Kültürlü Görsel Üretebiliyor

20 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, metinden görsel üreten yapay zeka modellerinin farklı kültürlerden öğeleri bir arada içeren görüntüler yaratma yeteneğini inceledi. 9 bin görüntüden oluşan yeni veri seti, beş ülke, üç yaş grubu, iki cinsiyet, 25 tarihi anıt ve beş dili kapsıyor. Çalışma, mevcut AI modellerinin tek kültürlü içeriklerde başarılı olmasına rağmen, çok kültürlü sahneler oluşturmada sınırlı kaldığını ortaya koydu. Araştırmacılar bu sorunu çözmek için MosAIG adlı çok ajanlı bir framework geliştirdi. Bu sistem, farklı kültürel kimlikler taşıyan dil modelleri kullanarak daha zengin ve kapsayıcı görseller üretmeyi hedefliyor. Çalışma, AI'ın kültürel çeşitliliği anlama ve yansıtma konusunda önemli bir adım teşkil ediyor.

Yapay zeka alanında önemli bir gelişme kaydedildi. Araştırmacılar, metinden görsel üreten AI modellerinin çok kültürlü sahneler yaratma yeteneğini sistematik olarak incelemek için yeni bir metodoloji geliştirdi.

Çalışma kapsamında oluşturulan kapsamlı veri seti, 9 bin görüntü içeriyor ve beş farklı ülkeden öğeler, üç yaş grubundan karakterler, iki cinsiyet, 25 tarihi anıt ve beş dil barındırıyor. Bu çeşitlilik, AI modellerinin farklı kültürel unsurları ne kadar başarılı bir şekilde bir araya getirebildiğini değerlendirmeye olanak tanıyor.

Araştırma sonuçları, günümüzün en gelişmiş metin-to-görsel AI modellerinin tek kültürlü içeriklerde yüksek performans gösterdiğini, ancak farklı kültürlerden öğeleri harmanlama konusunda zorlandığını ortaya koydu. Modeller, görsel uyum, görüntü kalitesi, estetik, bilgi doğruluğu ve adalet kriterleri açısından değerlendirildi.

Bu sorunu çözmek için araştırmacılar MosAIG (Multi-Agent framework for multicultural Image Generation) sistemini geliştirdi. Bu yenilikçi yaklaşım, farklı kültürel kimlikler taşıyan büyük dil modellerini kullanarak daha zengin ve kapsayıcı prompt'lar oluşturuyor.

Çalışma, AI teknolojilerinin kültürel çeşitliliği daha iyi anlayabilmesi ve yansıtabilmesi açısından önemli bir kilometre taşı niteliği taşıyor.

Etiketler

#yapay zeka #görsel üretimi #çok kültürlülük #metin-to-görsel #AI modelleri

Özgün Kaynak

When Cultures Meet: Multicultural Text-to-Image Generation

https://arxiv.org/abs/2502.15972

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.