Yapay zeka alanında görsel-dil modelleri (VLM) sağlıktan işe alım süreçlerine kadar pek çok kritik alanda kullanılırken, bu sistemlerin demografik önyargı problemleri bilim insanlarının dikkatini çekiyor. Yeni bir araştırma, bu önyargıları daha hassas şekilde ölçebilecek innovatif bir test yöntemi sunuyor.

Araştırmacılar, gerçek fotoğraflardan hareketle sadece ırk ve cinsiyet ile ilgili yüz özelliklerini değiştiren, diğer görsel faktörleri sabit tutan bir değerlendirme paradigması geliştirdi. Bu yaklaşım, geleneksel yöntemlerdeki temel sorunu çözüyor: gerçek dünya görsellerinde ırk ve cinsiyet bilgilerinin arka plan, giyim gibi faktörlerle karışması.

Çalışma kapsamında FOCUS adlı özel bir veri seti oluşturuldu. Bu set, altı farklı meslek ve on demografik grup için 480 adet karşılaştırmalı görsel içeriyor. Araştırmacılar ayrıca REFLECT isimli bir değerlendirme standardı da geliştirerek, AI modellerinin karar verme süreçlerini üç farklı görev üzerinden test edebilecek bir sistem kurdu.

Bu yöntem, AI sistemlerinin demografik önyargılarını daha net şekilde tespit etmeyi mümkün kılıyor. Çalışma, yapay zeka teknolojilerinin toplumsal uygulamalarda daha adil ve güvenilir hale getirilmesi açısından önemli bir adım olarak değerlendiriliyor.