Teknoloji & Yapay Zeka

Yapay Zeka Artık Gürültülü Verilerle de Yeni Nesneleri Tanıyabiliyor

Araştırmacılar, yapay zekanın hiç görmediği nesneleri tanıyabilme yeteneğini geliştiren yeni bir sistem tasarladı. Sıfırdan öğrenme (zero-shot learning) olarak bilinen bu teknoloji, genellikle temiz ve düzenli verilerle çalışırken, gerçek dünyada karşılaşılan gürültülü ve belirsiz etiketlerle zorlanıyor. Yeni geliştirilen DVSA sistemi, görsel ve anlamsal bilgileri dinamik olarak hizalayarak bu sorunu çözüyor. Sistem, dikkat mekanizması kullanan çift yönlü hizalama modülü ve karşıtsal öğrenme teknikleriyle çalışıyor. Ayrıca, yanlış etiketleri iteratif olarak düzelten dinamik bir mekanizma sayesinde anlamsal tutarlılığı korurken performansını artırıyor.

Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar makinelerin daha önce hiç görmedikleri nesneleri tanıyabilme yeteneğini güçlendiren yeni bir sistem geliştirdi. Sıfırdan öğrenme (zero-shot learning) olarak adlandırılan bu teknoloji, genellikle mükemmel şekilde etiketlenmiş verilerle çalışırken, gerçek dünyada karşılaşılan karmaşık ve belirsiz durumlarla başa çıkmakta zorlanıyordu.

Dynamic Visual-semantic Alignment (DVSA) adı verilen yeni sistem, bu sorunu çözmek için üç temel bileşen kullanıyor. İlk olarak, görsel özellikler ile anlam prototipleri arasında çift yönlü bir hizalama modülü dikkat mekanizması ile karşılıklı kalibrasyonu sağlıyor. İkinci olarak, öznitelik düzeyinde Karşılıklı Bilgi (MI) temelli karşıtsal optimizasyon sayesinde ayırıcı ve anlamsal olarak tutarlı özellikleri güçlendiriyor.

En önemli yenilik ise sistemin dinamik etiket belirsizliği giderme mekanizması. Bu özellik, gürültülü gözetimi tekrarlı bir şekilde düzeltirken anlamsal tutarlılığı koruyor ve örnek-etiket arasındaki boşluğu daraltarak genelleme kabiliyetini artırıyor.

Standart test platformlarında yapılan kapsamlı deneyler, DVSA'nın belirsiz etiketler altında çok daha güçlü performans sergilediğini doğruluyor. Bu gelişme, yapay zekanın gerçek dünya verilerini daha etkili işleyebilmesine önemli katkı sağlıyor.

Özgün Kaynak
arXiv (CS + AI)
Dynamic Visual-semantic Alignment for Zero-shot Learning with Ambiguous Labels
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.