Teknoloji & Yapay Zeka

Yapay zeka artık eksik ses verisiyle bile duyguları okuyabiliyor

Araştırmacılar, ses, görsel ve metin verilerini birlikte kullanarak duygu analizi yapan yapay zeka sistemlerinin önemli bir sorununu çözdü. Mevcut sistemler genellikle tüm veri türlerinin eksiksiz olmasına ihtiyaç duyuyor, ancak gerçek hayatta ses kaydı olmayabilir veya bozulmuş olabilir. Yeni geliştirilen sistem, eksik ses verilerini diğer modalitelerden öğrendiği bilgilerle yeniden oluşturabiliyor. Çapraz modalite dikkat mekanizması sayesinde, hem gözlemlenen hem de yeniden yapılandırılan verilerden maksimum bilgiyi çıkararak duygu tespiti yapıyor. Üç farklı veri seti üzerinde yapılan testler, bu yöntemin mevcut yaklaşımlardan önemli ölçüde daha başarılı olduğunu ve tüm veri türlerinin mevcut olduğu durumlarla karşılaştırılabilir sonuçlar verdiğini gösteriyor.

Yapay zeka alanında duygu analizi, insanların yüz ifadeleri, ses tonu ve kullandıkları kelimeler gibi farklı ipuçlarından duygusal durumlarını anlama üzerine odaklanıyor. Ancak bu sistemlerin karşılaştığı en büyük zorluklardan biri, bazen bu veri türlerinden birinin eksik olması durumu.

Araştırmacılar, bu sorunu çözmek için yenilikçi bir bilgi transferi ağı geliştirdi. Bu sistem, eksik ses verilerini görsel ve metin bilgilerinden yararlanarak yeniden oluşturabiliyor. Örneğin, bir video kaydında ses kalitesi bozuksa veya hiç ses yoksa, sistem kişinin yüz ifadelerinden ve konuşma şeklinden ses özelliklerini tahmin edebiliyor.

Sistemin en dikkat çekici özelliği, çapraz modalite dikkat mekanizması. Bu teknoloji, hem gerçek verilerden hem de yapay olarak üretilen verilerden en fazla bilgiyi çıkararak duygu tespitinde kullanıyor. Böylece sistem, eksik veri olsa bile yüksek doğrulukla çalışabiliyor.

Üç farklı halka açık veri seti üzerinde yapılan kapsamlı testler, bu yaklaşımın mevcut yöntemlerden önemli ölçüde daha iyi performans gösterdiğini ortaya koydu. En önemlisi, sistem tüm veri türlerinin eksiksiz olduğu durumlarla neredeyse aynı başarı oranına ulaştı.

Özgün Kaynak
arXiv (CS + AI)
Multimodal Sentiment Analysis with Missing Modality: A Knowledge-Transfer Approach
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.