Sosyal medya verilerinin analizi, şirketlerin müşteri geri bildirimlerini anlamalarında kritik öneme sahip. Ancak bu süreç pahalı etiketleme maliyetleri, veri kıtlığı ve gizlilik endişeleri nedeniyle zorluklarla dolu. Fransız araştırmacılar, bu sorunlara yenilikçi bir çözüm geliştirdi.
Araştırma ekibi, küçük bir başlangıç veri setinden hareketle 1,7 milyon sentetik tweet üreten bir sistem tasarladı. Geri çeviri tekniği kullanılarak geliştirilen bu yaklaşım, Fransızca toplu taşıma şikayetlerini tespit etmek için özel olarak eğitildi. 600 milyon parametreli model, İngilizce ve Fransızca mantıksal çıkarımlar yaparak müşteri memnuniyetsizliğini belirleme konusunda uzmanlaştı.
Sistemin en dikkat çekici özelliği, gerçek kullanıcı verilerine dokunmadan çalışması. Bu sayede hem gizlilik korunuyor hem de veri paylaşımı kolaylaşıyor. Modelin performansı, insan etiketleyicilerin değerlendirdiği test verilerinde %77-79 doğruluk oranına ulaştı.
Bu başarı, ticari yapay zeka sistemlerinin ve özel kodlayıcıların performansıyla eşdeğer veya daha iyi sonuçlar anlamına geliyor. Araştırma, özellikle çok dilli sosyal medya analizi alanında büyük potansiyel taşıyor ve şirketlerin müşteri geri bildirimlerini daha etkili şekilde değerlendirmelerine olanak sağlıyor.