Tayland'dan ses klonlama devrimi: İnsanı geçen yapay zeka modeli

Tayland'da geliştirilen JaiTTS-v1.0 adlı yapay zeka modeli, ses klonlama teknolojisinde çığır açıcı bir başarı elde etti. Model, kısa süreli konuşmalarda insan performansını aşarak %1.94 karakter hata oranına ulaştı. Bu başarı, insan konuşmacıların %1.98'lik hata oranından bile daha iyi. Özellikle Tayca ve İngilizce'nin karışık kullanıldığı gerçek hayat durumlarında bile doğal sonuçlar üretiyor. Ticari yazılımlarla yapılan karşılaştırmalarda 400 testin 283'ünde öne geçmeyi başardı. Bu gelişme, ses teknolojilerinde yeni bir dönemin habercisi olarak görülüyor.

Yapay zeka destekli ses teknolojilerinde önemli bir ilerleme kaydedildi. Tayland merkezli araştırmacılar tarafından geliştirilen JaiTTS-v1.0 modeli, ses klonlama alanında insan performansını geçmeyi başardı.

VoxCPM mimarisinden uyarlanan bu model, geleneksel yöntemlerden farklı olarak doğrudan sayısal ifadeleri ve Tayca-İngilizce karışık konuşmaları işleyebiliyor. Bu özellik, günlük hayatta sıkça karşılaşılan dil geçişlerini doğal bir şekilde ele alabiliyor.

Yapılan testlerde model, kısa süreli konuşmalarda %1.94 karakter hata oranı elde ederek, insan konuşmacıların %1.98'lik performansını geride bıraktı. Uzun süreli konuşmalarda ise insan düzeyinde başarı gösterdi.

İnsan değerlendirmeciler tarafından yapılan karşılaştırmalı testlerde, JaiTTS-v1.0 ticari ses teknolojilerinin önde gelen ürünleriyle yarıştırıldı. 400 ikili karşılaştırmanın 283'ünde üstün performans sergilerken, sadece 58'inde geride kaldı.

Bu başarı, özellikle çok dilli ortamlarda kullanılabilecek ses teknolojilerinin gelişiminde önemli bir adım olarak değerlendiriliyor.

Tayland'dan ses klonlama devrimi: İnsanı geçen yapay zeka modeli

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Sosyal medya seçim karşıtı reklamları oy verme davranışını etkiliyor

Çin'de 'Uzanıp Yatma' Akımı: Sosyal Direnişin Dilbilimsel Analizi

Adil Tasarlanan Eşleştirme Sistemleri Bile Eşitsiz Sonuçlar Üretebiliyor