Peru'da yapılan yeni bir araştırma, yapay zeka destekli ses sentezi teknolojisini kullanarak Quechua ve İspanyolca dillerinde yüksek kaliteli konuşma üretimi gerçekleştirmeyi başardı. Araştırmacılar, Peru Anayasası'nın her iki dilde de doğal bir şekilde seslendirilmesini sağlayan kapsamlı bir sistem geliştirdi.
Çalışmada XTTS v2, F5-TTS ve DiFlow-TTS olmak üzere üç farklı metin-konuşma mimarisi kullanıldı. Bu modeller, farklı boyutlarda ve kayıt koşullarında toplanan İspanyolca ve Quechua ses veri setleri üzerinde eğitildi. Özellikle Quechua dili için veri kıtlığı sorunu, İspanyolcadan çapraz dil aktarımı yöntemiyle çözüldü.
Araştırmanın en dikkat çekici yanı, düşük kaynaklı bir dil olan Quechua için teknolojik çözümler üretmesi. Bu yaklaşım, İspanyolcadaki doğallığı korurken Quechua seslendirilmesinin kalitesini artırıyor. Sistem, iki dilli ve çok dilli metin-konuşma yeteneklerinden faydalanarak her iki dilde de başarılı sonuçlar veriyor.
Proje ekibi, geliştirilen modelleri, çıkarım kodlarını ve anayasanın her maddesi için sentezlenmiş ses dosyalarını açık kaynak olarak paylaştı. Bu yaklaşım, benzer dil toplulukları ve araştırmacılar için değerli bir kaynak oluşturuyor. Çalışma, yerli dillerde konuşma teknolojilerinin geliştirilmesi ve hukuki içeriğin erişilebilirliğinin artırılması açısından önemli bir katkı sunuyor.