Teknoloji & Yapay Zeka

Yapay zeka dillerin sesletimini başka dillerden öğrenerek daha iyi tanıyor

Araştırmacılar, bilgisayarların konuşma seslerini yazıya dökme yeteneğini geliştiren yeni bir yöntem keşfetti. 'Seçici Artırma' adı verilen bu teknik, bir dilin fonetik özelliklerini başka bir dilden öğrenerek geliştiriyor. Örneğin Hintçe'den alınan bilgilerle, sistem Almanca'daki ünsüzlerin sesletim özelliklerini %17,6 daha doğru tanıyabildi. Bu gelişme, dil teknolojilerinin evrensel ses tanıma sistemlerinde önemli bir ilerleme anlamına geliyor ve farklı dillerin fonetik yapılarının birbirinden nasıl öğrenebileceğini gösteriyor.

Bilim insanları, yapay zekanın konuşma seslerini tanıma becerisini geliştirmek için diller arası bilgi transferi kullanan yenilikçi bir yöntem geliştirdi. 'Seçici Artırma' olarak adlandırılan bu teknik, bir dilin fonetik özelliklerini başka dillerden öğrenerek ses tanıma sistemlerinin performansını artırıyor.

Evrensel otomatik fonetik transkripsiyon sistemleri, farklı dillerdeki konuşmaları yazılı metne dönüştürmek için temiz ve çeşitli eğitim verilerine ihtiyaç duyuyor. Ancak bu kalitede veri bulmak oldukça zor. Araştırmacılar, mevcut verileri başka dillerden seçici olarak bilgi aktararak zenginleştirmenin mümkün olduğunu kanıtladı.

MultIPA modeli üzerinde yapılan deneylerde, Hintçe'den alınan bilgiler kullanılarak Almanca'daki ünsüz seslerin tanınması geliştirildi. Sistem, ünsüzlerin sesli-sessiz ayrımını %17,6 daha doğru yapmaya başladı ve hatalı pozitif sonuçları önemli ölçüde azalttı.

Araştırmanın en çarpıcı sonucu, sistemin Almanca'daki /p, t, k/ seslerinin nefesli telaffuz özelliklerini tanımaya başlaması oldu. Başlangıçta bu seslerin %0'ını nefesli olarak transkript eden sistem, yeni yöntemle bu özelliği başarıyla tespit edebilir hale geldi.

Bu gelişme, farklı dillerin fonetik yapılarının birbirinden öğrenilebileceğini ve dil teknolojilerinin evrensel uygulamalarında önemli ilerlemeler sağlayabileceğini gösteriyor.

Özgün Kaynak
arXiv — Hesaplamalı Dilbilim (cs.CL)
Selective Augmentation: Improving Universal Automatic Phonetic Transcription via G2P Bootstrapping
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.