Eğitim teknolojilerinde önemli bir adım atılırken, ses tanıma sistemlerinin en zayıf noktalarından biri olan özel isim ve terim tanıma sorunu için çözüm geliştirildi. MIT araştırmacılarının ortaya koyduğu yeni yaklaşım, sınıf ortamında geçen konuşmalardaki kişi isimleri ve teknik terimleri çok daha doğru şekilde tanıyor.
Günümüz ses tanıma teknolojileri günlük konuşmalarda oldukça başarılı performans sergilerken, özel isimler ve alan-specific terimler söz konusu olduğunda performansları belirgin şekilde düşüyor. Bu durum özellikle eğitim ortamlarında ciddi sorunlara yol açıyor çünkü bu kelimeler genellikle dersin en kritik noktalarını oluşturuyor.
Araştırmacıların geliştirdiği sistem, büyük dil modellerinin geniş bilgi birikimine sahip olma özelliğini akıllıca kullanıyor. Sistem sadece modelin sahip olduğu dünya bilgisinden yararlanmakla kalmıyor, aynı zamanda konuşmadaki fonetik ipuçlarını ve anlamsal bağlamı da analiz ederek hataları tespit edip düzeltiyor.
MIT OpenCourseWare derslerinden derlenen 45 saatlik ses verisi üzerinde yapılan testlerde sistem, özel isim ve terimlerdeki hata oranını yüzde 30 oranında azaltmayı başardı. Bu gelişme, otomatik ders transkripsionu, eğitim içeriği arama sistemleri ve erişilebilirlik teknolojileri için önemli iyileştirmeler vaat ediyor.