Makine çeviri teknolojisi son yıllarda büyük ilerlemeler kaydetse de, deyimler ve kalıplaşmış ifadeler hâlâ bu sistemler için büyük bir meydan okuma oluşturuyor. Yeni bir araştırma, bu sorunu derinlemesine inceleyerek çarpıcı bulgular ortaya koydu.
Araştırmacılar, İngilizce'den çeşitli dillere yapılan çevirilerde üç özel ifade kategorisinin etkisini analiz etti: fiilsel deyimler (break the ice gibi), fiil-edat birleşimleri (give up, look after gibi) ve yardımcı fiil yapıları (make a decision gibi). Bu ifadelerin ortak özelliği, anlamlarının kelimelerinin birebir toplamından çıkarılamaması.
Hem özel çok kelimeli ifade veri setleri hem de standart makine çeviri veri setleri kullanılarak yapılan kapsamlı değerlendirmede, güncel en gelişmiş çeviri sistemlerinin bu ifadelerle nasıl başa çıktığı test edildi. Sonuçlar, bu özel ifadelerin çeviri kalitesini tutarlı bir şekilde düşürdüğünü gösterdi.
Daha da önemlisi, detaylı analizler bu kalite düşüşünün genel cümle zorluğundan değil, doğrudan bu çok kelimeli fiilsel ifadelerden kaynaklandığını ortaya koydu. Bu bulgu, makine çeviri sistemlerinin bu tür ifadeleri işlemek için özel stratejilere ihtiyaç duyduğunu gösteriyor.
Araştırmacılar, bulgularının yanı sıra geliştirdikleri kod ve değerlendirme çerçevesini de bilim camiasıyla paylaştı. Bu sayede yeni makine çeviri sistemlerinin bu konudaki performansları test edilebilecek.