Küresel iletişimde insanlar sıklıkla birden fazla dili karıştırarak konuşur ve yazar. Ancak yeni bir bilimsel çalışma, bu doğal dil karıştırma davranışının modern bilgi arama sistemlerini ciddi anlamda zorladığını ortaya koydu.
Araştırmacılar, karma dil kullanımının arama teknolojisindeki etkilerini kapsamlı şekilde incelemek için CSR-L adlı özel bir veri seti geliştirdi. Bu veri setinde, insanların doğal olarak karıştırdığı dillerdeki sorguları içeren gerçek örnekler yer alıyor.
Çalışmanın en çarpıcı bulgusu, karma dil kullanımının en gelişmiş çok dilli modellerde bile performans düşüşüne yol açması oldu. Araştırmacılar, bu sorunun temelinde, saf tek dilli metinlerle karma dilli metinlerin arama sistemlerinin hafızasında farklı şekillerde konumlanması olduğunu tespit etti.
Araştırma ekibi, bulgularını doğrulamak için CS-MTEB adlı daha geniş bir test paketi de hazırladı. Bu kapsamlı değerlendirmede, karma dil kullanımının arama performansında yüzde 27'ye varan düşüşlere yol açabildiği gözlemlendi.
Bu sonuçlar, günümüz teknolojisinin küresel kullanıcıların gerçek dil davranışlarını yansıtmakta ne kadar yetersiz kaldığını gösteriyor ve gelecekteki arama teknolojilerinin bu gerçekliği dikkate alması gerektiğine işaret ediyor.