Yapay zeka destekli arama sistemlerinde kullanılan yoğun arama motorları, beklenmedik önyargılar sergileyerek sistem performansını olumsuz etkiliyor. RAG sistemlerinde yaygın kullanılan bu motorlar, kısa metinleri tercih etme, konum odaklı arama yapma ve tekrarları önceleme gibi sistematik sapmalara sahip.

Yeni araştırma, sorgu geliştirme tekniklerinin bu önyargıları nasıl etkilediğini kapsamlı olarak inceledi. Beş farklı yöntem ve altı arama motoru üzerinde yapılan testlerde, basit dil modeli tabanlı sorgu yeniden yazma tekniğinin en etkili sonuçları verdiği görüldü. Bu yöntem, toplamda önyargıları %54 oranında azaltmayı başardı.

Araştırmacılar, önyargı azaltmanın iki farklı mekanizma ile gerçekleştiğini keşfetti. Basit yeniden yazma yöntemi, skor varyansını artırarak önyargıyı azaltırken, sahte belge üretimi yöntemleri önyargı yaratan özelliklerden gerçek bir ayrışma sağlıyor.

Ancak hiçbir teknik tüm önyargıları eşit şekilde ele alamıyor. Özellikle birden fazla önyargının bir araya geldiği karmaşık durumlarda, mevcut yöntemlerin sınırları ortaya çıkıyor. Bu bulgular, RAG sistemlerinin geliştirilmesi için yeni stratejilerin gerekliliğini vurguluyor.