Yapay zeka destekli öneri sistemlerinde köklü bir yaklaşımı sorgulatan araştırma sonuçları yayınlandı. arXiv'de yayımlanan çalışma, Multi-Armed Bandit (MAB) algoritmalarının offline değerlendirmesinde önemli bir önyargının varlığını ortaya koyuyor.
MAB algoritmaları, Netflix'ten Spotify'a kadar birçok platformda kullanılan ve sürekli öğrenme gerektiren öneri sistemlerinin temelini oluşturuyor. Bu sistemlerin kalbi, 'keşif-sömürü dengesi' olarak bilinen ilkedir: kullanıcının beğeneceği bilinen içerikleri önermek ile yeni içerikleri keşfetmek arasındaki dengeyi kurmak.
Ancak yapılan kapsamlı analiz, şaşırtıcı sonuçlar ortaya çıkardı. Araştırmacılar, çeşitli veri setlerinin %90'ından fazlasında, hiçbir keşif stratejisi kullanmayan basit bir açgözlü doğrusal modelin, karmaşık keşif mekanizmalarına sahip gelişmiş algoritmaları geride bıraktığını gözlemledi.
Bu bulgular, öneri sistemlerinin offline değerlendirme yöntemlerinin güvenilirliğini sorgulatıyor. Özellikle keşif davranışının değerlendirilmesinde mevcut yaklaşımların yetersiz kaldığı görülüyor. Sonuçlar, akademik dünyada kabul edilen teoriler ile pratik uygulamalar arasındaki uçurumu gözler önüne seriyor.
Çalışma, yapay zeka tabanlı öneri sistemlerinin geliştirilmesi ve değerlendirilmesi konusunda yeni perspektifler sunuyor ve bu alandaki metodolojik yaklaşımların yeniden düşünülmesi gerektiğine işaret ediyor.