Büyük dil modellerinin (LLM) öneri sistemlerindeki etkinliğini inceleyen yeni bir araştırma, bu teknolojilerin nasıl çalıştığına dair önemli bulgular ortaya koydu. Araştırmacılar, mevcut yaklaşımların kullanıcı tercihlerini modellerken iki kritik faktörü gözden kaçırdığını tespit etti.
İlk faktör olan 'tercih yoğunluğu', kullanıcının bir içeriğe karşı duyduğu beğeni veya hoşnutsuzluğun yapısal gücünü ifade ediyor. İkinci faktör 'zamansal bağlam' ise, son etkileşimlerin kullanıcının mevcut niyetini ne ölçüde yansıttığını gösteriyor. Geleneksel sistemler bu nüansları göz ardı ederek sadece basit ikili karşılaştırmalar yapıyor.
Kontrollü deneyler, yapısal tercih sinyalleri içeren kapsamlı geri bildirimlerin kullanılmasının öneri performansını önemli ölçüde iyileştirdiğini kanıtladı. Bu da ikili modellemenin hayati bilgileri attığını gösteriyor.
Bu keşiflerden yola çıkarak araştırmacılar RecPO adında birleşik bir tercih optimizasyon çerçevesi geliştirdi. Bu sistem, hem açık hem de örtük geri bildirimleri ortak bir tercih sinyaline dönüştürüyor ve tercih yoğunluğu ile etkileşim yeniliğini birlikte hesaba katan uyarlanabilir ödül marjları oluşturuyor.
Bu çalışma, yapay zeka tabanlı kişiselleştirme teknolojilerinin gelecekteki gelişimine önemli katkılar sağlayarak daha etkili ve kullanıcı dostu öneri sistemlerinin yolunu açıyor.