Yapay zeka alanında önemli bir gelişme yaşanıyor. Karmaşık soruları yanıtlayabilmek için iteratif mantık yürütme, sorgu oluşturma ve bilgi sentezleme yeteneklerine sahip yapay zeka ajanları geliştirmek, son yıllarda pekiştirmeli öğrenme ile büyük ilerleme kaydetmişti. Ancak mevcut yaklaşımların önemli bir sınırı vardı.
Search-R1 gibi mevcut sistemler, belge arama bileşenini değişmez bir araç olarak görüyor ve yalnızca mantık yürütme ajanını optimize ediyordu. Araştırmacıların yaptığı ön deneyler, ideal bir arama sistemi ile sabit tutulan mevcut sistemler arasında yedi farklı soru-cevap karşılaştırma testinde %26,8'e varan göreli F1 skoru iyileşmesi olduğunu ortaya koydu. Bu sonuç, arama sisteminin aslında performans artışındaki ana darboğaz olduğunu gösteriyordu.
Bu keşiften yola çıkan araştırmacılar, CoSearch adında yenilikçi bir çerçeve önerdi. Bu sistem, çok adımlı mantık yürütme ajanı ile üretken belge sıralama modelini Grup Göreli Politika Optimizasyonu (GRPO) yöntemiyle eş zamanlı olarak eğitiyor. Böylece hem akıl yürütme hem de bilgi arama süreçleri birlikte gelişiyor.
Bu yaklaşım, yapay zeka destekli arama sistemlerinin daha etkili çalışmasını sağlayarak, karmaşık soruların yanıtlanmasında çığır açıcı gelişmelere kapı aralamaya aday görünüyor.