Yapay zeka tabanlı asistanlar günlük hayatımızda giderek daha fazla yer alırken, kullanıcıların yarım yamalak talepler vermesi büyük bir sorun haline geldi. Örneğin bir kullanıcı "restoran rezervasyonu yap" dediğinde hangi mutfağı tercih ettiği, bütçesi veya konum tercihi gibi kritik bilgileri eksik bırakabiliyor.
Stanford Üniversitesi ve diğer araştırma kurumlarından bilim insanları bu sorunu çözmek için MPT (Multi-session Personalized Tool-calling) adlı kapsamlı bir test kıyaslama sistemi oluşturdu. 265 farklı kullanıcı oturumunu kapsayan bu sistem, AI asistanlarının üç temel beceriyi test ediyor: geçmiş tercihleri hatırlama, yeni tercihler çıkarma ve tercihleri farklı durumlara aktarma.
Araştırmacıların geliştirdiği PRefine sistemi, kullanıcı tercihlerini sürekli gelişen hipotezler olarak ele alıyor. Sistem, "üret-doğrula-iyileştir" döngüsü ile çalışarak kullanıcının geçmiş davranışlarından çıkarımlar yapıyor ve bunları yeni taleplerde kullanıyor.
En dikkat çekici sonuç ise sistemin verimliliği oldu. PRefine, kullanıcının tüm geçmişini hatırlamaya kıyasla sadece %1.24 oranında bellek kullanırken aynı başarıyı gösterdi. Bu, AI asistanlarının hem daha az kaynak tüketerek hem de daha kişisel hizmet verebileceği anlamına geliyor.