Teknoloji & Yapay Zeka

Yapay zeka ajanları artık kişiliğe göre davranacak: Yeni test sistemi geliştirildi

Araştırmacılar, yapay zeka destekli ajanların kullanıcı kişiliğine uyum sağlayabilme becerisini test eden yeni bir değerlendirme sistemi geliştirdi. MM-tau-p² adlı bu sistem, özellikle müşteri deneyimi yönetiminde kullanılan çok modlu yapay zeka ajanlarının performansını ölçüyor. Mevcut test sistemleri sadece metin tabanlı sohbetlere odaklanırken, yeni sistem hem görsel hem işitsel girdileri değerlendiriyor. Sistem, kullanıcının kişilik özelliklerini tanıyan ve buna göre davranış sergileyen ajanların ne kadar başarılı olduğunu ölçüyor. GPT-4 ve GPT-5 gibi en gelişmiş dil modellerinin bile bu konuda eksiklikleri olduğu tespit edildi.

Yapay zeka teknolojisinin hızla gelişmesiyle birlikte, kullanıcılarla etkileşim kuran AI ajanları da daha sofistike hale geliyor. Ancak mevcut test sistemlerinin büyük bir eksiği vardı: Bu sistemler kullanıcının kişilik özelliklerini göz ardı ediyordu.

Araştırmacılar, bu soruna çözüm getirmek için MM-tau-p² (Multi-Modal tau-persona squared) adlı yeni bir değerlendirme sistemi geliştirdi. Bu sistem, yapay zeka ajanlarının kullanıcının kişiliğini tanıyıp ona göre davranış sergileyebilme yeteneğini test ediyor.

Özellikle müşteri hizmetleri alanında bu özellik kritik önem taşıyor. Çünkü başarılı bir müşteri deneyimi için ajanın, kullanıcının kişilik özelliklerini öğrenerek davranışını buna göre uyarlaması gerekiyor.

Yeni sistem, sadece metin değil, ses ve görsel girdileri de işleyebilen çok modlu ajanları test edebiliyor. Gerçek zamanlı ses sentezi ve çok modlu dil modellerinin yaygınlaşmasıyla bu özellik giderek daha önemli hale geliyor.

İlginç bir şekilde, GPT-4 ve GPT-5 gibi en gelişmiş yapay zeka modelleri bile bu testlerde zorlandığı gözlemlendi. Bu durum, kişilik uyumu konusunda yapılması gereken daha fazla çalışma olduğunu gösteriyor.

Özgün Kaynak
arXiv (CS + AI)
MM-tau-p$^2$: Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.