Yapay zeka sohbet robotları için çok turlu güvenlik sistemi geliştirildi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (Dilbilim & NLP)

Paylaş: Kopyalandı!

Araştırmacılar, görsel ve metin tabanlı yapay zeka modellerinin uzun sohbetlerde ortaya çıkan güvenlik açıklarını gidermek için SaFeR-Steer adlı yeni bir sistem geliştirdi. Mevcut güvenlik eğitiminin tek seferlik etkileşimlere odaklandığı, ancak gerçek kullanımda sohbetlerin birden fazla tur sürdüğü tespit edildi. Bu durumda saldırganlar, konuşmanın ilerleyen turlarında zararlı amaçlarını gizleyerek sistemi kandırabiliyor. Yeni framework, sentetik veri üretimi ve dinamik geri bildirim mekanizmalarını kullanarak bu sorunu çözmeyi hedefliyor. Sistem, öğrenci-öğretmen modeliyle çalışarak adaptif saldırılara karşı dayanıklılık kazandırıyor. Araştırmada ayrıca 12 bin üzerinde çok turlu güvenlik diyalogu içeren STEER veri seti de sunuldu. Test sonuçları, sistemin hem güvenlik hem de yardımcı olma açısından önemli iyileştirmeler sağladığını gösteriyor.

Yapay zeka destekli sohbet robotları günlük hayatımızda giderek daha fazla yer alırken, bu sistemlerin güvenliği kritik bir konu haline geliyor. Özellikle görsel ve metin tabanlı çok modlu büyük dil modelleri (MLLM), uzun süreli konuşmalarda beklenmedik güvenlik açıkları sergileyebiliyor.

Araştırmacılar, mevcut güvenlik eğitimlerinin tek seferlik etkileşimlere odaklandığını, ancak gerçek dünyada sohbetlerin birden fazla tur sürdüğünü tespit etti. Bu durum, saldırganların konuşmanın ilerleyen aşamalarında zararlı niyetlerini gizleyerek sistemi manipüle etmesine olanak tanıyor. Uzun bağlamda güvenlik seviyesinin düştüğü bu phenomenon 'güvenlik çürümesi' olarak adlandırılıyor.

Bu soruna çözüm olarak geliştirilen SaFeR-Steer sistemi, aşamalı sentetik veri üretimi ve öğretmen-öğrenci modelini birleştiren yenilikçi bir yaklaşım sunuyor. Sistem, TCSR adlı özel bir teknik kullanarak, konuşmanın sonraki turlarında tespit edilen güvenlik hatalarını önceki turlara yansıtabiliyor.

Araştırma kapsamında STEER adlı kapsamlı veri seti de geliştirildi. Bu veri seti, 2 ila 10 tur arasında değişen 12.934 eğitim diyalogu ve 3.227 test diyalogu içeriyor. Qwen2.5-VL modelleri üzerinde yapılan testler, yeni sistemin hem güvenlik hem de kullanışlılık açısından önemli iyileştirmeler sağladığını ortaya koydu.

Etiketler

#yapay zeka #güvenlik #sohbet robotları #çok modlu modeller #makine öğrenmesi

Özgün Kaynak

SaFeR-Steer: Evolving Multi-Turn MLLMs via Synthetic Bootstrapping and Feedback Dynamics

https://arxiv.org/abs/2604.16358

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka · 1 gün önce

Yapay zeka sohbet robotları için çok turlu güvenlik sistemi geliştirildi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Sosyal medya seçim karşıtı reklamları oy verme davranışını etkiliyor

Çin'de 'Uzanıp Yatma' Akımı: Sosyal Direnişin Dilbilimsel Analizi

Adil Tasarlanan Eşleştirme Sistemleri Bile Eşitsiz Sonuçlar Üretebiliyor