Yapay Zeka Takımlarının 'Çoğunluk Tuzağı' Sorunu Token Düzeyinde Çözüldü

Araştırmacılar, birden fazla yapay zeka ajanının birlikte çalıştığı sistemlerde kritik bir güvenlik açığı keşfetti. Mevcut sistemlerde kullanılan çoğunluk oylaması yöntemi, kötü niyetli müdahaleler karşısında savunmasız kalabiliyor. Bozuk ajanlar yerel bir çoğunluk oluşturduğunda, sistem tamamen çökebiliyor. Çünkü oylama sadece nihai sonuçlara bakıyor, ara mantık hatalarını görmezden geliyor. Bilim insanları bu sorunu çözmek için Token Düzeyinde Sırayla İşbirliği adında yeni bir yöntem geliştirdi. Bu yaklaşımda ajanlar, sonuçları ayrı ayrı oylamak yerine, ortak bir bağlamda sırayla kelime üretme sürecine katılıyor. Bu yöntem, sistemi kırılgan oy sayma mekanizmasından dinamik bir işbirliği zincirine dönüştürüyor.

Yapay zeka teknolojisinde çoklu ajan sistemleri giderek daha yaygın hale gelirken, bu sistemlerin güvenlik açıkları da gün yüzüne çıkmaya başladı. Araştırmacılar, büyük dil modellerinin birlikte çalıştığı sistemlerde ciddi bir yapısal zayıflık tespit etti.

Mevcut çoklu ajan sistemleri genellikle çoğunluk oylaması gibi yanıt düzeyinde birleştirme yöntemlerini kullanıyor. Bu yaklaşımda her ajan kendi sonucunu üretiyor ve sistem en çok desteklenen yanıtı seçiyor. Ancak bu yöntem, hedefli prompt enjeksiyonları gibi gizli bozulmalar karşısında oldukça savunmasız.

Araştırma ekibi, sistemin temel sorununu şöyle açıklıyor: Bozuk ajanlar yerel bir çoğunluk oluşturduğunda, yanıt düzeyinde birleştirme tamamen çöküyor. Çünkü oylama mekanizması sadece nihai sonuçlara odaklanıyor ve hatalı ara mantık zincirlerini tespit edemiyor.

Bu sorunu çözmek için geliştirilen Token Düzeyinde Sırayla İşbirliği yöntemi, ajanların ortak bir oto-regresif bağlamda sırayla kelime üretmesini sağlıyor. Bilim insanları bu süreci ayrık zamanlı dinamik sistem olarak formalize ederek, token düzeyinde iç içe geçmenin sistemı kırılgan oy saymadan dinamik bir işbirliği zincirine dönüştürdüğünü kanıtladı.

Bu yenilik, yapay zeka sistemlerinin güvenilirliğini artırmada önemli bir adım olarak değerlendiriliyor.