Siber güvenlik alanında yapay zeka ajanları giderek daha fazla kullanılıyor. Ancak bu sistemlerin hangi mimari yapılarının en etkili olduğu konusunda net veriler yoktu. Yeni bir araştırma, bu soruyu sistematik bir şekilde ele alarak önemli bulgulara ulaştı.
Araştırmacılar, 20 interaktif hedeften oluşan kontrollü bir test ortamı oluşturdu. Bu hedeflerin 10'u web/API, 10'u ise binary tabanlıydı ve her biri ulaşılabilir bir gerçek güvenlik açığı barındırıyordu. Sistemler hem beyaz kutu hem de kara kutu modlarında test edildi.
Çalışmanın çekirdeğinde 5 farklı mimari ailesi, 3 model ailesi ve her iki erişim modu üzerinde toplam 600 koşum gerçekleştirildi. Sonuçlar, güvenlik açığı tespitinde genel başarı oranının %58, doğrulanmış tespit oranının ise %49,8 olduğunu gösterdi.
En dikkat çekici bulgu, çok-ajanlı bağımsız sistemlerin (MAS-Indep) %64,2 doğrulanmış tespit oranıyla zirvede yer almasıydı. Öte yandan tek ajanlı sistemler (SAS), doğrulanmış bulgu başına 0,058 dolar maliyetle maliyet etkinliği konusunda üstünlük sağladı.
Beyaz kutu testlerin kara kutu testlerden önemli ölçüde üstün performans sergilediği (%67'ye karşı %32,7) de araştırmanın öne çıkan sonuçları arasında yer alıyor. Bu bulgular, siber güvenlik alanında AI ajan mimarilerinin seçimi için somut rehberlik sağlıyor.