Siber güvenlik AI ajanları: Hangi mimariler gerçekten işe yarıyor?

Yapay zeka tabanlı siber güvenlik sistemleri, canlı hedefleri denetlemek için araç kullanan büyük dil modellerini (LLM) kullanıyor. Ancak hangi ajan mimarilerinin en etkili olduğu belirsizdi. Yeni araştırma, 20 interaktif hedef üzerinde 600 test koşturarak farklı ajan mimarilerini karşılaştırdı. Sonuçlar, çok-ajanlı bağımsız sistemlerin (MAS-Indep) %64,2 doğrulama oranıyla en yüksek güvenlik açığı tespit performansını gösterdiğini ortaya koydu. Tek ajanlı sistemler ise maliyet etkinliği açısından öne çıktı. Beyaz kutu testlerin kara kutu testlerden belirgin şekilde üstün olduğu (%67'ye karşı %32,7) da dikkat çeken bulgular arasında. Bu çalışma, siber güvenlik alanında AI ajan topologylerinin optimize edilmesi için somut veriler sunuyor.

Siber güvenlik alanında yapay zeka ajanları giderek daha fazla kullanılıyor. Ancak bu sistemlerin hangi mimari yapılarının en etkili olduğu konusunda net veriler yoktu. Yeni bir araştırma, bu soruyu sistematik bir şekilde ele alarak önemli bulgulara ulaştı.

Araştırmacılar, 20 interaktif hedeften oluşan kontrollü bir test ortamı oluşturdu. Bu hedeflerin 10'u web/API, 10'u ise binary tabanlıydı ve her biri ulaşılabilir bir gerçek güvenlik açığı barındırıyordu. Sistemler hem beyaz kutu hem de kara kutu modlarında test edildi.

Çalışmanın çekirdeğinde 5 farklı mimari ailesi, 3 model ailesi ve her iki erişim modu üzerinde toplam 600 koşum gerçekleştirildi. Sonuçlar, güvenlik açığı tespitinde genel başarı oranının %58, doğrulanmış tespit oranının ise %49,8 olduğunu gösterdi.

En dikkat çekici bulgu, çok-ajanlı bağımsız sistemlerin (MAS-Indep) %64,2 doğrulanmış tespit oranıyla zirvede yer almasıydı. Öte yandan tek ajanlı sistemler (SAS), doğrulanmış bulgu başına 0,058 dolar maliyetle maliyet etkinliği konusunda üstünlük sağladı.

Beyaz kutu testlerin kara kutu testlerden önemli ölçüde üstün performans sergilediği (%67'ye karşı %32,7) de araştırmanın öne çıkan sonuçları arasında yer alıyor. Bu bulgular, siber güvenlik alanında AI ajan mimarilerinin seçimi için somut rehberlik sağlıyor.