Yapay zeka teknolojilerinin yaygınlaşmasıyla birlikte, AI tarafından üretilen metinlerin kötüye kullanımı da artış gösteriyor. Bu duruma karşılık geliştirilen tespit sistemleri, AI-generated içerikleri belirlemede önemli rol oynuyor ancak yeni bir araştırma bu sistemlerin ne kadar kırılgan olduğunu ortaya koyuyor.
Araştırmacılar tarafından geliştirilen MASH (Multi-stage Alignment for Style Humanization) adlı yeni teknik, yapay zeka metinlerinin stilini değiştirerek tespit sistemlerini kandırmayı hedefliyor. Bu yöntem, üç aşamalı bir süreç kullanarak AI metinlerini insan yazısına daha çok benzetecek şekilde dönüştürüyor.
MASH sistemi, önce stil enjeksiyonu ile denetimli ince ayar yapıyor, ardından doğrudan tercih optimizasyonu uygulayıp son olarak da çıkarım zamanında iyileştirme gerçekleştiriyor. Bu çok aşamalı yaklaşım, AI metinlerinin dağılımını insan yazısı dağılımına yaklaştırmayı başarıyor.
Altı farklı veri seti ve beş farklı tespit sistemi üzerinde yapılan kapsamlı testlerde, MASH yöntemi ortalama %80 başarı oranıyla mevcut tespit sistemlerini atlatmayı başardı. Bu sonuç, 11 farklı alternatif yönteme kıyasla üstün performans sergilediğini gösteriyor.
Araştırma, AI tespit sistemlerinin güvenilirliği konusunda önemli sorular ortaya koyarken, bu alanda daha güçlü savunma mekanizmalarına ihtiyaç olduğunu da vurguluyor.