Büyük dil modellerinin kullanıcı metinlerinden kişisel bilgileri çıkarabilme kabiliyeti, dijital mahremiyet alanında ciddi endişelere yol açıyor. Yeni bir araştırma, bu soruna karşı geliştirilmiş kapsamlı bir savunma sistemi sunuyor.
Araştırmacıların önerdiği çerçeve, TRACE ve RPS olmak üzere iki ana bileşen içeriyor. TRACE sistemi, dikkat mekanizmaları ve çıkarım zinciri üretimi kullanarak gizliliği tehdit eden metin parçalarını tespit ediyor ve bunları hassas bir şekilde anonimleştiriyor. Bu yaklaşım, mevcut yöntemlerin aksine kelime düzeyinde hassasiyet sağlıyor.
RPS bileşeni ise hafif iki aşamalı bir optimizasyon stratejisi kullanarak yapay zeka modellerinin ret davranışları sergilemesini sağlıyor. Bu sayede modellerin kişisel özellik çıkarımı yapması tamamen engelleniyor.
Geleneksel anonimleştirme yöntemlerinin kaba bir yaklaşım sergilediği ve yapay zeka modellerinin akıl yürütme yetenekleri sayesinde değiştirilmiş metinlerden bile çıkarım yapabildiği biliniyordu. Yeni sistem bu sınırlamaları aşarak, hem metin düzeyinde koruma sağlıyor hem de model seviyesinde engelleme yapıyor.
Bu gelişme, sosyal medya kullanıcılarının ve çevrimiçi içerik üreticilerinin mahremiyetini koruma konusunda umut verici bir adım olarak değerlendiriliyor.