Büyük dil modellerinin yaygın kullanımıyla birlikte, bu sistemlerin kişilik temsil mekanizmalarını anlama ihtiyacı kritik hale geldi. Yeni bir araştırma, yapay zeka modellerinin kişilik özelliklerinin nasıl çalıştığını ve değiştirilebileceğini inceledi.
Kişilik düzenleme alanında mevcut yöntemler, modelin nöronlarını bulup değiştirme yaklaşımını benimsiyor. Ancak bu süreç çok sayıda nöronun değiştirilmesini gerektiriyor ve modelin genel performansında önemli düşüşlere neden oluyor. Araştırmacılar bu durumda temel bir soruyu gündeme getirdi: Değiştirilen tüm nöronlar gerçekten kişilik temsiliyle doğrudan ilişkili mi?
Çalışmada üç önemli keşif yapıldı. İlk olarak, mevcut yöntemlerin kişilikleri değiştirebilse de genel performansı azalttığı tespit edildi. İkinci olarak, nöronların çok işlevli olduğu ve kişilik özelliklerini genel bilgiyle bağladığı anlaşıldı. Üçüncü ve en dikkat çekici bulgu ise zıt kişilik özelliklerinin birbirini tamamen dışlayan temsil kalıpları sergilemesiydi.
Bu bulgulardan yola çıkarak geliştirilən DPN-LE (İkili Kişilik Nöronu) yöntemi, yapay zeka modellerinin kişilik özelliklerini daha hassas ve etkili şekilde düzenlemeyi hedefliyor. Bu gelişme, gelecekte yapay zeka asistanlarının davranış özelliklerinin daha iyi kontrol edilmesine olanak sağlayabilir.