Yapay zeka alanında yapılan yeni bir araştırma, dil difüzyon modellerinin beklenenden çok farklı bir şekilde çalıştığını ortaya koyuyor. Araştırmacılar, bu modellerin temel olarak Asosiatif Hafıza (AM) sistemleri gibi davrandığını ve yaratıcı yetenekler geliştirebilme potansiyeline sahip olduğunu keşfetti.
Asosiatif Hafıza sistemlerinin temel prensibi, saklanan veri noktalarını 'anılar' olarak güvenilir şekilde geri çağırabilmektir. Bu süreç, her bir anının etrafında farklı çekim havzaları oluşturularak gerçekleştirilir. Geleneksel olarak Hopfield ağları gibi modeller, bu kararlı çekicileri garanti etmek için açık bir enerji fonksiyonu kullanır.
Ancak yeni çalışma, enerji fonksiyonunun mutlak gerekli olmadığını gösteriyor. Çekim havzalarının koşullu olasılık maksimizasyonu yoluyla da oluşturulabileceği ortaya konuyor. Araştırmacılar, eğitim ve test örneklerinin token geri kazanımını değerlendirerek, bu modellerde keskin bir hafızacılıktan genelleme geçişi tespit ettiler.
Bu geçişin eğitim verilerinin boyutuyla yönetildiği gözlemlendi. Bulgular, yapay zeka modellerinin ne zaman ezberleme yaptığını ve ne zaman gerçek yaratıcı üretkenlik gösterdiğini anlamamızda önemli bir adım oluşturuyor. Bu keşif, gelecekte daha etkili dil modelleri geliştirmek için kritik bilgiler sunuyor.