Diffüzyon modelleri, görüntü üretiminden metin sentezine kadar birçok alanda çığır açan başarılar elde ederken, eğitim verilerinde bulunmayan tamamen yeni içerikler üretebilme yetenekleriyle dikkat çekiyor. Peki bu 'yaratıcılık' nasıl ortaya çıkıyor?
ArXiv'de yayınlanan yeni bir çalışma, bu soruya matematiksel bir açıklama getiriyor. Araştırmacılar, diffüzyon modellerinin yaratıcılığının, sinir ağı omurgasının ampirik skor fonksiyonunun yumuşatılmış bir versiyonunu öğrenmesinden kaynaklandığı hipotezini inceliyor.
Çalışmanın temel bulgusu şu: Skor fonksiyonunun yumuşatılması, gürültü giderme dinamiklerini eğitim verileri arasında interpolasyon yapan yeni veri noktaları üretmeye yönlendiriyor. Araştırmacılar bu mekanizmayı özellikle tek boyutlu alt uzaylarda analiz ederek, skor yumuşatma ile gürültü giderme dinamikleri arasındaki karmaşık etkileşimi analitik çözümler ve sayısal deneylerle açıklığa kavuşturuyor.
Daha da ilginç olan, sinir ağları ile skor fonksiyonlarının öğrenilmesinin -açık düzenlileştirme olsun ya da olmasın- doğal olarak bu yumuşatma etkisini yarattığının hem teorik hem de deneysel kanıtlarının sunulması. Bu keşif, yapay zeka sistemlerinin nasıl yaratıcı çıktılar üretebildiğini anlamamızda önemli bir kilometre taşı oluşturuyor.