Stanford ve diğer kurumlardan araştırmacılar, büyük dil modellerinin şarkı sözlerinden melodi üretme konusundaki yeteneklerini geliştiren çığır açan bir çalışma yayınladı. Çalışma, mevcut modellerin 'kısıtlama ihlali' olarak adlandırılan önemli bir sorunu çözmeyi hedefliyor.
Araştırmacılara göre, denetimli ince ayar ile eğitilen mevcut modeller müzikal açıdan mantıksız melodiler üretiyor. Bu melodiler genellikle zayıf ritim yapısına sahip ve vokal aralıkları uygun değil. Problem, modellerin müzik teorisinin temel kurallarını yeterince içselleştirememesinden kaynaklanıyor.
Geliştirilen yeni çerçeve, insan müdahalesi gerektirmeden müzikal bilgiyi modele aktarıyor. Sistem, önce kural tabanlı müzik kısıtlamalarını tanımlayarak otomatik olarak bir tercih veri seti oluşturuyor. Ardından model, çiftli tercih verileri üzerinde Doğrudan Tercih Optimizasyonu (DPO) kullanılarak hizalanıyor. Son aşamada ise çiftsiz negatif örnekler üzerinde Kahneman-Tversky Optimizasyonu (KTO) uygulanıyor.
Deneysel sonuçlar oldukça umut verici. Hizalanmış model, kural ihlallerini dramatik şekilde azaltırken, hem objektif ölçümler hem de insan değerlendirmelerinde güçlü başlangıç noktalarını geçiyor. Üretilen melodiler, müzikal kalite açısından belirgin iyileşme gösteriyor.
Bu gelişme, müzik teknolojisinde yapay zekanın yaratıcı potansiyelini artıran önemli bir adım olarak değerlendiriliyor ve gelecekte daha sofistike müzik üretim araçlarının önünü açabilir.