Teknoloji & Yapay Zeka

Yapay Zeka Şarkı Sözlerinden Melodi Üretiyor: Müzik Kurallarını Öğrenen Yeni Model

Araştırmacılar, şarkı sözlerinden melodi üreten büyük dil modellerinin müzikal açıdan uygunsuz sonuçlar verme sorununu çözmek için yenilikçi bir yaklaşım geliştirdi. Geleneksel modeller genellikle ritim sorunları olan ve vokal aralıkları uygun olmayan melodiler üretiyordu. Yeni çerçeve, insan müdahalesi olmadan müzikal bilgiyi modele kazandırıyor. Sistem, kural tabanlı müzik kısıtlamaları tanımlayarak otomatik olarak tercih veri seti oluşturuyor ve modeli bu verilerle eğitiyor. Deneysel sonuçlar, hizalanmış modelin kural ihlallerini önemli ölçüde azalttığını ve hem nesnel hem de öznel değerlendirmelerde güçlü başlangıç noktalarını geride bıraktığını gösteriyor. Bu gelişme, müzik teknolojisinde yapay zekanın yaratıcılığını artıran önemli bir adım olarak değerlendiriliyor.

Stanford ve diğer kurumlardan araştırmacılar, büyük dil modellerinin şarkı sözlerinden melodi üretme konusundaki yeteneklerini geliştiren çığır açan bir çalışma yayınladı. Çalışma, mevcut modellerin 'kısıtlama ihlali' olarak adlandırılan önemli bir sorunu çözmeyi hedefliyor.

Araştırmacılara göre, denetimli ince ayar ile eğitilen mevcut modeller müzikal açıdan mantıksız melodiler üretiyor. Bu melodiler genellikle zayıf ritim yapısına sahip ve vokal aralıkları uygun değil. Problem, modellerin müzik teorisinin temel kurallarını yeterince içselleştirememesinden kaynaklanıyor.

Geliştirilen yeni çerçeve, insan müdahalesi gerektirmeden müzikal bilgiyi modele aktarıyor. Sistem, önce kural tabanlı müzik kısıtlamalarını tanımlayarak otomatik olarak bir tercih veri seti oluşturuyor. Ardından model, çiftli tercih verileri üzerinde Doğrudan Tercih Optimizasyonu (DPO) kullanılarak hizalanıyor. Son aşamada ise çiftsiz negatif örnekler üzerinde Kahneman-Tversky Optimizasyonu (KTO) uygulanıyor.

Deneysel sonuçlar oldukça umut verici. Hizalanmış model, kural ihlallerini dramatik şekilde azaltırken, hem objektif ölçümler hem de insan değerlendirmelerinde güçlü başlangıç noktalarını geçiyor. Üretilen melodiler, müzikal kalite açısından belirgin iyileşme gösteriyor.

Bu gelişme, müzik teknolojisinde yapay zekanın yaratıcı potansiyelini artıran önemli bir adım olarak değerlendiriliyor ve gelecekte daha sofistike müzik üretim araçlarının önünü açabilir.

Özgün Kaynak
arXiv (CS + AI)
Aligning Language Models for Lyric-to-Melody Generation with Rule-Based Musical Constraints
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.