Yapay Zeka Neden Aynı Soruya Farklı Cevap Veriyor? Bilim İnsanları Açıkladı

Büyük dil modellerinin prompt hassasiyeti sorunu matematiksel olarak analiz edildi. Araştırmacılar, ChatGPT gibi yapay zekaların aynı anlama gelen farklı sorulara neden tutarsız cevaplar verdiğini Taylor açılımı ve gradyan analizi kullanarak açıkladı. Çalışma, küçük sinir ağlarının aksine büyük dil modellerinin benzer girdileri kümelemek yerine dağıttığını ortaya koyuyor. Bu dağılma davranışı, anlam olarak aynı olan farklı promptlar arasındaki olasılık farkının çok yüksek olmasına ve sıfıra düşürülmesinin zorlaşmasına neden oluyor. Bulgular, yapay zeka sistemlerinin güvenilirlik ve tutarlılık sorunlarını anlamamızda önemli bir adım.

Yapay zeka teknolojilerinin yaygınlaşmasıyla birlikte, büyük dil modellerinin 'prompt hassasiyeti' sorunu kullanıcılar arasında endişe yaratıyor. Bu problem, aynı anlama gelen farklı şekillerde sorulmuş sorulara sistemin farklı cevaplar vermesi anlamına geliyor.

Yeni bir araştırmada bilim insanları, bu tutarsızlığın matematiksel temellerini ortaya çıkardı. Araştırmacılar, büyük dil modellerini çok değişkenli fonksiyonlar olarak ele alıp Taylor açılımı yöntemiyle analiz etti. Bu yaklaşım, anlam korunmuş promptlar, gradyanları ve modelin bir sonraki token için hesapladığı log olasılıklar arasındaki ilişkiyi anlamaya yönelik.

Cauchy-Schwarz eşitsizliğini kullanarak elde edilen bulgular şaşırtıcı. Küçük sinir ağlarının aksine, büyük dil modelleri benzer girdileri kümelemiyor, tam tersine onları dağıtıyor. Bu dağılma davranışı, anlam olarak aynı olan iki prompt arasındaki log olasılık farkının üst sınırının aşırı yüksek olmasına yol açıyor.

Araştırma, neden bazı anlam korunmuş prompt varyasyonlarının diğerlerinden daha istikrarlı sonuçlar verdiğini de açıklıyor. Bu bulgular, yapay zeka sistemlerinin güvenilirliğini artırmaya yönelik çalışmalarda kritik önem taşıyor.