Araştırmacılar, dil modellerinin davranışlarını karşılaştırmak için yeni bir ölçek sistemi geliştirdi. Kullback-Leibler divergence adı verilen matematiksel yöntemle, farklı büyüklükteki modellerin öğrenme süreçleri tek bir standart üzerinden değerlendirilebiliyor. Çalışma, modellerin ağırlık parametreleri sürekli değişse de, dil anlama yeteneklerinin beklenenden çok daha erken stabilleştiğini ortaya koyuyor. Bu keşif, yapay zeka modellerinin nasıl öğrendiğini anlamamızda önemli bir adım.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

AI modellerinde yönlendirme vektörlerinin başarısını önceden tahmin etme yöntemi

Araştırmacılar, yapay zeka modellerinde yönlendirme vektörlerinin ne zaman etkili olacağını önceden tahmin edebilen yeni bir yöntem geliştirdi. Linear Accessibility Profile (LAP) adı verilen bu teknik, modelin hangi katmanlarında müdahalenin başarılı olacağını deneme yapmadan belirleyebiliyor. Pythia-2.8B'den Llama-8B'ye kadar beş farklı model üzerinde yapılan testlerde, yöntem %86-91 arası doğruluk oranıyla başarı tahmininde bulundu. Bu gelişme, AI güvenliği ve model davranış kontrolü alanında önemli bir adım olarak değerlendiriliyor. Yöntem, modellerin istenmeyen çıktılarını engellemek ve belirli konularda yönlendirmek için kullanılan steering vektörlerinin etkinliğini artırabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

Büyük Dil Modelleri İkilem Yaşıyor: Daha Akıllı Ama Aynı Zamanda Daha Kolay Kandırılır

Yeni bir araştırma, yapay zeka dil modellerinin boyutu büyüdükçe paradoksal bir davranış sergilediğini ortaya koyuyor. Cornell Üniversitesi araştırmacıları, büyük modellerin yanlış bilgilere karşı daha dirençli hale gelirken, aynı zamanda rastgele ve anlamsız metinleri taklit etme eğiliminin arttığını keşfetti. Cerebras-GPT ve Pythia model ailelerini analiz eden çalışma, bu durumun öngörülebilir matematiksel yasalara uyduğunu gösteriyor. En büyük modeller, yanlış bilgilere karşı en küçük modellerden dört kat daha dirençliyken, anlamsız içerikleri kopyalama konusunda iki kat daha eğilimli. Bu bulgu, AI sistemlerinin geliştirilmesinde önemli bir ikilem olduğuna işaret ediyor.

arXiv (CS + AI) 0