“pythia” için sonuçlar
3 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yapay Zeka Modellerinin Öğrenme Sürecinde Yeni Ölçek Sistemi Geliştirildi
Araştırmacılar, dil modellerinin davranışlarını karşılaştırmak için yeni bir ölçek sistemi geliştirdi. Kullback-Leibler divergence adı verilen matematiksel yöntemle, farklı büyüklükteki modellerin öğrenme süreçleri tek bir standart üzerinden değerlendirilebiliyor. Çalışma, modellerin ağırlık parametreleri sürekli değişse de, dil anlama yeteneklerinin beklenenden çok daha erken stabilleştiğini ortaya koyuyor. Bu keşif, yapay zeka modellerinin nasıl öğrendiğini anlamamızda önemli bir adım.
AI modellerinde yönlendirme vektörlerinin başarısını önceden tahmin etme yöntemi
Araştırmacılar, yapay zeka modellerinde yönlendirme vektörlerinin ne zaman etkili olacağını önceden tahmin edebilen yeni bir yöntem geliştirdi. Linear Accessibility Profile (LAP) adı verilen bu teknik, modelin hangi katmanlarında müdahalenin başarılı olacağını deneme yapmadan belirleyebiliyor. Pythia-2.8B'den Llama-8B'ye kadar beş farklı model üzerinde yapılan testlerde, yöntem %86-91 arası doğruluk oranıyla başarı tahmininde bulundu. Bu gelişme, AI güvenliği ve model davranış kontrolü alanında önemli bir adım olarak değerlendiriliyor. Yöntem, modellerin istenmeyen çıktılarını engellemek ve belirli konularda yönlendirmek için kullanılan steering vektörlerinin etkinliğini artırabilir.
Büyük Dil Modelleri İkilem Yaşıyor: Daha Akıllı Ama Aynı Zamanda Daha Kolay Kandırılır
Yeni bir araştırma, yapay zeka dil modellerinin boyutu büyüdükçe paradoksal bir davranış sergilediğini ortaya koyuyor. Cornell Üniversitesi araştırmacıları, büyük modellerin yanlış bilgilere karşı daha dirençli hale gelirken, aynı zamanda rastgele ve anlamsız metinleri taklit etme eğiliminin arttığını keşfetti. Cerebras-GPT ve Pythia model ailelerini analiz eden çalışma, bu durumun öngörülebilir matematiksel yasalara uyduğunu gösteriyor. En büyük modeller, yanlış bilgilere karşı en küçük modellerden dört kat daha dirençliyken, anlamsız içerikleri kopyalama konusunda iki kat daha eğilimli. Bu bulgu, AI sistemlerinin geliştirilmesinde önemli bir ikilem olduğuna işaret ediyor.