"LLM" için 222 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
222 haber
Büyük Dil Modelleri Spektrum Yönetimini Devrimleştiriyor
Araştırmacılar, kablosuz ağlardaki spektrum yönetimi sorununu büyük dil modelleri (LLM) kullanarak çözmeye yönelik yeni bir yaklaşım geliştirdi. Geleneksel optimizasyon yöntemlerinin büyük ölçekli ağlarda yetersiz kaldığı durumlarda, LLM tabanlı sistem başarıyla spektrum erişimini optimize ediyor. Sistem, hiyerarşik durum serileştirme mekanizması sayesinde küresel çevre istatistikleri ile yerel kısıtları harmanlayarak, LLM'nin sınırlı bağlam penceresi içinde yüksek boyutlu akıl yürütme yapmasını sağlıyor. Araştırma, kod tabanlı paradigmanın soğuk başlatma darboğazını ortadan kaldırdığını ve doğrudan yürütme geri bildirimi ile üstün ölçekleme yasalarına ulaştığını gösteriyor.
arXiv (CS + AI) · 28 gün önce
0
Yapay Zeka Modellerinin Beklenmedik Davranışlarının Matematiksel Kökeni Keşfedildi
Büyük dil modellerinin (LLM) öngörülemeyen davranışlar sergilemesinin ardındaki temel sebep ortaya çıkarıldı. ArXiv'de yayınlanan yeni araştırma, bu modellerin kaotik davranışlarının sayısal hassasiyet sınırlarından kaynaklandığını gösteriyor. Bilim insanları, kayan nokta sayılarındaki küçük yuvarlama hatalarının transformer katmanları boyunca nasıl yayıldığını ve büyüdüğünü izledi. Araştırmacılar, erken katmanlarda 'çığ etkisi' adını verdikleri kaotik bir fenomen keşfetti - küçük değişiklikler ya hızla büyüyor ya da tamamen sönüyor. Bu bulgular, yapay zeka sistemlerinin güvenilirliği için kritik önem taşıyor. Özellikle LLM'lerin otonom süreçlerde kullanımı arttıkça, bu öngörülemezlik ciddi bir güvenilirlik sorunu haline geliyor. Çalışma, farklı ölçeklerdeki modellerin üç farklı davranış rejimi sergilediğini ortaya koyuyor.
arXiv (CS + AI) · 28 gün önce
0
Yapay Zeka Modelleri İçin Devrim Niteliğinde Bellek Yönetimi: KV Packet
Büyük dil modellerinin (LLM) çalışma hızını artıran yeni bir bellek yönetim sistemi geliştirildi. KV Packet adlı bu sistem, yapay zeka modellerinin önceki hesaplamalarını tekrar kullanma biçimini değiştirerek, işlem yükünü neredeyse sıfıra indiriyor. Geleneksel sistemlerde, bir belge farklı bağlamda kullanıldığında tüm hesaplamalar yeniden yapılıyor ve bu da önemli zaman kaybına yol açıyordu. Yeni yaklaşım ise belgeleri değiştirilemez 'paketler' olarak ele alıp, hafif eğitilebilir adaptörlerle sararak bu sorunu çözüyor. Llama-3.1 ve Qwen2.5 modellerinde yapılan testler, sistemin mevcut yöntemlere göre çok daha az işlem gücü kullandığını ve ilk yanıt sürelerini önemli ölçüde kısalttığını gösteriyor. Bu gelişme, yapay zeka asistanlarının daha hızlı ve verimli çalışmasının önünü açıyor.
arXiv (CS + AI) · 28 gün önce
0
Yapay Zeka, Çevrimiçi Kurs Öğrencilerinin Memnuniyetini Önceden Tahmin Edebiliyor
Araştırmacılar, masif açık çevrimiçi kurslarında (MOOC) öğrenci memnuniyetini erken dönemde tahmin edebilen yenilikçi bir yapay zeka sistemi geliştirdi. TET-LLM adlı bu sistem, öğrencilerin ilk 7-28 gün içindeki davranışlarını analiz ederek kurs sonundaki memnuniyet düzeylerini öngörebiliyor. Sistem, öğrencilerin tıklama davranışları, forum gönderileri ve kısa geri bildirimlerini büyük dil modelleriyle işleyerek çok boyutlu bir analiz gerçekleştiriyor. Bu gelişme, eğitim platformlarının risk altındaki öğrencileri erkenden tespit etmesini ve müdahale etmesini sağlayarak hem öğrenci başarısını hem de platform itibarını artırabilir. Geleneksel yöntemler kurs bitimindeki değerlendirmelere dayandığından müdahale için çok geç kalıyordu, ancak bu yeni yaklaşım proaktif eğitim desteği sunma imkanı tanıyor.
arXiv (CS + AI) · 28 gün önce
0
BERT-as-a-Judge: Dil Modellerinin Değerlendirilmesi İçin Sözlüksel Yöntemlere Güçlü Alternatif
Büyük dil modellerinin (LLM) değerlendirilmesinde kullanılan geleneksel sözlüksel yöntemler, modellerin gerçek problem çözme yetenekleri ile format kurallarına uyumu arasında karışıklık yaratabilir. BERT tabanlı yeni yaklaşım, daha esnek ve doğru değerlendirme imkanı sunuyor.
arXiv · 33 gün önce
0