Yapay Zeka Modellerinde Hız Rekoru: EVICT Sistemi 2 Kat Daha Hızlı İşlem Sağlıyor

4 Mayıs 2026, 07:00 2 dk okuma 0 görüntülenme arXiv — Hesaplamalı Dilbilim (cs.CL)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zeka modellerinin metin üretim hızını artırmak için EVICT adlı yeni bir sistem geliştirdi. Bu sistem, özellikle karmaşık Mixture-of-Experts (MoE) modellerinde yaşanan performans sorunlarını çözerek, gereksiz hesaplamaları ortadan kaldırıyor. EVICT, ağaç tabanlı tahmini kod çözme tekniğini optimize ederek, sadece faydalı token'ları doğrulama sürecine dahil ediyor. Sistem herhangi bir ek eğitim gerektirmeden çalışabiliyor ve mevcut altyapılarla uyumlu. Farklı model mimarileri üzerinde yapılan testlerde sistemin 2 kata kadar hız artışı sağladığı görüldü. Bu gelişme, ChatGPT gibi büyük dil modellerinin yanıt verme hızını önemli ölçüde artırabilir.

Yapay zeka alanında önemli bir gelişme kaydeden araştırmacılar, büyük dil modellerinin metin üretim hızını artırmak için EVICT adlı yeni bir sistem geliştirdi. Bu sistem, özellikle karmaşık Mixture-of-Experts (MoE) modellerinde yaşanan performans darboğazlarını çözmeyi hedefliyor.

Geleneksel ağaç tabanlı tahmini kod çözme yöntemleri, birden fazla taslak adayını paralel olarak doğrulayarak hız artışı sağlar. Ancak bu avantaj, sparse MoE modellerinde zayıflar çünkü taslak ağaç büyüdükçe farklı dallar farklı uzmanları aktive eder ve doğrulama maliyeti önemli ölçüde artar.

EVICT sistemi bu sorunu, doğrulama öncesinde taslak ağacı keserek sadece maliyet-etkin önekleri koruyarak çözüyor. Sistem, aday faydasını tahmin etmek için ince ayarlı taslak sinyalleri kullanıyor ve bunları çevrimdışı profilli doğrulama maliyetiyle birleştiriyor.

Sistemin en önemli avantajları arasında ek eğitim gerektirmemesi, hiperparametre ayarına ihtiyaç duymaması ve kayıpsız çalışması yer alıyor. Ayrıca yüksek performanslı SGLang çerçevesiyle tam uyumlu.

Farklı MoE model mimarileri ve test senaryoları üzerinde yapılan kapsamlı deneyler, EVICT'in 2 kata kadar hız artışı sağladığını gösterdi. Bu gelişme, büyük dil modellerinin günlük kullanımda daha hızlı yanıtlar vermesini mümkün kılacak.

Etiketler

#yapay zeka #dil modelleri #performans optimizasyonu #MoE modelleri #metin üretimi

Özgün Kaynak

Making Every Verified Token Count: Adaptive Verification for MoE Speculative Decoding

https://arxiv.org/abs/2605.00342

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka

16 sa önce

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Son 40 yılın başkanlık seçimlerini analiz eden araştırmacılar, Amerikan siyasetindeki büyük değişimin arkasında yaygın kanaatin aksine işçi sınıfının değil, varlıklı ve yüksek eğitimli beyaz seçmenlerin olduğunu ortaya koydu. Çalışma, bu grubun istikrarlı bir şekilde Demokrat Parti'ye yöneldiğini gösteriyor. Bulgular, siyasi yeniden yapılanmanın nedenlerine dair genel kabul görmüş görüşleri sorguluyor ve elit seçmenlerin siyasi tercihlerindeki değişimin rolünü ön plana çıkarıyor. Araştırma, demografik değişimlerin siyasi davranış üzerindeki etkilerini anlamak için önemli veriler sunuyor.

PsyPost Oku

Teknoloji & Yapay Zeka

20 sa önce

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Dil ve dilbilim alanındaki iki yeni çalışma dikkat çekici sorulara yanıt arıyor. Almeida'nın Humanities and Social Sciences Communications'da yayınlanan makalesi gülmenin doğasını felsefi ve bilimsel açıdan inceliyor. Diğer yandan Leivada ve ekibinin Philosophical Transactions of the Royal Society A'da yayınlanan araştırması, büyük dil modellerinin gerçekten insan dilini ve kelimelerin arkasındaki dünyayı anlayıp anlamadığını sorguluyor. Her iki çalışma da insan iletişiminin karmaşıklığını farklı perspektiflerden ele alıyor.

Language Log Oku

Teknoloji & Yapay Zeka

22 sa önce

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor

Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost Oku