"token sıkıştırma" araması — BilimKapsül

...

Arama Sonuçları

175 haber

Teknoloji & Yapay Zeka

OmniTrace: Yapay Zeka Modellerinin Kaynak Takibi İçin Yeni Çerçeve

Araştırmacılar, çok modlu büyük dil modellerinin (MLLM) ürettiği yanıtların hangi kaynaklardan geldiğini izleyebilen yeni bir sistem geliştirdi. OmniTrace adlı bu hafif çerçeve, metin, görüntü, ses ve video girişlerini aynı anda işleyebilen yapay zeka modellerinde kaynak atıfı sorununu çözmeyi hedefliyor. Mevcut atıf yöntemleri genellikle tek modalite veya sınıflandırma görevleri için tasarlanmış durumda. OmniTrace ise üretim sırasında her bir token'ın hangi girişten geldiğini takip ederek, anlam bütünlüğü olan açıklamalar sunuyor. Bu gelişme, yapay zeka sistemlerinin güvenilirliği ve şeffaflığı açısından önemli bir adım olarak görülüyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Eğitiminde Devrim: Token Düzeyinde Gradient İptalinin Sırrı Çözüldü

Araştırmacılar, yapay zeka modellerinin uzun süreli eğitiminde karşılaşılan kritik sorunları çözen yeni bir yaklaşım geliştirdi. Çalışma, modellerin kendi içlerindeki karşılaştırmalı öğrenme sürecinde yaşanan 'öğrenme vergisi', çözüm olasılığı kayması ve entropi çöküşü gibi problemlerin temel nedenini ortaya koyuyor. Token düzeyindeki kredi atama perspektifinden hareketle, araştırmacılar gradient değiştirilebilirliğinin korunması gerektiğini ve bu sayede zayıf kredili tokenlarda gradient iptalinin sağlanabileceğini gösterdi. Bu keşif, yapay zeka modellerinin daha kararlı ve verimli eğitilmesi için yeni bir yol açıyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay zeka ajanları artık kendi yazdıkları kodları test edebiliyor

Araştırmacılar, büyük dil modellerinin kod yazabildiği ama doğruluğunu kontrol edemediği sorununa çözüm getiren AgentForge adlı sistemi geliştirdi. Bu yenilikçi çerçeve, beş farklı AI ajanının koordineli çalışmasıyla yazılım geliştirme sürecini otomatikleştiriyor. Planlayıcı, kodlayıcı, test edici, hata ayıklayıcı ve eleştiri ajanlarından oluşan ekip, her kod değişikliğini güvenli bir test ortamında çalıştırarak doğruluğunu kontrol ediyor. Sistem, yazılım mühendisliğini iteratif bir karar süreci olarak modelleyerek, geleneksel token tabanlı yaklaşımlar yerine gerçek çalıştırma geri bildirimini kullanıyor. SWE-BENCH Lite test setinde %40 başarı oranına ulaşan AgentForge, tek ajan sistemlerinden 26-28 puan daha iyi performans gösteriyor. Bu gelişme, AI destekli yazılım geliştirmede önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

MOONSHOT: Yapay Zeka Modellerini Sıkıştırma Sanatında Çoklu Hedef Yaklaşımı

Araştırmacılar, milyarlarca parametreli yapay zeka modellerini yeniden eğitmeden küçültebilen yeni bir framework geliştirdi. MOONSHOT adlı bu sistem, mevcut model sıkıştırma yöntemlerinin tek hedefli yaklaşımlarının yetersizliklerini gidererek, hem katman bazında yeniden yapılandırma hatalarını hem de eğitim kaybının matematiksel yaklaşımlarını aynı anda optimize ediyor. Bu çoklu hedefli strateji, farklı mimarilerde ve sıkıştırma seviyelerinde daha tutarlı sonuçlar veriyor. Framework, mevcut budama algoritmalarının etrafına sarılabilen esnek bir yapıya sahip ve büyük dil modellerinden görüntü işleme modellerine kadar geniş bir yelpazede kullanılabiliyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Video Sıkıştırmada Yapay Zeka için Yeni Esnek Yaklaşım: PAT-VCM

Araştırmacılar, makine öğrenmesi sistemleri için video sıkıştırma teknolojisinde önemli bir yenilik geliştirdi. PAT-VCM adlı yeni sistem, farklı yapay zeka görevleri için ayrı ayrı video kodlayıcı eğitme ihtiyacını ortadan kaldırıyor. Geleneksel yöntemler her görev için özel sıkıştırma algoritması gerektirirken, bu sistem tek bir temel video akışını hafif 'yardımcı tokenlar' ile destekleyerek çoklu görevlerde kullanılabiliyor. Sistem, görsel kalıntı tokenları, kontrol tokenları ve anlamsal tokenlar olmak üzere üç tür yardımcı bilgi türünü destekliyor. Nesne tespiti, derinlik tahmin etme ve görüntü segmentasyonu gibi farklı görevlerde test edilen sistem, her görev için ayrı model eğitme maliyetini azaltırken performansı koruyor. Bu yaklaşım, yapay zeka sistemlerinin video analizi yeteneklerini daha verimli hale getirerek endüstriyel uygulamalarda önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Çok Aracılı İletişimde Semantik Hız-Bozulma: Kapasite Türevli Semantik Uzaylar ve Hizalamanın İletişim Maliyeti

Farklı hesaplama kapasitelerine sahip iki aracı aynı ortamla etkileşime girdiğinde, ortak semantik alfabeyi farklı şekilde sıkıştırmaları gerekmez; tamamen farklı semantik alfabeler oluşturabilirler. Araştırma, bölüm POMDP Q_{m,T}(M)'nin - bir aracının kapasitesi ile tutarlı en kaba soyutlama - herhangi bir sınırlı aracı için kapasite türevli semantik uzay olarak hizmet ettiğini göstermektedir.

arXiv · 35 gün önce

← 1 … 13 14 15 →