...
"token sıkıştırma" için 175 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
175 haber
Teknoloji & Yapay Zeka
OmniTrace: Yapay Zeka Modellerinin Kaynak Takibi İçin Yeni Çerçeve
Araştırmacılar, çok modlu büyük dil modellerinin (MLLM) ürettiği yanıtların hangi kaynaklardan geldiğini izleyebilen yeni bir sistem geliştirdi. OmniTrace adlı bu hafif çerçeve, metin, görüntü, ses ve video girişlerini aynı anda işleyebilen yapay zeka modellerinde kaynak atıfı sorununu çözmeyi hedefliyor. Mevcut atıf yöntemleri genellikle tek modalite veya sınıflandırma görevleri için tasarlanmış durumda. OmniTrace ise üretim sırasında her bir token'ın hangi girişten geldiğini takip ederek, anlam bütünlüğü olan açıklamalar sunuyor. Bu gelişme, yapay zeka sistemlerinin güvenilirliği ve şeffaflığı açısından önemli bir adım olarak görülüyor.
Teknoloji & Yapay Zeka
Yapay Zeka Eğitiminde Devrim: Token Düzeyinde Gradient İptalinin Sırrı Çözüldü
Araştırmacılar, yapay zeka modellerinin uzun süreli eğitiminde karşılaşılan kritik sorunları çözen yeni bir yaklaşım geliştirdi. Çalışma, modellerin kendi içlerindeki karşılaştırmalı öğrenme sürecinde yaşanan 'öğrenme vergisi', çözüm olasılığı kayması ve entropi çöküşü gibi problemlerin temel nedenini ortaya koyuyor. Token düzeyindeki kredi atama perspektifinden hareketle, araştırmacılar gradient değiştirilebilirliğinin korunması gerektiğini ve bu sayede zayıf kredili tokenlarda gradient iptalinin sağlanabileceğini gösterdi. Bu keşif, yapay zeka modellerinin daha kararlı ve verimli eğitilmesi için yeni bir yol açıyor.
Teknoloji & Yapay Zeka
Yapay zeka ajanları artık kendi yazdıkları kodları test edebiliyor
Araştırmacılar, büyük dil modellerinin kod yazabildiği ama doğruluğunu kontrol edemediği sorununa çözüm getiren AgentForge adlı sistemi geliştirdi. Bu yenilikçi çerçeve, beş farklı AI ajanının koordineli çalışmasıyla yazılım geliştirme sürecini otomatikleştiriyor. Planlayıcı, kodlayıcı, test edici, hata ayıklayıcı ve eleştiri ajanlarından oluşan ekip, her kod değişikliğini güvenli bir test ortamında çalıştırarak doğruluğunu kontrol ediyor. Sistem, yazılım mühendisliğini iteratif bir karar süreci olarak modelleyerek, geleneksel token tabanlı yaklaşımlar yerine gerçek çalıştırma geri bildirimini kullanıyor. SWE-BENCH Lite test setinde %40 başarı oranına ulaşan AgentForge, tek ajan sistemlerinden 26-28 puan daha iyi performans gösteriyor. Bu gelişme, AI destekli yazılım geliştirmede önemli bir adım teşkil ediyor.
Teknoloji & Yapay Zeka
MOONSHOT: Yapay Zeka Modellerini Sıkıştırma Sanatında Çoklu Hedef Yaklaşımı
Araştırmacılar, milyarlarca parametreli yapay zeka modellerini yeniden eğitmeden küçültebilen yeni bir framework geliştirdi. MOONSHOT adlı bu sistem, mevcut model sıkıştırma yöntemlerinin tek hedefli yaklaşımlarının yetersizliklerini gidererek, hem katman bazında yeniden yapılandırma hatalarını hem de eğitim kaybının matematiksel yaklaşımlarını aynı anda optimize ediyor. Bu çoklu hedefli strateji, farklı mimarilerde ve sıkıştırma seviyelerinde daha tutarlı sonuçlar veriyor. Framework, mevcut budama algoritmalarının etrafına sarılabilen esnek bir yapıya sahip ve büyük dil modellerinden görüntü işleme modellerine kadar geniş bir yelpazede kullanılabiliyor.
Teknoloji & Yapay Zeka
Video Sıkıştırmada Yapay Zeka için Yeni Esnek Yaklaşım: PAT-VCM
Araştırmacılar, makine öğrenmesi sistemleri için video sıkıştırma teknolojisinde önemli bir yenilik geliştirdi. PAT-VCM adlı yeni sistem, farklı yapay zeka görevleri için ayrı ayrı video kodlayıcı eğitme ihtiyacını ortadan kaldırıyor. Geleneksel yöntemler her görev için özel sıkıştırma algoritması gerektirirken, bu sistem tek bir temel video akışını hafif 'yardımcı tokenlar' ile destekleyerek çoklu görevlerde kullanılabiliyor. Sistem, görsel kalıntı tokenları, kontrol tokenları ve anlamsal tokenlar olmak üzere üç tür yardımcı bilgi türünü destekliyor. Nesne tespiti, derinlik tahmin etme ve görüntü segmentasyonu gibi farklı görevlerde test edilen sistem, her görev için ayrı model eğitme maliyetini azaltırken performansı koruyor. Bu yaklaşım, yapay zeka sistemlerinin video analizi yeteneklerini daha verimli hale getirerek endüstriyel uygulamalarda önemli bir adım teşkil ediyor.
Teknoloji & Yapay Zeka
Çok Aracılı İletişimde Semantik Hız-Bozulma: Kapasite Türevli Semantik Uzaylar ve Hizalamanın İletişim Maliyeti
Farklı hesaplama kapasitelerine sahip iki aracı aynı ortamla etkileşime girdiğinde, ortak semantik alfabeyi farklı şekilde sıkıştırmaları gerekmez; tamamen farklı semantik alfabeler oluşturabilirler. Araştırma, bölüm POMDP Q_{m,T}(M)'nin - bir aracının kapasitesi ile tutarlı en kaba soyutlama - herhangi bir sınırlı aracı için kapasite türevli semantik uzay olarak hizmet ettiğini göstermektedir.