"token sıkıştırma" araması

Arama Sonuçları

175 haber

Kuantum Bilgiyi 'Altın Oran'da Sıkıştıran Yeni Mimari Keşfedildi

Araştırmacılar, kuantum verilerini optimal şekilde sıkıştırabilen yeni bir kuantum otoenkoder mimarisi geliştirdi. Bu sistem, kuantum durumlarını daha az qubit kullanarak saklamanın yolunu açıyor. Geleneksel dar ama sınırlı mimariler ile karmaşık ama fazla parametreli sistemler arasında 'Goldilocks' adını verdikleri ideal bir denge noktası buldular. Bu keşif, kuantum bilgisayarların hafıza kullanımını optimize etmek ve kuantum verilerini daha verimli işlemek açısından kritik öneme sahip. Sistem, bilgi kaybını minimuma indirirken sıkıştırma oranını maksimize ediyor.

arXiv — Kuantum Fiziği · 10 gün önce

Teknoloji & Yapay Zeka

Portekizce için Geliştirilen NorBERTo Yapay Zeka Modeli 331 Milyar Token ile Eğitildi

Brezilya'daki araştırmacılar, Portekizce doğal dil işleme alanında çığır açan yeni bir yapay zeka modeli geliştirdi. NorBERTo adlı bu model, ModernBERT mimarisine dayalı olarak tasarlandı ve Aurora-PT adı verilen dev bir Portekizce veri kümesi ile eğitildi. Bu veri kümesi, çeşitli web kaynaklarından toplanan 331 milyar GPT-2 token içeriyor. Model, metin benzerliği, mantıksal çıkarım ve sınıflandırma görevlerinde test edildiğinde, özellikle PLUE ve ASSIN 2 benchmark testlerinde kayda değer başarılar elde etti. NorBERTo-large versiyonu, değerlendirilen kodlayıcı modeller arasında en iyi performansı göstererek Portekizce NLP uygulamaları için önemli bir adım teşkil ediyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Tablolardan Daha Akıllı Bilgi Çıkarıyor

Stanford araştırmacıları, Excel ve CSV gibi tablolu verileri işlemek için yeni bir yapay zeka yaklaşımı geliştirdi. Mevcut RAG (Retrieval-Augmented Generation) sistemleri tablolu verileri işlemekte yetersiz kalırken, yeni STC (Structure-Aware Tabular Chunking) framework'ü tablonun yapısal özelliklerini koruyan akıllı parçalama yöntemi kullanıyor. Bu yöntem, her satırı anahtar-değer çiftleri olarak kodlayarak hiyerarşik bir ağaç yapısı oluşturuyor ve semantik ilişkileri koruyarak daha verimli veri işleme sağlıyor. Testlerde, geleneksel yöntemlere göre %40-56 daha az parça oluştururken token kullanımını artırdı.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modellerinde Hız Rekoru: EVICT Sistemi 2 Kat Daha Hızlı İşlem Sağlıyor

Araştırmacılar, yapay zeka modellerinin metin üretim hızını artırmak için EVICT adlı yeni bir sistem geliştirdi. Bu sistem, özellikle karmaşık Mixture-of-Experts (MoE) modellerinde yaşanan performans sorunlarını çözerek, gereksiz hesaplamaları ortadan kaldırıyor. EVICT, ağaç tabanlı tahmini kod çözme tekniğini optimize ederek, sadece faydalı token'ları doğrulama sürecine dahil ediyor. Sistem herhangi bir ek eğitim gerektirmeden çalışabiliyor ve mevcut altyapılarla uyumlu. Farklı model mimarileri üzerinde yapılan testlerde sistemin 2 kata kadar hız artışı sağladığı görüldü. Bu gelişme, ChatGPT gibi büyük dil modellerinin yanıt verme hızını önemli ölçüde artırabilir.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ajanları İçin Yeni Optimizasyon Sistemi: Agent Capsules

Araştırmacılar, çoklu yapay zeka ajanlarının birlikte çalıştığı sistemlerde hem performansı artıran hem de maliyeti düşüren yenilikçi bir çözüm geliştirdi. Agent Capsules adlı bu sistem, birden fazla AI ajanının görevlerini daha verimli şekilde koordine etmesini sağlıyor. Geleneksel yaklaşımlarda her ajan için ayrı dil modeli çağrısı yapılması hem pahalı hem de yavaş sonuçlar doğuruyordu. Yeni sistem, ajanları akıllıca gruplandırarak token kullanımını azaltırken, kalite kaybını önlemek için sürekli performans kontrolü yapıyor. Sistem, üç farklı strateji arasında seçim yapabiliyor ve kalite düşüşü algıladığında otomatik olarak daha güvenli modlara geçiş yapıyor. Bu gelişme, çoklu AI ajan sistemlerinin daha geniş çapta kullanımına olanak sağlayabilir.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modellerinin Eğitiminde Hafıza Kullanımını Yarıya İndiren Yeni Teknik

Araştırmacılar, büyük dil modellerinin eğitimi sırasında GPU hafıza kullanımını dramatik şekilde azaltan AGoQ adlı yeni bir teknik geliştirdi. Bu yöntem, farklı katmanlar için uygun bit genişlikleri ayıran akıllı bir aktivasyon sıkıştırma algoritması ve 8-bit gradient depolama sistemi kullanıyor. 64 GPU'ya kadar test edilen sistem, hafıza kullanımını %52 oranında azaltırken, eğitim hızını 1.34 kata kadar artırdı. Geleneksel yöntemlerden farklı olarak, model doğruluğunda kayıp yaşanmadan bu verimliliği sağlıyor. Bu gelişme, büyük yapay zeka modellerinin eğitimini daha erişilebilir hale getirebilir ve daha az donanım kaynak gereksinimi sayesinde maliyetleri önemli ölçüde düşürebilir.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Arayüz Etkileşiminde Büyük Verimlilik Atılımı

Yapay zeka ajanlarının grafik kullanıcı arayüzleriyle etkileşimi sırasında karşılaştığı büyük veri sorunu için yenilikçi bir çözüm geliştirildi. A11y-Compressor adlı framework, arayüz verilerini %78 oranında sıkıştırırken performansı artırıyor. Sistem, erişilebilirlik ağaçlarındaki gereksiz bilgileri temizleyerek ve yapısal düzenlemeler yaparak çalışıyor. OSWorld benchmark testlerinde yapılan denemelerde, sıkıştırılmış veriler orijinalin sadece %22'si kadar yer kaplarken, görev başarı oranları ortalama %5.1 puan artış gösterdi. Bu gelişme, yapay zeka ajanlarının bilgisayar arayüzleriyle daha verimli çalışabilmesi için kritik bir adım teşkil ediyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modellerini Hızlandıran Yeni Sıkıştırma Tekniği Geliştirildi

Araştırmacılar, büyük dil modellerinin boyutunu küçültmek için ARHQ adlı yenilikçi bir yöntem geliştirdi. Bu teknik, modellerin performansını korurken boyutlarını önemli ölçüde azaltabiliyor. Geleneksel sıkıştırma yöntemlerinin aksine, ARHQ hata yayılımını önlemek için ağırlıkları iki ayrı dala bölerek işlem yapıyor. Yöntem, hassas hesaplamalar gerektiren kısımları yüksek kalitede tutarken, diğer bölümleri güvenle sıkıştırıyor. Qwen3-4B modeli üzerindeki testler, bu yaklaşımın mantıksal düşünme yeteneklerini koruduğunu gösteriyor. Bu gelişme, yapay zeka modellerinin mobil cihazlarda ve sınırlı kaynaklara sahip sistemlerde daha verimli çalışmasının önünü açıyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Mantık Yürütmesindeki Kritik Zayıflık Keşfedildi

Büyük dil modellerinin karmaşık problemleri çözerken kullandığı zincirsel mantık yürütme (CoT) yönteminde ciddi bir açık keşfedildi. Araştırmacılar, bu modellerin eğitim sırasında gördüklerinden daha fazla mantık adımı gerektiren problemlerde performanslarının keskin bir şekilde düştüğünü ortaya koydu. MIT ve diğer kurumlardan bilim insanları, bu başarısızlığın arkasındaki mekanizmayı inceleyerek, hataların rastgele dağılmadığını, belirli token pozisyonlarında yoğunlaştığını buldu. Daha da önemlisi, 'hatalı işleme kafaları' adını verdikleri özel dikkat mekanizmalarının, doğru mantık yollarını bastırırken yanlış çıkarımları güçlendirdiğini keşfetti. Bu bulgu, yapay zekanın mantık yürütme yeteneklerinin geliştirilmesi açısından kritik önem taşıyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modelleri İçin Devrim Niteliğinde Dikkat Mekanizması Geliştirildi

Araştırmacılar, büyük dil modellerinin uzun metinleri işlerken karşılaştığı en büyük sorunu çözen yeni bir yöntem geliştirdi. Token Sparse Attention adlı bu teknik, modellerin dikkat mekanizmasındaki karmaşıklığı büyük ölçüde azaltıyor. Geleneksel yöntemler, önemli bilgileri kalıcı olarak siliyor ya da katı kalıplarla çalışıyordu. Yeni yaklaşım ise dinamik bir şekilde hangi bilgi parçalarının önemli olduğunu belirleyip, gerektiğinde bu bilgileri sonraki işlemlerde yeniden değerlendiriyor. Bu sayede hem hız kazanılıyor hem de bilgi kaybı önleniyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) · 11 gün önce

Fizik

Rydberg Atomlarında Kuantum Dolaşıklığın Yeni Keşfi Hassas Ölçüm Teknolojilerini Geliştirebilir

Araştırmacılar, optik cımbızlarla kontrol edilen Rydberg atom dizilerinde metrologically faydalı kuantum dolaşıklık üretmenin yeni bir yolunu keşfetti. Üç seviyeli spin-1 sisteminde gerçekleştirilen bu çalışma, spin-nematik sıkıştırma adı verilen özel bir fenomen ortaya çıkarıyor. Sistem büyüklüğüyle ölçeklenebilen bu dolaşıklık türü, atom sayısı arttıkça daha güçlü hale geliyor. Bulgular, kuantum sensörlerin hassasiyetini artırmak için kritik olan kuantum Fisher bilgisinin sistem boyutuyla karesel olarak artabileceğini gösteriyor. Bu keşif, gelecekte daha hassas atomik saatler, manyetometreler ve diğer kuantum sensörler geliştirme potansiyeli taşıyor.

arXiv — Kuantum Fiziği · 11 gün önce

← 1 2 3 … 15 →