"doğrulama darboğazı" için 135 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
135 haber
Telekomünikasyon Ağlarında Niyet Tabanlı Yönetim için Yeni Doğrulama Sistemi
Araştırmacılar, telekomünikasyon ağlarının yönetimini kolaylaştıracak yeni bir doğrulama sistemi geliştirdi. TIO-SHACL adlı bu sistem, operatörlerin karmaşık teknik detaylara girmeden sadece yüksek seviyeli hedeflerini belirterek ağ yönetimi yapmasını sağlayan 'niyet tabanlı ağ yönetimi' teknolojisi için kritik bir eksikliği gideriyor. Sistem, ağ operatörlerinin belirttiği niyetlerin sisteme kabul edilmeden önce doğruluğunu kontrol ederek hataları önlüyor. Bu gelişme, telekomünikasyon sektöründe ağ yönetimini daha güvenilir ve verimli hale getirme potansiyeli taşıyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 14 gün önce
0
AI'lar İçin Yeni Kod Doğrulama Sistemi: ScaleBox
Araştırmacılar, büyük dil modellerinin kod yazma yeteneklerini geliştirmek için ScaleBox adlı yeni bir sistem geliştirdi. Mevcut kod doğrulama sistemleri yüksek iş yükü altında yetersiz kalırken, ScaleBox hem doğruluğu artırıyor hem de büyük ölçekte verimli çalışabiliyor. Sistem, otomatik özel yargıç üretimi, paralel test çalıştırma ve çok düğümlü koordinasyon gibi özellikler sunuyor. Deneyler, ScaleBox'ın kod doğrulama hassasiyetini ve verimliliğini önemli ölçüde artırdığını gösteriyor. LiveCodeBench performans testlerinde de sistemi kullanan modellerin belirgin şekilde daha iyi sonuçlar aldığı gözlemleniyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 14 gün önce
0
ZipCCL: Büyük Dil Modellerinin Eğitimini Hızlandıran Yeni Sıkıştırma Teknolojisi
Araştırmacılar, büyük dil modellerinin eğitimindeki en önemli sorunlardan biri olan veri iletişim darboğazını çözmek için ZipCCL adında yeni bir sıkıştırma kütüphanesi geliştirdi. Bu teknoloji, makine öğrenmesi verilerinin Gauss dağılımına yakın özellik göstermesinden yararlanarak, kayıpsız sıkıştırma ile iletişim trafiğini azaltıyor. Geleneksel yaklaşımların aksine, sıkıştırma ve açma işlemlerinin maliyeti, azaltılan iletişim trafiğinin faydasından daha az. GPU için optimize edilmiş kerneller ve teorik temelli kodlama teknikleri sayesinde, büyük dil modellerinin dağıtık eğitimi önemli ölçüde hızlanabiliyor. Bu gelişme, yapay zeka modellerinin eğitim süreçlerini daha verimli hale getirerek, hem zaman hem de enerji tasarrufu sağlayabilir.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 14 gün önce
0
Yapay zeka yazarın stilini taklit edemiyor: Kişiselleştirmede büyük eksiklik
Stanford araştırmacıları, yapay zekanın belirli bir yazarın stilinde metin üretme yeteneğini bilimsel yöntemlerle test etti. Sonuçlar hayal kırıklığı yarattı: mevcut tüm kişiselleştirme yöntemleri, yazarlık doğrulama biliminin standartlarına göre başarısız oldu. Araştırma, yazarlık doğrulama teorisine dayanan yeni bir değerlendirme sistemi geliştirdi ve yapay zekanın gerçek anlamda bir yazarın stilini yakalayamadığını ortaya koydu. Bu bulgular, yapay zeka sistemlerinin kişiselleştirme iddialarının abartılı olduğunu gösteriyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Tıpta Yapay Zeka Güvenilirliği İçin Yeni Çerçeve: Kara Kutu Yerine Şeffaf Sistem
Araştırmacılar, klinik yapay zeka sistemlerinin güvenilirliğini artırmak için yeni bir çerçeve geliştirdi. Mevcut AI modellerinin 'kara kutu' yapısından farklı olarak, bu yaklaşım kanıt temelli, denetim altında ve aşamalı özerklik prensiplerine dayanıyor. Çalışma, tıpta AI güvenilirliğinin sadece model doğruluğu veya kullanıcı memnuniyetiyle değil, ölçülebilir sistem özellikleriyle sağlanması gerektiğini vurguluyor. Önerilen sistem, deterministik bir çekirdek, hasta-odaklı AI asistanı, çok katmanlı model yükseltme mekanizması ve insan denetim katmanını birleştiriyor. Bu yaklaşım, kritik bulgularda seçici doğrulama, sınırlı klinik bağlam ve dikkatli değerlendirme süreçleri içeriyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Yapay Zeka Bilim İnsanlarının Hayali Atıflarını Yakalayan Yeni Araç
Araştırmacılar, bilimsel makalelerdeki sahte atıfları tespit eden HalluCiteChecker adlı hafif bir araç geliştirdi. Yapay zeka asistanlarının akademik yazımda yaygınlaşmasıyla birlikte, gerçekte var olmayan çalışmalara yapılan hayali atıflar ciddi bir sorun haline geldi. Bu durum hem bilimsel makalelerin güvenilirliğini sarsiyor hem de hakem ve yazarlara ek iş yükü getiriyor. Yeni araç, standart bir dizüstü bilgisayarda saniyeler içinde doğrulama yapabiliyor ve tamamen çevrimdışı çalışabiliyor. Sadece CPU kullanarak verimli şekilde çalışan sistem, hakem iş yükünü azaltmayı ve akademik kalite kontrolünü desteklemeyi hedefliyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
ClawGym: Yapay Zeka Asistanları için Yeni Eğitim Çerçevesi Geliştirildi
Araştırmacılar, yerel dosyalar ve araçlarla çalışabilen gelişmiş yapay zeka asistanlarının eğitimi için ClawGym adında kapsamlı bir framework geliştirdi. Bu sistem, çok adımlı iş akışlarını yönetebilen AI ajanlarının sistematik bir şekilde eğitilmesi sorununa çözüm getiriyor. ClawGym, 13.500 filtrelenmiş görev içeren geniş bir veri seti ile birlikte, gerçekçi çalışma ortamları ve doğrulama mekanizmaları sunuyor. Framework, kişisel asistan tarzı AI modellerinin geliştirilmesinde tam bir yaşam döngüsü desteği sağlayarak, hem denetimli öğrenme hem de pekiştirmeli öğrenme yöntemlerini kullanıyor. Bu gelişme, günlük hayatta karmaşık görevleri yerine getirebilen daha yetenekli AI asistanlarının geliştirilmesi yolunda önemli bir adım olarak değerlendiriliyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Yapay Zeka Hekimler: Sağlıkta AI'nin AI'yi Değerlendirdiği Yeni Sistem
Sağlık alanında büyük dil modellerinin yaygınlaşmasıyla birlikte, bu sistemlerin değerlendirilmesi kritik hale geldi. Araştırmacılar, yapay zekanın yapay zekayı değerlendirdiği 'LLM-as-a-Judge' yaklaşımını inceledi. Bu sistem, uzman doktor görüşüne alternatif olarak öne çıkıyor ancak güvenlik endişeleri de beraberinde getiriyor. 11 bin 727 çalışmanın tarandığı kapsamlı araştırmada, bu alandaki 49 çalışma detaylı olarak incelendi. Sonuçlar, teknolojinin hızla benimsendiğini ancak doğrulama süreçlerinin yetersiz kaldığını ortaya koyuyor. Çalışmaların çoğunda uzman validator sayısının sadece 3 olduğu, bazılarında ise hiç uzman görüşü alınmadığı tespit edildi.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Yapay Zeka Özetlerindeki Yanlış Bilgileri Tespit Eden Sistem Geliştirildi
Büyük dil modelleri kullanarak veri kümelerinden doğal dil özetleri çıkarmak artık yaygın bir uygulama. Ancak bu özetlerde yer alan iddialar her zaman gerçek verilerle örtüşmüyor. Araştırmacılar bu sorunu çözmek için Evergreen adlı bir sistem geliştirdi. Sistem, yapay zeka tarafından üretilen özetlerdeki iddiaları otomatik olarak doğrulayabiliyor. Özellikle büyük veri kümelerinde sayısal karşılaştırmalar, gruplamalar ve niceleyiciler içeren karmaşık iddiaları kontrol etmede başarılı sonuçlar veriyor. Evergreen, iddia doğrulama sürecini semantik sorgu işleme görevine dönüştürerek çalışıyor ve gereksiz yapay zeka çağrılarını önleyerek maliyet ve gecikmeyi azaltıyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Tıbbi Bilgi Doğrulaması: Karar Vermekten Çok İletişim Kurmalı
Yapay zeka destekli otomatik doğrulama sistemleri birçok alanda başarılı sonuçlar verirken, tıp alanında beklenen ilgiyi göremiyor. Yeni bir araştırma, sosyal medyadan gelen sağlık iddialarını tıp uzmanlarının nasıl doğruladığını inceleyerek, bu durumun nedenlerini araştırıyor. Çalışma, uçtan uca çalışan doğrulama sistemlerinin tıp alanındaki geçerliliğini sorguluyor ve alternatif yaklaşımlar öneriyor. Tıbbi literatürün karmaşıklığı ve halkın sağlık okuryazarlığının yetersizliği, otomatik doğrulama sistemlerine olan ihtiyacı artırsa da, mevcut sistemler pratikte yeterince kullanılmıyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0
Yapay Zeka Modellerinin Hızını Artıran Yeni 'Gevşek Doğrulama' Yöntemi
Araştırmacılar, büyük dil modellerinin çıkarım hızını artırmak için FLy adlı yeni bir yöntem geliştirdi. Geleneksel spekülatif kod çözme yöntemleri sadece tam eşleşen token'ları kabul ederken, FLy semantik olarak doğru ancak farklı ifadeleri de değerlendiriyor. Sistem, entropy tabanlı iki katmanlı bir mekanizma kullanarak hangi durumlarda alternatif token'ların kabul edilebileceğini belirliyor. Bu yaklaşım, modelin kendi kendini düzeltme yeteneğinden faydalanarak daha esnek bir doğrulama kriteri sunuyor. Özellikle dağıtım dışı görevlerde performans kaybı yaşayan mevcut yöntemlere alternatif olan FLy, ek eğitim gerektirmeden çalışabiliyor.
arXiv (Dilbilim & NLP) · 15 gün önce
0