"model sıkıştırma" araması

Arama Sonuçları

1010 haber

Yapay Zeka Değerlendirmesinde Devrim: Tek Seferde Çoklu Yanıt Puanlama

Araştırmacılar, yapay zeka modellerinin ürettiği yanıtları değerlendirmek için yeni bir yöntem geliştirdi. Geleneksel sistemler her yanıtı ayrı ayrı inceleyerek zaman kaybına neden olurken, yeni yaklaşım birden fazla yanıtı tek seferde karşılaştırıp puanlayabiliyor. Bu yöntem, yanıtları özel ayırıcı tokenlarla birleştirerek doğrudan karşılaştırmalı akıl yürütme imkanı sunuyor. Sistem, N adet yanıt için N kat hızlanma ve hesaplama maliyetinde ciddi azalma sağlıyor. Araştırma kapsamında iki yeni benchmark oluşturuldu: MR²Bench-Image görsel içerik için 8 farklı modelin yanıtlarını insan değerlendirmeleriyle karşılaştırırken, MR²Bench-Video 94 bin kişinin video tabanlı soru-cevap değerlendirmelerinden oluşuyor. Bu gelişme, yapay zeka modellerinin performansını daha hızlı ve verimli değerlendirme imkanı sunarak, AI sistemlerinin geliştirilmesini hızlandırabilir.

arXiv (CS + AI) · 27 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modelleri Neden Farklı Bilgileri Unutuyor?

Araştırmacılar, görüntü sınıflandırma yapay zeka modellerinin eğitim sırasında hangi bilgileri unuttuğunu inceledi. ResNet-18 ve DeiT-Small mimarilerini göz hastalıkları ve kuş türleri veri setleri üzerinde test eden çalışma, farklı yapay zeka mimarilerinin tamamen farklı örnekleri unuttuğunu keşfetti. Vision Transformer (ViT) modellerinin unutma süreçlerinin CNN'lere göre daha düzenli olduğu, ancak her iki mimaride de unutmanın rastgele faktörlerden etkilendiği belirlendi. Bu bulgular, yapay zeka eğitim programlarının tasarımı, veri temizleme süreçleri ve farklı modellerin birlikte kullanılması konularında önemli ipuçları sunuyor.

arXiv (CS + AI) · 27 gün önce

Teknoloji & Yapay Zeka

Zaman Serisi Tahminlerinde Devrim: TempusBench Değerlendirme Sistemi Geliştir

Araştırmacılar, zaman serisi tahmin modellerinin performansını değerlendirmek için yeni bir framework olan TempusBench'i geliştirdi. Mevcut değerlendirme sistemlerinin yetersizliklerini gidermek amacıyla tasarlanan bu sistem, güncel veri setleri kullanıyor ve modellerin istatistiksel özelliklerini daha kapsamlı analiz ediyor. TempusBench, özellikle son dönemde hızla gelişen temel zaman serisi modellerinin (TSFM) daha objektif karşılaştırılmasını sağlıyor. Bu gelişme, finans, enerji ve iklim tahminlerinde kullanılan yapay zeka modellerinin güvenilirliğini artırabilir.

arXiv (CS + AI) · 27 gün önce

Fizik

Yapay Zeka ile Leptonların Gizemli Dünyasına Yeni Bakış

Fizikçiler, difüzyon modelleri adı verilen yapay zeka tekniklerini kullanarak leptonların (elektron, müon ve nötrinolar) flavor yapısını araştırmak için yenilikçi bir yöntem geliştirdi. Standart Model'in basit bir uzantısını kullanan araştırmacılar, sinir ağlarını nötrino kütle matrisini üretmek için eğittiler. Transfer öğrenme tekniği sayesinde, nötrino kütle karelerinin farkları ve leptonik karışım açıları ile tutarlı 10.000 çözüm üretebildiler. Bu yaklaşım, parçacık fiziğindeki temel sorulara yapay zekanın nasıl ışık tutabileceğini gösteriyor ve gelecekteki deneylerde doğrulanabilir tahminler sunuyor.

arXiv (CS + AI) · 27 gün önce

Kimya

Elektrokimyasal Kataliz için Yeni Arayüz Modeli Geliştirildi

Avrupa'da faaliyet gösteren bir araştırma ekibi, elektrokataliz süreçlerini daha iyi anlamamızı sağlayacak güçlü bir model geliştirdi. Bu yenilikçi yaklaşım, katı katalizör ile sıvı ortam arasındaki arayüzde gerçekleşen elektrokimyasal olayları detaylı şekilde inceliyor. Model, yük ayrışması, elektriksel çift katman oluşumu ve yerel elektrik potansiyeli değişimlerini hesaplayarak, bu faktörlerin katalitik aktivite üzerindeki etkilerini ortaya koyuyor. Bu gelişme, hidrojen üretimi başta olmak üzere, çevre dostu kimya endüstrisi için kritik önem taşıyan elektrokataliz teknolojilerinin ilerlemesine katkı sağlayabilir. Nature Communications dergisinde yayınlanan çalışma, daha ucuz ve verimli katalizör geliştirilmesi sürecine rehberlik edecek temel bilimsel altyapı sunuyor.

Phys.org · 28 gün önce

Uzay & Astronomi

Titan'da hafif rüzgarlar 3 metrelik dev dalgalar yaratıyor

MIT bilimcileri, Satürn'ün en büyük uydusu Titan'daki göllerde, Dünya'da su yüzeyini zar zor dalgalandıracak kadar hafif rüzgarların 3 metrelik devasa dalgalar oluşturabileceğini gösteren yeni bir model geliştirdi. Bu çalışma, farklı gezegen koşullarında dalga dinamiklerini ve dalga oluşumunu etkileyen faktörleri tam olarak modelleyen ilk araştırma. Titan'ın benzersiz atmosferik ve yüzey koşulları nedeniyle ortaya çıkan bu olağanüstü davranış, hem gezegenler arası oceanografi hem de uzay keşfi açısından önemli bulgular sunuyor.

Phys.org · 28 gün önce

Teknoloji & Yapay Zeka

AI Ajanları Artık Daha Az Veriye İhtiyaç Duyuyor

Araştırmacılar, büyük dil modellerine dayalı çoklu ajan sistemlerinde devrim niteliğinde bir sıkıştırma yöntemi geliştirdi. Yeni teknik, ajanların birbirleriyle iletişim kurmasında gereken veri miktarını %90'a yakın azaltırken performansta kayıp yaşanmasını önlüyor. Orthogonal Backfill (OBF) adı verilen bu yöntem, önemli bilgilerin kaybolmasını engellemek için akıllı bir geri doldurma stratejisi kullanıyor. Matematik, kodlama ve bilgi yoğun soru-cevap alanlarındaki testlerde, sistemin dokuz kıyaslama testinden yedisinde en iyi sonuçları verdiği gözlemlendi. Bu gelişme, AI sistemlerinin bellek ve iletişim maliyetlerini önemli ölçüde düşürerek daha verimli çalışmasını sağlıyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Büyük dil modellerini eğitmenin yeni yolu: TLoRA+ ile daha verimli yapay zeka

Araştırmacılar, büyük dil modellerinin belirli görevler için eğitimini daha verimli hale getiren TLoRA+ adlı yeni bir yöntem geliştirdi. Bu teknik, modellerin performansını artırırken hesaplama maliyetini minimum düzeyde tutuyor. ChatGPT ve benzeri büyük dil modellerinin özelleştirilmesi için kullanılan mevcut LoRA yöntemini geliştiren bu yaklaşım, daha az kaynak kullanarak daha iyi sonuçlar elde etmeyi mümkün kılıyor. GLUE benchmark testlerinde yapılan denemeler, yöntemin farklı model mimarilerinde tutarlı bir şekilde başarılı olduğunu gösterdi. Bu gelişme, yapay zeka modellerinin daha geniş kitlelere ve küçük şirketlere açılması açısından önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modellerinin 'Yalan Söylediği' Daha Doğru Tespit Edilebiliyor

Araştırmacılar, dil modellerinin yanlış bildiği cevapları verdiği durumları tespit etmek için geliştirilen doğrusal prob tekniklerinde önemli ilerlemeler kaydetti. Tek katman prob yöntemlerinin kırılgan yapısına karşı, çok katmanlı ensemble yaklaşımının çok daha güvenilir sonuçlar verdiği ortaya çıktı. Özellikle aldatıcı davranışların tespitinde, bu yeni yöntem bazı test alanlarında başarı oranını %78'e kadar artırdı. Ayrıca, model büyüklüğü arttıkça tespit doğruluğunun da paralel şekilde yükseldiği gözlemlendi. Bu bulgular, yapay zeka güvenliği ve aldatma karşıtı sistemler için kritik öneme sahip.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Çevrimiçi Oyunların Çöküş Mekanizması Matematiksel Modelle Açıklandı

Araştırmacılar, çok oyunculu online oyunların neden ve nasıl popülerliklerini kaybederek oynanmaz hale geldiğini açıklayan formal bir çerçeve geliştirdi. Çalışma, oyunların hayatta kalabilmesi için gerekli minimum oyuncu sayısını tanımlayan 'Kritik Kütle Eşiği' ve nostaljinin aktif katılımı geride bıraktığı 'Nostalji Dönüm Noktası' gibi matematiksel kavramlar sunuyor. Model, oyuncu tabanının azalması durumunda bekleme sürelerinin uzaması, eşleşme kalitesinin düşmesi ve oyun dengesinin bozulması gibi faktörlerin nasıl bir kısır döngü yarattığını gösteriyor. Bu araştırma, oyun endüstrisinin milyarlarca dolarlık yatırımlarını koruma stratejileri geliştirmesi açısından kritik öneme sahip.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Difüzyon Dil Modellerinde Öngörü Kararsızlığının Gizli Yüzü Ortaya Çıktı

Yapay zeka alanında yeni nesil büyük dil modelleri olan difüzyon dil modellerinin (DLM) beklenmedik bir sorunu keşfedildi. Araştırmacılar, bu modellerin aynı soruya farklı zamanlarda verdikleri yanıtların tutarsız olabildiğini, ancak geleneksel değerlendirme yöntemlerinin bu kararsızlığı maskelediğini ortaya koydu. Mevcut test sistemleri, binlerce örneğin ortalamasına bakarak modelin genel performansını ölçüyor, böylece bireysel örneklerdeki büyük farklılıklar gözden kaçıyor. Bu durum, aynı genel performansa sahip iki model konfigürasyonunun, tekil sorularda tamamen farklı davranabilmesi anlamına geliyor. Araştırma ekibi, her bir örneği ayrı ayrı inceleyerek modellerin ne kadar tutarsız olduğunu daha detaylı ölçen yeni bir değerlendirme sistemi geliştirdi.

arXiv (CS + AI) · 29 gün önce

← 1 … 80 81 82 83 84 85 →