...
"model sıkıştırma" için 1010 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
1010 haber
Teknoloji & Yapay Zeka
Yapay Zeka Değerlendirmesinde Devrim: Tek Seferde Çoklu Yanıt Puanlama
Araştırmacılar, yapay zeka modellerinin ürettiği yanıtları değerlendirmek için yeni bir yöntem geliştirdi. Geleneksel sistemler her yanıtı ayrı ayrı inceleyerek zaman kaybına neden olurken, yeni yaklaşım birden fazla yanıtı tek seferde karşılaştırıp puanlayabiliyor. Bu yöntem, yanıtları özel ayırıcı tokenlarla birleştirerek doğrudan karşılaştırmalı akıl yürütme imkanı sunuyor. Sistem, N adet yanıt için N kat hızlanma ve hesaplama maliyetinde ciddi azalma sağlıyor. Araştırma kapsamında iki yeni benchmark oluşturuldu: MR²Bench-Image görsel içerik için 8 farklı modelin yanıtlarını insan değerlendirmeleriyle karşılaştırırken, MR²Bench-Video 94 bin kişinin video tabanlı soru-cevap değerlendirmelerinden oluşuyor. Bu gelişme, yapay zeka modellerinin performansını daha hızlı ve verimli değerlendirme imkanı sunarak, AI sistemlerinin geliştirilmesini hızlandırabilir.
Teknoloji & Yapay Zeka
Yapay Zeka Modelleri Neden Farklı Bilgileri Unutuyor?
Araştırmacılar, görüntü sınıflandırma yapay zeka modellerinin eğitim sırasında hangi bilgileri unuttuğunu inceledi. ResNet-18 ve DeiT-Small mimarilerini göz hastalıkları ve kuş türleri veri setleri üzerinde test eden çalışma, farklı yapay zeka mimarilerinin tamamen farklı örnekleri unuttuğunu keşfetti. Vision Transformer (ViT) modellerinin unutma süreçlerinin CNN'lere göre daha düzenli olduğu, ancak her iki mimaride de unutmanın rastgele faktörlerden etkilendiği belirlendi. Bu bulgular, yapay zeka eğitim programlarının tasarımı, veri temizleme süreçleri ve farklı modellerin birlikte kullanılması konularında önemli ipuçları sunuyor.
Teknoloji & Yapay Zeka
Zaman Serisi Tahminlerinde Devrim: TempusBench Değerlendirme Sistemi Geliştir
Araştırmacılar, zaman serisi tahmin modellerinin performansını değerlendirmek için yeni bir framework olan TempusBench'i geliştirdi. Mevcut değerlendirme sistemlerinin yetersizliklerini gidermek amacıyla tasarlanan bu sistem, güncel veri setleri kullanıyor ve modellerin istatistiksel özelliklerini daha kapsamlı analiz ediyor. TempusBench, özellikle son dönemde hızla gelişen temel zaman serisi modellerinin (TSFM) daha objektif karşılaştırılmasını sağlıyor. Bu gelişme, finans, enerji ve iklim tahminlerinde kullanılan yapay zeka modellerinin güvenilirliğini artırabilir.
Fizik
Yapay Zeka ile Leptonların Gizemli Dünyasına Yeni Bakış
Fizikçiler, difüzyon modelleri adı verilen yapay zeka tekniklerini kullanarak leptonların (elektron, müon ve nötrinolar) flavor yapısını araştırmak için yenilikçi bir yöntem geliştirdi. Standart Model'in basit bir uzantısını kullanan araştırmacılar, sinir ağlarını nötrino kütle matrisini üretmek için eğittiler. Transfer öğrenme tekniği sayesinde, nötrino kütle karelerinin farkları ve leptonik karışım açıları ile tutarlı 10.000 çözüm üretebildiler. Bu yaklaşım, parçacık fiziğindeki temel sorulara yapay zekanın nasıl ışık tutabileceğini gösteriyor ve gelecekteki deneylerde doğrulanabilir tahminler sunuyor.
Kimya
Elektrokimyasal Kataliz için Yeni Arayüz Modeli Geliştirildi
Avrupa'da faaliyet gösteren bir araştırma ekibi, elektrokataliz süreçlerini daha iyi anlamamızı sağlayacak güçlü bir model geliştirdi. Bu yenilikçi yaklaşım, katı katalizör ile sıvı ortam arasındaki arayüzde gerçekleşen elektrokimyasal olayları detaylı şekilde inceliyor. Model, yük ayrışması, elektriksel çift katman oluşumu ve yerel elektrik potansiyeli değişimlerini hesaplayarak, bu faktörlerin katalitik aktivite üzerindeki etkilerini ortaya koyuyor. Bu gelişme, hidrojen üretimi başta olmak üzere, çevre dostu kimya endüstrisi için kritik önem taşıyan elektrokataliz teknolojilerinin ilerlemesine katkı sağlayabilir. Nature Communications dergisinde yayınlanan çalışma, daha ucuz ve verimli katalizör geliştirilmesi sürecine rehberlik edecek temel bilimsel altyapı sunuyor.
Uzay & Astronomi
Titan'da hafif rüzgarlar 3 metrelik dev dalgalar yaratıyor
MIT bilimcileri, Satürn'ün en büyük uydusu Titan'daki göllerde, Dünya'da su yüzeyini zar zor dalgalandıracak kadar hafif rüzgarların 3 metrelik devasa dalgalar oluşturabileceğini gösteren yeni bir model geliştirdi. Bu çalışma, farklı gezegen koşullarında dalga dinamiklerini ve dalga oluşumunu etkileyen faktörleri tam olarak modelleyen ilk araştırma. Titan'ın benzersiz atmosferik ve yüzey koşulları nedeniyle ortaya çıkan bu olağanüstü davranış, hem gezegenler arası oceanografi hem de uzay keşfi açısından önemli bulgular sunuyor.
Teknoloji & Yapay Zeka
AI Ajanları Artık Daha Az Veriye İhtiyaç Duyuyor
Araştırmacılar, büyük dil modellerine dayalı çoklu ajan sistemlerinde devrim niteliğinde bir sıkıştırma yöntemi geliştirdi. Yeni teknik, ajanların birbirleriyle iletişim kurmasında gereken veri miktarını %90'a yakın azaltırken performansta kayıp yaşanmasını önlüyor. Orthogonal Backfill (OBF) adı verilen bu yöntem, önemli bilgilerin kaybolmasını engellemek için akıllı bir geri doldurma stratejisi kullanıyor. Matematik, kodlama ve bilgi yoğun soru-cevap alanlarındaki testlerde, sistemin dokuz kıyaslama testinden yedisinde en iyi sonuçları verdiği gözlemlendi. Bu gelişme, AI sistemlerinin bellek ve iletişim maliyetlerini önemli ölçüde düşürerek daha verimli çalışmasını sağlıyor.
Teknoloji & Yapay Zeka
Büyük dil modellerini eğitmenin yeni yolu: TLoRA+ ile daha verimli yapay zeka
Araştırmacılar, büyük dil modellerinin belirli görevler için eğitimini daha verimli hale getiren TLoRA+ adlı yeni bir yöntem geliştirdi. Bu teknik, modellerin performansını artırırken hesaplama maliyetini minimum düzeyde tutuyor. ChatGPT ve benzeri büyük dil modellerinin özelleştirilmesi için kullanılan mevcut LoRA yöntemini geliştiren bu yaklaşım, daha az kaynak kullanarak daha iyi sonuçlar elde etmeyi mümkün kılıyor. GLUE benchmark testlerinde yapılan denemeler, yöntemin farklı model mimarilerinde tutarlı bir şekilde başarılı olduğunu gösterdi. Bu gelişme, yapay zeka modellerinin daha geniş kitlelere ve küçük şirketlere açılması açısından önemli bir adım olarak değerlendiriliyor.
Teknoloji & Yapay Zeka
Yapay Zeka Modellerinin 'Yalan Söylediği' Daha Doğru Tespit Edilebiliyor
Araştırmacılar, dil modellerinin yanlış bildiği cevapları verdiği durumları tespit etmek için geliştirilen doğrusal prob tekniklerinde önemli ilerlemeler kaydetti. Tek katman prob yöntemlerinin kırılgan yapısına karşı, çok katmanlı ensemble yaklaşımının çok daha güvenilir sonuçlar verdiği ortaya çıktı. Özellikle aldatıcı davranışların tespitinde, bu yeni yöntem bazı test alanlarında başarı oranını %78'e kadar artırdı. Ayrıca, model büyüklüğü arttıkça tespit doğruluğunun da paralel şekilde yükseldiği gözlemlendi. Bu bulgular, yapay zeka güvenliği ve aldatma karşıtı sistemler için kritik öneme sahip.
Teknoloji & Yapay Zeka
Çevrimiçi Oyunların Çöküş Mekanizması Matematiksel Modelle Açıklandı
Araştırmacılar, çok oyunculu online oyunların neden ve nasıl popülerliklerini kaybederek oynanmaz hale geldiğini açıklayan formal bir çerçeve geliştirdi. Çalışma, oyunların hayatta kalabilmesi için gerekli minimum oyuncu sayısını tanımlayan 'Kritik Kütle Eşiği' ve nostaljinin aktif katılımı geride bıraktığı 'Nostalji Dönüm Noktası' gibi matematiksel kavramlar sunuyor. Model, oyuncu tabanının azalması durumunda bekleme sürelerinin uzaması, eşleşme kalitesinin düşmesi ve oyun dengesinin bozulması gibi faktörlerin nasıl bir kısır döngü yarattığını gösteriyor. Bu araştırma, oyun endüstrisinin milyarlarca dolarlık yatırımlarını koruma stratejileri geliştirmesi açısından kritik öneme sahip.
Teknoloji & Yapay Zeka
Difüzyon Dil Modellerinde Öngörü Kararsızlığının Gizli Yüzü Ortaya Çıktı
Yapay zeka alanında yeni nesil büyük dil modelleri olan difüzyon dil modellerinin (DLM) beklenmedik bir sorunu keşfedildi. Araştırmacılar, bu modellerin aynı soruya farklı zamanlarda verdikleri yanıtların tutarsız olabildiğini, ancak geleneksel değerlendirme yöntemlerinin bu kararsızlığı maskelediğini ortaya koydu. Mevcut test sistemleri, binlerce örneğin ortalamasına bakarak modelin genel performansını ölçüyor, böylece bireysel örneklerdeki büyük farklılıklar gözden kaçıyor. Bu durum, aynı genel performansa sahip iki model konfigürasyonunun, tekil sorularda tamamen farklı davranabilmesi anlamına geliyor. Araştırma ekibi, her bir örneği ayrı ayrı inceleyerek modellerin ne kadar tutarsız olduğunu daha detaylı ölçen yeni bir değerlendirme sistemi geliştirdi.