“genelleme” için sonuçlar

Teknoloji & Yapay Zeka

21 Apr

Yapay Sinir Ağları Kendiliğinden Dil Bilgisi Kuralları Geliştirdi

Araştırmacılar, sadece 18.658 parametreli küçük bir yapay sinir ağının, herhangi bir dil bilgisi kuralı öğretilmeden kendiliğinden söz dizimi işleme yeteneği geliştirebildiğini keşfetti. İki boyutlu hücresel otomat şeklinde tasarlanan bu sistem, yalnızca basit bir sınır sinyali ile eğitildikten sonra, matematiksel ifadelerin dil bilgisi yapısını anlayabilecek düzeyde organize oldu. Sistem, eğitim verilerinin ötesinde genelleme yapabiliyor ve dil bilgisi yapısıyla %71 oranında uyumlu bir iç organizasyon sergilemeyi başarıyor. Bu bulgu, karmaşık dil işleme yeteneklerinin nasıl ortaya çıkabileceği konusunda önemli ipuçları sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Küçük dil modelleri graf yapılarını ne kadar iyi anlayabiliyor?

Araştırmacılar, graf yapıları üzerinde özel olarak eğitilmiş küçük dil modellerinin genelleme yeteneklerini kapsamlı bir şekilde inceledi. 3-4 milyar parametreli modeller kullanılarak yapılan çalışmada, bu modellerin eğitim sırasında gördüklerinden çok daha büyük graf yapılarını analiz edebilme ve farklı graf ailelerindeki yapısal özellikleri tutarlı bir şekilde sıralayabilme becerileri test edildi. Sonuçlar, küçük dil modellerinin graf analizi konusunda beklenenin ötesinde başarılı olduğunu gösteriyor. Bu bulgu, büyük hesaplama kaynaklarına ihtiyaç duymadan graf analitiği yapabilen AI sistemlerinin geliştirilmesi açısından önemli.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

CoDial: Sohbet Robotları İçin Yorumlanabilir Yeni Çerçeve

Araştırmacılar, görev odaklı sohbet robotlarının farklı görevler arasında daha iyi genelleme yapabilmesi için CoDial adlı yeni bir çerçeve geliştirdi. Bu sistem, önceden tanımlanmış görev şemalarını yapılandırılmış grafiklere dönüştürerek daha yorumlanabilir ve etkili sohbet robotları oluşturmayı hedefliyor. Mevcut veri tabanlı yaklaşımların yeni görevlere uyum sağlama konusundaki zorluklarına çözüm getiren bu çalışma, yapay zeka destekli sohbet sistemlerinin nasıl çalıştığını daha anlaşılır kılıyor ve performanslarını artırıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Robotları Yeni Durumları Önceden Tahmin Ederek Öğreniyor

Araştırmacılar, robotların davranış taklidi yoluyla öğrenmesini geliştiren yeni bir yöntem geliştirdi. Geleneksel hedef-odaklı davranış klonlama yöntemleri, eğitim sırasında gördükleri görevlerde başarılı olsa da, yeni durum-hedef kombinasyonlarına genelleme yapamıyor. Yeni yaklaşım, zamana dayalı tutarlılığı artırarak robotların daha önce karşılaşmadıkları durumları da başarıyla çözebilmesini sağlıyor. BYOL-γ adı verilen bu teknik, kendini tahmin eden temsiller kullanarak successor representation yaklaşımını taklit ediyor ve kombinatoryal genelleme kapasitesini önemli ölçüde artırıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Görme Sistemlerinde Güvenlik Açıklarına Karşı Yeni Savunma Yöntemi

Büyük görme-dil modelleri (LVLM), multimodal saldırılara karşı savunmasız durumda. Mevcut koruma yöntemleri ya belirli saldırı türlerine odaklanıyor ya da çok fazla hesaplama gücü gerektiriyor. Araştırmacılar, bu modellerin kendi iç temsillerinden güvenlik sinyalleri çıkaran Temsili Karşıtsal Puanlama (RCS) adında yeni bir framework geliştirdi. Bu yaklaşım, güvenlik açısından kritik katmanlarda zararlı ve zararsız girişleri ayırmak için hafif bir projeksiyon öğreniyor. Böylece hem yeni tehditlere karşı genelleme yapabiliyor hem de pratik kullanım için verimli çalışıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Zayıf Gözetimle Nasıl Akıl Yürütmeyi Öğreniyor?

Büyük dil modelleri, doğrulanabilir ödül sistemleriyle pekiştirmeli öğrenme sayesinde akıl yürütme becerilerinde önemli ilerlemeler kaydetmiştir. Ancak modellerin yetenekleri geliştikçe, kaliteli ödül sinyalleri oluşturmak zorlaşmaktadır. Araştırmacılar, yetersiz veri, gürültülü ödüller ve kendini denetleyen vekil ödüller gibi zayıf gözetim koşullarında pekiştirmeli öğrenmenin ne zaman başarılı olabileceğini inceledi. Çalışma, genelleme yeteneğinin eğitim ödülü doygunluk dinamikleriyle yönetildiğini ortaya koyuyor. Başarılı modeller, eğitim ödülü ve performansın birlikte yükseldiği uzun bir doygunluk öncesi evre sergilerken, hızla doygunluğa ulaşan modeller öğrenmek yerine ezberliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

SFTMix: Yapay zeka modellerini daha verimli eğitmenin yeni yolu

Büyük dil modellerinin talimat takip etme yeteneklerini geliştirmek için kullanılan geleneksel yöntemler genellikle yüksek kaliteli veri setlerine ve pahalı insan müdahalesine ihtiyaç duyar. Araştırmacılar, SFTMix adını verdikleri yenilikçi bir yaklaşım geliştirdi. Bu yöntem, modelin öğrenme sürecinde farklı güven seviyelerindeki örnekleri akıllıca harmanlayarak, özel olarak hazırlanmış veri setlerine bağımlılığı azaltıyor. Model eğitiminde aşırı öğrenme ve genelleme sorunlarını çözmek için dinamik bir strateji benimseyen bu teknik, yapay zeka modellerinin performansını artırırken maliyetleri düşürüyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Çok Modlu Yapay Zeka Modelleri Bilimsel Akıl Yürütmeyi Devrimleştirebilir

Araştırmacılar, metin, görsel ve diğer veri türlerini birleştiren çok modlu büyük dil modellerinin (MLLM) bilimsel akıl yürütme süreçlerini önemli ölçüde geliştirebileceğini savunuyor. Mevcut bilimsel akıl yürütme modellerinin farklı disiplinler arasında genelleme yapma konusundaki zorluklarına çözüm getiren bu teknoloji, matematik, fizik, kimya ve biyoloji gibi alanlarda mantık, kanıt ve eleştirel düşünmeyi entegre ederek bilimsel fenomenleri daha etkili şekilde analiz edebiliyor. Çalışma, bilimsel akıl yürütme yeteneklerinin gelişimi için dört aşamalı bir araştırma yol haritası öneriyor ve MLLM'lerin mevcut uygulamalarının çok modal algılama konusundaki avantajlarını vurguluyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Geri Bildirimiyle Öğrenme Sistemi Müfredat Yaklaşımıyla Geliştirildi

Araştırmacılar, yapay zeka sistemlerinin insani değerlerle uyumlu davranışlar öğrenmesi için kullanılan RLAIF (AI Geri Bildirimiyle Pekiştirmeli Öğrenme) yöntemini geliştiren yeni bir yaklaşım sundular. Curriculum-RLAIF adı verilen bu sistem, ödül modellerinin genelleme yeteneğini artırarak AI'ların daha tutarlı ve güvenilir performans göstermesini sağlıyor. Mevcut sistemlerdeki temel sorunlar arasında dağılım kayması, tercih etiketlerindeki gürültü ve model kapasitesiyle uyumsuz zorlu örnekler bulunuyor. Yeni yaklaşım, bu sorunları veri zorluk seviyeleri perspektifinden ele alarak farklı güçlük derecelerinde tercih çiftleri oluşturuyor ve özel bir müfredat programı geliştiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Artık Birden Fazla Görevi Aynı Anda Öğrenebiliyor

Araştırmacılar, difüzyon modellerinin güçlü genelleme yeteneğinden faydalanarak çoklu görev öğreniminde çığır açan bir yöntem geliştirdi. StableMTL adı verilen bu sistem, her veri setinin yalnızca belirli görevler için etiketlendiği sentetik verilerle çalışabiliyor. Geleneksel yöntemlerin aksine, her görev için ayrı kayıp fonksiyonu yerine birleşik bir yaklaşım benimseyen sistem, görevler arası işbirliğini artıran dikkat mekanizması kullanıyor. Bu gelişme, yapay zeka modellerinin daha az veriyle daha çok şey öğrenmesine olanak tanıyarak, özellikle veri toplama maliyetlerinin yüksek olduğu alanlarda büyük avantaj sağlıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Lizard: Büyük Dil Modellerini Hızlandıran Yenilikçi Çerçeve Geliştirildi

Araştırmacılar, ChatGPT benzeri büyük dil modellerinin en büyük sorunlarından birini çözen Lizard adlı yenilikçi bir çerçeve geliştirdi. Transformer mimarisindeki büyük dil modelleri, uzun metinlerle çalışırken kvadratik karmaşıklık nedeniyle ciddi hesaplama ve bellek darboğazları yaşıyor. Lizard, önceden eğitilmiş modelleri subkuadratik mimarilere dönüştürerek bu sorunu çözüyor. Geleneksel softmax attention mekanizmasının yerini alan yeni yaklaşım, model kalitesini korurken hesaplama maliyetini önemli ölçüde düşürüyor. Önceki doğrusallaştırma yöntemlerinden farklı olarak, Lizard adaptive bellek kontrolü sağlayan öğrenilebilir modüller içeriyor ve uzun dizilerde daha iyi genelleme yapabiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Çoklu Görev Öğrenme İle Kontrol Sistemleri Daha Akıllı Hale Geliyor

Yapay zeka alanında önemli bir gelişme: Araştırmacılar, farklı kontrol görevlerini aynı anda öğrenebilen sistemler geliştirdi. Bu yeni yaklaşım, bir kontrolörün birden fazla farklı sistemi aynı anda yönetmesini sağlıyor. Çalışma, stokastik ve kısmen gözlemlenebilen kontrol sistemleri üzerine odaklanarak, Linear Kuadratik Gaussian (LQG) problemini ele alıyor. Geliştirilen yöntem, farklı sistem türleri arasında genelleme yapabilen ortak bir stabilize edici kontrolör öğrenmeyi hedefliyor. Bu, robotik, otonom araçlar ve endüstriyel otomasyon gibi alanlarda devrim yaratabilir.

arXiv (Matematik) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerinde 'Grokking' Fenomeninin Fizik Yasalarıyla Açıklanması

Yapay zeka araştırmacıları, derin öğrenme modellerinde yaşanan 'grokking' olayını - ezberleme durumundan genelleme yetisine ani geçiş - fizik yasalarıyla açıklayan yeni bir yöntem geliştirdi. TDU-OFC adlı bu teknik, gradyan verilerini çığ istatistiklerine dönüştürerek modellerin öğrenme sürecindeki kritik geçiş anlarını tespit ediyor. Transformer ve MLP modellerinde yapılan deneylerde, genelleme geçişinin tam olarak belirli bir boyutsal kritik noktada gerçekleştiği keşfedildi. Bu bulgu, yapay zekanın nasıl öğrendiğini anlamamızda önemli bir adım.

arXiv — Yoğun Madde Fiziği 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerini Eğitmenin Yeni Yolu: Bi-LoRA Tekniği Geliştirildi

Araştırmacılar, büyük yapay zeka modellerini daha verimli şekilde eğitmek için Bi-LoRA adlı yeni bir teknik geliştirdi. Bu yöntem, modellerin genelleme yeteneğini artıran SAM algoritmasının yüksek bellek ve hesaplama maliyeti sorununu çözüyor. Geleneksel LoRA yönteminin sınırlı alt uzayda çalışma problemi, ikinci bir yardımcı modül ekleyerek aşılıyor. Bi-LoRA, ana modülün görev odaklı öğrenme yaparken yardımcı modülün SAM'in adversarial pertürbasyonlarını yakalamasını sağlıyor. Bu yaklaşım, büyük dil modellerinin sınırlı veriyle eğitilmesinde karşılaşılan genelleme problemlerine çözüm sunuyor. Özellikle parametre-verimli ince ayar yapılması gereken büyük ölçekli modeller için umut verici sonuçlar gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Hakemlerinin Raf Ömrü Sorunu: Gelecek Modellere Hazır mı?

Yapay zeka sistemlerinin değerlendirilmesinde kritik rol oynayan 'LLM-hakem' modelleri, günümüzde yaygın olarak kullanılıyor. Araştırmacılar, özel verilerle eğitilmiş hakem modellerin daha küçük boyutlarda bile büyük modelleri geçtiğini ve önyargılara karşı daha dayanıklı olduğunu keşfetti. Ancak yeni bir çalışma, bu hakemlerin gerçek dünyada karşılaştığı üç kritik sorunu ortaya koyuyor: gelecekteki yeni modelleri değerlendirebilme kapasitesi, eski modellere uyumluluk ve daha önce görmediği sorulara genelleme yetisi. Bu araştırma, yapay zeka değerlendirmesinde sürdürülebilirlik ve uzun vadeli performans açısından önemli bulgular sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri İçin Geliştirilen Probe Sistemlerinde Eğitim Verisi Sorunu

Büyük dil modellerinin zararlı davranışlarını tespit etmek için kullanılan probe sistemleri, eğitim verisi kaynaklarından önemli ölçüde etkileniyor. Araştırmacılar, doğal örneklerin az bulunması nedeniyle sentetik verilerle eğitim yapmak zorunda kalıyor ancak bu durum sistemlerin genelleme yeteneğini olumsuz etkiliyor. Çalışma, sekiz farklı yapay zeka davranışı üzerinde yapılan testlerde, özellikle stratejik aldatma gibi niyet temelli davranışlarda daha büyük başarısızlıklar yaşandığını ortaya koyuyor. Bu bulgular, AI güvenlik sistemlerinin geliştirilmesinde kritik bir açığa işaret ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

ACE-Router: Yapay Zeka Ajanlarının İnternet Trafiğini Yönetecek Yeni Sistem

Araştırmacılar, yapay zeka ajanlarının oluşturduğu karmaşık ağ sistemlerinde navigasyonu optimize eden ACE-Router adlı yenilikçi bir sistem geliştirdi. Model Context Protocol (MCP) araçlarından yola çıkarak tasarlanan bu sistem, büyük ölçekli ajan ekosistemlerinde hassas yönlendirme yapabilen tarih-farkında yönlendiriciler eğitiyor. Sistem, çok turlu etkileşim senaryolarını sentezleyerek dinamik bağlam anlayışına sahip hafif yönlendirme ajanları oluşturuyor. Gerçek dünya testlerinde üstün performans gösteren ACE-Router, gelecekteki Ajan Web'inin temel özelliklerini sergiliyor: minimal adaptasyonla çoklu ajan işbirliğine genelleme yapabiliyor, gürültüye karşı sağlamlık gösteriyor ve büyük ölçekli sistemlerde etkili çalışıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerinin Farklı Veri Türlerine Adaptasyonunda Yeni Çözüm

Araştırmacılar, önceden eğitilmiş yapay zeka modellerinin yeni veri türlerine uyarlanmasında karşılaşılan temel soruna çözüm getiren yenilikçi bir framework geliştirdi. Çalışma, özellik hizalama ve hedef odaklı ince ayar arasındaki kritik etkileşimi teorik olarak açıklıyor. Bu yaklaşım, farklı disiplinlerden gelen verilerin entegrasyonunu daha etkili hale getirerek, AI modellerinin çok modalı ortamlarda daha başarılı performans göstermesini sağlıyor. Geliştirilen yöntem, model genelleme hatası için kanıtlanabilir sınırlar belirleyerek, özellik-etiket bozulma kavramıyla bu karmaşık süreci açıklığa kavuşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Ses-dil modellerinde genelleme sorunu çözüldü: SEPT yöntemi geliştirildi

Araştırmacılar, ses-dil modellerinde prompt tuning yönteminin genelleme kabiliyetini artıran yeni bir framework geliştirdi. Semantically Expanded Prompt Tuning (SEPT) adlı bu yöntem, modellerin yeni ses kategorilerini tanımadaki Base-New Tradeoff sorununu çözüyor. SEPT, büyük dil modellerinin ürettiği semantik komşuları kullanarak prompt embedding uzayını düzenler ve sınıf içi sıkılık ile sınıflar arası ayrılabilirliği artırır. Bu breakthrough, ses tanıma sistemlerinin daha esnek ve genel amaçlı hale gelmesini sağlayarak, müzik analizi, konuşma tanıma ve çevresel ses sınıflandırma gibi alanlarda önemli ilerlemeler vaat ediyor.

arXiv (CS + AI) 0

Matematik

21 Apr

Matematikçiler Fizik ve Cebir Arasında Yeni Köprüler Kuruyor

Matematikçiler, fizikteki Hamiltonian mekaniği ile cebir teorisi arasında yeni bağlantılar keşfediyor. 'Lie Quandle' adı verilen bu yeni yapılar, klasik Lie cebirlerinin doğrusal olmayan genellemelerini temsil ediyor. Araştırmacılar, bu yapıların simetri ve korunumluluk yasalarını açıklayan Noether teoreminin doğrusal olmayan versiyonlarına nasıl yol açabileceğini inceliyor. Bu çalışma, teorik fizikte simetrilerin rolünü daha iyi anlamamıza yardımcı olabilir ve matematiksel fizikteki temel kavramları yeniden tanımlama potansiyeli taşıyor.

arXiv (Matematik) 0

Matematik

21 Apr

Matematikçiler Asal Dereceli Döngüsel Yapıların Gizli Özelliklerini Keşfetti

Türk araştırmacılar, matematik dünyasında 'üçlü tutarlı konfigürasyonlar' olarak bilinen karmaşık yapıların özelliklerini inceledi. Bu yapılar, hem çok boyutlu tutarlı konfigürasyonların özel bir durumu hem de üçlü ilişki şemalarının doğal bir genellemesi olarak karşımıza çıkıyor. Çalışma, asal sayı derecesine sahip döngüsel üçlü tutarlı konfigürasyonların neredeyse tamamının 'schurian' özelliği taşıdığını matematiksel olarak kanıtlıyor. Bu keşif, kombinatorik ve cebir alanlarında önemli teorik sonuçlar doğurabileceği gibi, gelecekteki araştırmalara da yön verecek nitelikte.

arXiv (Matematik) 0

Teknoloji & Yapay Zeka

21 Apr

Olay Kameraları Yapay Zeka Sistemlerini Daha Dayanıklı Hale Getiriyor

Yapay zeka sistemleri farklı ortamlarda çalıştırıldığında performans kaybı yaşar - bu 'alan kayması' sorunu gerçek dünya uygulamalarında büyük zorluk yaratır. Araştırmacılar bu soruna yenilikçi bir çözüm geliştirdi: eğitim sırasında olay kameralarından gelen ek bilgileri kullanarak normal RGB kameralarla çalışan daha güçlü sistemler yaratmak. Olay kameraları hareket halindeki nesnelerin değişimlerini algılayan özel sensörlerdir ve çevresel değişikliklere karşı daha dirençlidir. Yeni PEPR yöntemi, bu iki farklı veri türünün güçlü yanlarını birleştirerek, sadece normal kamerayla çalışsa bile çevresel değişikliklere daha dayanıklı yapay zeka modelleri üretiyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Aşırı parametreli yapay sinir ağlarında genelleme sınırları yeniden tanımlandı

Araştırmacılar, eğitim verisi sayısından fazla parametreye sahip yapay sinir ağlarının neden başarılı sonuçlar verdiğini açıklayan yeni matematiksel sınırlar geliştirdi. Bu ağlar, teorik olarak aşırı öğrenme yapmaları beklenirken, pratikte mükemmel genelleme performansı sergiliyor. Çalışma, bu paradoksal durumu açıklamak için ağın başlangıç değerlerinden ne kadar uzaklaştığını ölçen yeni bir yaklaşım öneriyor. Geleneksel yöntemlerin aksine, bu yeni teknik 'path-norm' adı verilen bir ölçüm kullanarak daha gerçekçi sınırlar belirliyor. Araştırma, özellikle tek katmanlı yapay sinir ağları için geçerli olan bu bulgular, makine öğrenmesinin temel teorilerini yeniden şekillendirme potansiyeli taşıyor.

arXiv (CS + AI) 0

Matematik

21 Apr

Matematikçiler Bölen Fonksiyonları İçin Yeni Genelleme Geliştirdi

Matematik alanında sayı teorisi uzmanları, Piatetski-Shapiro dizileri üzerindeki bölen fonksiyonları için önemli bir genelleme çalışması gerçekleştirdi. Bu araştırma, bir sayının kaç farklı şekilde iki doğal sayının çarpımı olarak yazılabileceğini inceleyen bölen problemini daha geniş bir perspektiften ele alıyor. Çalışma, özel bölen fonksiyonlarını kapsayan genel sonuçlar sunarak, sayı teorisindeki klasik problemlere modern bir yaklaşım getiriyor. Araştırmacılar ayrıca bu aritmetik fonksiyonları aritmetik diziler üzerinde de inceleyerek çalışmalarının kapsamını genişletmiş durumda.

arXiv (Matematik) 0