“genelleme” için sonuçlar

Teknoloji & Yapay Zeka

21 Apr

Olay Kameraları Yapay Zeka Sistemlerini Daha Dayanıklı Hale Getiriyor

Yapay zeka sistemleri farklı ortamlarda çalıştırıldığında performans kaybı yaşar - bu 'alan kayması' sorunu gerçek dünya uygulamalarında büyük zorluk yaratır. Araştırmacılar bu soruna yenilikçi bir çözüm geliştirdi: eğitim sırasında olay kameralarından gelen ek bilgileri kullanarak normal RGB kameralarla çalışan daha güçlü sistemler yaratmak. Olay kameraları hareket halindeki nesnelerin değişimlerini algılayan özel sensörlerdir ve çevresel değişikliklere karşı daha dirençlidir. Yeni PEPR yöntemi, bu iki farklı veri türünün güçlü yanlarını birleştirerek, sadece normal kamerayla çalışsa bile çevresel değişikliklere daha dayanıklı yapay zeka modelleri üretiyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerinde 'Grokking' Fenomeninin Fizik Yasalarıyla Açıklanması

Yapay zeka araştırmacıları, derin öğrenme modellerinde yaşanan 'grokking' olayını - ezberleme durumundan genelleme yetisine ani geçiş - fizik yasalarıyla açıklayan yeni bir yöntem geliştirdi. TDU-OFC adlı bu teknik, gradyan verilerini çığ istatistiklerine dönüştürerek modellerin öğrenme sürecindeki kritik geçiş anlarını tespit ediyor. Transformer ve MLP modellerinde yapılan deneylerde, genelleme geçişinin tam olarak belirli bir boyutsal kritik noktada gerçekleştiği keşfedildi. Bu bulgu, yapay zekanın nasıl öğrendiğini anlamamızda önemli bir adım.

arXiv — Yoğun Madde Fiziği 0

Teknoloji & Yapay Zeka

21 Apr

Çok Modlu Yapay Zeka Modelleri Bilimsel Akıl Yürütmeyi Devrimleştirebilir

Araştırmacılar, metin, görsel ve diğer veri türlerini birleştiren çok modlu büyük dil modellerinin (MLLM) bilimsel akıl yürütme süreçlerini önemli ölçüde geliştirebileceğini savunuyor. Mevcut bilimsel akıl yürütme modellerinin farklı disiplinler arasında genelleme yapma konusundaki zorluklarına çözüm getiren bu teknoloji, matematik, fizik, kimya ve biyoloji gibi alanlarda mantık, kanıt ve eleştirel düşünmeyi entegre ederek bilimsel fenomenleri daha etkili şekilde analiz edebiliyor. Çalışma, bilimsel akıl yürütme yeteneklerinin gelişimi için dört aşamalı bir araştırma yol haritası öneriyor ve MLLM'lerin mevcut uygulamalarının çok modal algılama konusundaki avantajlarını vurguluyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Çoklu Görev Öğrenme İle Kontrol Sistemleri Daha Akıllı Hale Geliyor

Yapay zeka alanında önemli bir gelişme: Araştırmacılar, farklı kontrol görevlerini aynı anda öğrenebilen sistemler geliştirdi. Bu yeni yaklaşım, bir kontrolörün birden fazla farklı sistemi aynı anda yönetmesini sağlıyor. Çalışma, stokastik ve kısmen gözlemlenebilen kontrol sistemleri üzerine odaklanarak, Linear Kuadratik Gaussian (LQG) problemini ele alıyor. Geliştirilen yöntem, farklı sistem türleri arasında genelleme yapabilen ortak bir stabilize edici kontrolör öğrenmeyi hedefliyor. Bu, robotik, otonom araçlar ve endüstriyel otomasyon gibi alanlarda devrim yaratabilir.

arXiv (Matematik) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Geri Bildirimiyle Öğrenme Sistemi Müfredat Yaklaşımıyla Geliştirildi

Araştırmacılar, yapay zeka sistemlerinin insani değerlerle uyumlu davranışlar öğrenmesi için kullanılan RLAIF (AI Geri Bildirimiyle Pekiştirmeli Öğrenme) yöntemini geliştiren yeni bir yaklaşım sundular. Curriculum-RLAIF adı verilen bu sistem, ödül modellerinin genelleme yeteneğini artırarak AI'ların daha tutarlı ve güvenilir performans göstermesini sağlıyor. Mevcut sistemlerdeki temel sorunlar arasında dağılım kayması, tercih etiketlerindeki gürültü ve model kapasitesiyle uyumsuz zorlu örnekler bulunuyor. Yeni yaklaşım, bu sorunları veri zorluk seviyeleri perspektifinden ele alarak farklı güçlük derecelerinde tercih çiftleri oluşturuyor ve özel bir müfredat programı geliştiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri İçin Geliştirilen Probe Sistemlerinde Eğitim Verisi Sorunu

Büyük dil modellerinin zararlı davranışlarını tespit etmek için kullanılan probe sistemleri, eğitim verisi kaynaklarından önemli ölçüde etkileniyor. Araştırmacılar, doğal örneklerin az bulunması nedeniyle sentetik verilerle eğitim yapmak zorunda kalıyor ancak bu durum sistemlerin genelleme yeteneğini olumsuz etkiliyor. Çalışma, sekiz farklı yapay zeka davranışı üzerinde yapılan testlerde, özellikle stratejik aldatma gibi niyet temelli davranışlarda daha büyük başarısızlıklar yaşandığını ortaya koyuyor. Bu bulgular, AI güvenlik sistemlerinin geliştirilmesinde kritik bir açığa işaret ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

CoDial: Sohbet Robotları İçin Yorumlanabilir Yeni Çerçeve

Araştırmacılar, görev odaklı sohbet robotlarının farklı görevler arasında daha iyi genelleme yapabilmesi için CoDial adlı yeni bir çerçeve geliştirdi. Bu sistem, önceden tanımlanmış görev şemalarını yapılandırılmış grafiklere dönüştürerek daha yorumlanabilir ve etkili sohbet robotları oluşturmayı hedefliyor. Mevcut veri tabanlı yaklaşımların yeni görevlere uyum sağlama konusundaki zorluklarına çözüm getiren bu çalışma, yapay zeka destekli sohbet sistemlerinin nasıl çalıştığını daha anlaşılır kılıyor ve performanslarını artırıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Zayıf Gözetimle Nasıl Akıl Yürütmeyi Öğreniyor?

Büyük dil modelleri, doğrulanabilir ödül sistemleriyle pekiştirmeli öğrenme sayesinde akıl yürütme becerilerinde önemli ilerlemeler kaydetmiştir. Ancak modellerin yetenekleri geliştikçe, kaliteli ödül sinyalleri oluşturmak zorlaşmaktadır. Araştırmacılar, yetersiz veri, gürültülü ödüller ve kendini denetleyen vekil ödüller gibi zayıf gözetim koşullarında pekiştirmeli öğrenmenin ne zaman başarılı olabileceğini inceledi. Çalışma, genelleme yeteneğinin eğitim ödülü doygunluk dinamikleriyle yönetildiğini ortaya koyuyor. Başarılı modeller, eğitim ödülü ve performansın birlikte yükseldiği uzun bir doygunluk öncesi evre sergilerken, hızla doygunluğa ulaşan modeller öğrenmek yerine ezberliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Artık Birden Fazla Görevi Aynı Anda Öğrenebiliyor

Araştırmacılar, difüzyon modellerinin güçlü genelleme yeteneğinden faydalanarak çoklu görev öğreniminde çığır açan bir yöntem geliştirdi. StableMTL adı verilen bu sistem, her veri setinin yalnızca belirli görevler için etiketlendiği sentetik verilerle çalışabiliyor. Geleneksel yöntemlerin aksine, her görev için ayrı kayıp fonksiyonu yerine birleşik bir yaklaşım benimseyen sistem, görevler arası işbirliğini artıran dikkat mekanizması kullanıyor. Bu gelişme, yapay zeka modellerinin daha az veriyle daha çok şey öğrenmesine olanak tanıyarak, özellikle veri toplama maliyetlerinin yüksek olduğu alanlarda büyük avantaj sağlıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Küçük dil modelleri graf yapılarını ne kadar iyi anlayabiliyor?

Araştırmacılar, graf yapıları üzerinde özel olarak eğitilmiş küçük dil modellerinin genelleme yeteneklerini kapsamlı bir şekilde inceledi. 3-4 milyar parametreli modeller kullanılarak yapılan çalışmada, bu modellerin eğitim sırasında gördüklerinden çok daha büyük graf yapılarını analiz edebilme ve farklı graf ailelerindeki yapısal özellikleri tutarlı bir şekilde sıralayabilme becerileri test edildi. Sonuçlar, küçük dil modellerinin graf analizi konusunda beklenenin ötesinde başarılı olduğunu gösteriyor. Bu bulgu, büyük hesaplama kaynaklarına ihtiyaç duymadan graf analitiği yapabilen AI sistemlerinin geliştirilmesi açısından önemli.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Robotları Yeni Durumları Önceden Tahmin Ederek Öğreniyor

Araştırmacılar, robotların davranış taklidi yoluyla öğrenmesini geliştiren yeni bir yöntem geliştirdi. Geleneksel hedef-odaklı davranış klonlama yöntemleri, eğitim sırasında gördükleri görevlerde başarılı olsa da, yeni durum-hedef kombinasyonlarına genelleme yapamıyor. Yeni yaklaşım, zamana dayalı tutarlılığı artırarak robotların daha önce karşılaşmadıkları durumları da başarıyla çözebilmesini sağlıyor. BYOL-γ adı verilen bu teknik, kendini tahmin eden temsiller kullanarak successor representation yaklaşımını taklit ediyor ve kombinatoryal genelleme kapasitesini önemli ölçüde artırıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka modelleri çeviriyi nasıl öğreniyor? İki aşamalı süreç keşfedildi

Araştırmacılar, büyük dil modellerinin çok dilli yeteneklerini nasıl geliştirdiğini anlamak için 1,7 milyar parametreli bir modeli dokuz farklı dilde eğitti. Çalışma, modellerin çeviri becerilerini iki aşamada geliştirdiğini ortaya koydu: İlk aşamada kelime kopyalama ve yüzeysel benzerlikler hakimken, ikinci aşamada daha gelişmiş genelleme yetenekleri ortaya çıkıyor. Bu bulgular, yapay zekanın dil öğrenme süreçlerini anlamada önemli bir adım teşkil ediyor ve gelecekteki çok dilli AI sistemlerinin geliştirilmesinde yol gösterici olabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Görme Sistemlerinde Güvenlik Açıklarına Karşı Yeni Savunma Yöntemi

Büyük görme-dil modelleri (LVLM), multimodal saldırılara karşı savunmasız durumda. Mevcut koruma yöntemleri ya belirli saldırı türlerine odaklanıyor ya da çok fazla hesaplama gücü gerektiriyor. Araştırmacılar, bu modellerin kendi iç temsillerinden güvenlik sinyalleri çıkaran Temsili Karşıtsal Puanlama (RCS) adında yeni bir framework geliştirdi. Bu yaklaşım, güvenlik açısından kritik katmanlarda zararlı ve zararsız girişleri ayırmak için hafif bir projeksiyon öğreniyor. Böylece hem yeni tehditlere karşı genelleme yapabiliyor hem de pratik kullanım için verimli çalışıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Aşırı parametreli yapay sinir ağlarında genelleme sınırları yeniden tanımlandı

Araştırmacılar, eğitim verisi sayısından fazla parametreye sahip yapay sinir ağlarının neden başarılı sonuçlar verdiğini açıklayan yeni matematiksel sınırlar geliştirdi. Bu ağlar, teorik olarak aşırı öğrenme yapmaları beklenirken, pratikte mükemmel genelleme performansı sergiliyor. Çalışma, bu paradoksal durumu açıklamak için ağın başlangıç değerlerinden ne kadar uzaklaştığını ölçen yeni bir yaklaşım öneriyor. Geleneksel yöntemlerin aksine, bu yeni teknik 'path-norm' adı verilen bir ölçüm kullanarak daha gerçekçi sınırlar belirliyor. Araştırma, özellikle tek katmanlı yapay sinir ağları için geçerli olan bu bulgular, makine öğrenmesinin temel teorilerini yeniden şekillendirme potansiyeli taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Robotlarda Temel Modeller: Yapay Zekâ ile Robot Evriminin Kapsamlı Haritası

Robotik alanı büyük bir dönüşüm yaşıyor. Tek görevli, sabit robotlardan çok fonksiyonlu, genel amaçlı ajanlar yaratma yolunda ilerleyen bu alan, Temel Modeller (Foundation Models) sayesinde devrim niteliğinde gelişmeler kaydediyor. Bu büyük ölçekli yapay sinir ağları, çok modlu anlama, uzun vadeli planlama ve farklı robot türleri arasında genelleme yapabilme kabiliyetleri sunuyor. Yeni kapsamlı inceleme, robotik alanında Temel Modellerin kullanımını beş farklı araştırma evresi üzerinden değerlendiriyor. Doğal dil işleme ve bilgisayarlı görme modellerinin robotikle entegrasyonundan başlayarak günümüzün gelişmiş sistemlerine kadar uzanan bu süreç, robotların karmaşık, değişken ortamlarda çalışabilir hale gelmesini sağlıyor. Bu teknolojik ilerleme, robotları dar uzmanlık alanlarından çıkarıp günlük yaşamda daha etkili asistanlar haline getirme potansiyeli taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Federe Öğrenmede Yeni Yaklaşım: Metinsel Anlambilimin Gücüyle Daha İyi Prototipler

Yapay zeka alanında federe öğrenme sistemlerinin karşılaştığı veri heterojenliği sorunu için yeni bir çözüm geliştirildi. Araştırmacılar, farklı cihazlardaki verilerin çeşitliliğinden kaynaklanan performans kayıplarını azaltmak amacıyla protip tabanlı öğrenme yöntemini geliştirdi. Bu yaklaşım, sınıflar arası mesafeyi artırarak ayrımı güçlendirmeye odaklanan mevcut yöntemlerin aksine, sınıflar arasındaki anlamsal ilişkileri korumaya öncelik veriyor. Çalışma, sadece prototiplerin birbirinden uzaklığını artırmanın yeterli olmadığını, bunun yerine sınıfların doğal anlamsal bağlantılarını muhafaza etmenin model genelleme kabiliyeti için kritik önem taşıdığını ortaya koyuyor. Bu keşif, federe öğrenme sistemlerinde daha etkili öğrenme stratejilerinin geliştirilmesi yolunda önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Öğrenme Algoritmalarında Yeni Verimlilik Atılımı

Araştırmacılar, büyük ölçekli makine öğrenmesi için geleneksel kernel SGD algoritmalarının verimliliğini artıran yenilikçi bir yöntem geliştirdi. Yeni algoritma, sonsuz seri açılımları kullanarak stokastik gradyanı sonlu boyutlu bir uzaya projekte ediyor ve bias-varyans dengesine göre adaptif ölçekleme yapıyor. Bu yaklaşım, hem optimizasyon hem de genelleme performansını iyileştiriyor. Kernel tabanlı kovaryans operatörünün spektral yapısını yeniden analiz eden çalışma, son iterasyon ve sonek ortalamasının minimax-optimal hızlarda yakınsadığını matematiksel olarak kanıtlıyor. Reproducing kernel Hilbert uzayında optimal güçlü yakınsama da sağlanan bu yöntem, yapay zeka alanında büyük veri setlerinin işlenmesinde önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Gizlilik Korumalı Yapay Zeka Algoritmalarında Yeni Hata Sınır Yöntemi

Araştırmacılar, makine öğrenmesinde gizlilik koruma ile genelleme performansı arasındaki dengeyi daha iyi anlamamızı sağlayacak yeni bir matematiksel yaklaşım geliştirdi. Çalışma, diferansiyel gizlilik kullanan algoritmaların ne kadar iyi genelleme yapabileceğini tahmin etmek için bilgi teorisi ve tipiklik kavramlarını birleştiriyor. Bu yöntem, özellikle kişisel verilerle çalışan yapay zeka sistemlerinde kritik önem taşıyor. Araştırmacılar, mevcut sınırları önemli ölçüde geliştiren ve hesaplaması kolay formüller sunarak, gizli verilerin güvenliğini korurken algoritma performansını optimize etme konusunda yeni olanaklar açıyor. Bu gelişme, sağlık, finans ve sosyal medya gibi hassas veri alanlarında çalışan yapay zeka sistemleri için büyük pratik değer taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

3D Görme-Dil Modelleri İçin Yeni Prompt Ayarlama Yöntemi Geliştirildi

Araştırmacılar, 3D nokta bulutlarını anlayan yapay zeka modelleri için yeni bir eğitim yöntemi geliştirdi. P³T adlı bu yöntem, büyük 3D görme-dil modellerini farklı görevlere uyarlarken hem hesaplama maliyetini düşürüyor hem de genelleme kabiliyetini artırıyor. Geleneksel yöntemler tüm modeli yeniden eğitmek zorunda kalırken, P³T sadece küçük prompt bileşenlerini ayarlayarak aynı başarıyı elde ediyor. Bu yaklaşım, 3D nesne tanıma, sahne anlama ve robotik uygulamalarda önemli avantajlar sunuyor. Özellikle overfitting sorununu çözerek modellerin yeni veriler üzerindeki performansını iyileştiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Ağları Ne Zaman Daha Hızlı Çalışır? Yeni Teori Yanıt Arıyor

Erken çıkış yapay sinir ağları, güvenli tahminlerde ara katmanlardan çıkarak hesaplama hızını 2-8 kat artırabiliyor. Bu teknoloji yaygın kullanılmasına rağmen, genelleme yetenekleri teorik olarak tam anlaşılamamıştı. Yeni araştırma, bu ağların ne zaman ve neden başarılı olduğunu açıklayan ilk kapsamlı teorik çerçeveyi sunuyor. PAC-Bayesian yaklaşımıyla geliştirilen yeni sınırlar, maksimum derinlik yerine çıkış derinliği entropisi ve beklenen derinliğe dayalı formüller içeriyor. Çalışma, uyarlanabilir derinlikteki ağların sabit derinliklilere göre üstün olduğu koşulları matematiksel olarak ispatlamış durumda.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

EVIL: Büyük Dil Modelleri ile Kendi Kendine Gelişen Algoritmaların Keşfi

Araştırmacılar, büyük dil modellerinin rehberliğinde evrimsel arama kullanarak basit ve anlaşılır algoritmalar keşfeden EVIL adlı yeni bir yaklaşım geliştirdi. Bu sistem, büyük veri setleri üzerinde sinir ağları eğitmek yerine, farklı veri setlerinde sıfır-atışlı çıkarım yapabilen saf Python/NumPy programları evrimleştiriyor. Sistem üç farklı alanda test edildi: zamansal nokta süreçlerinde bir sonraki olayı tahmin etme, Markov atlama süreçleri için oran matrisi tahmini ve zaman serisi tamamlama. Her durumda, evrimleşen tek bir algoritma tüm değerlendirme veri setlerinde veri seti başına özel eğitime ihtiyaç duymadan genelleme başarısı gösterdi. Bu çalışma, LLM destekli program evriminin dinamik sistemler problemleri için tek bir kompakt çıkarım fonksiyonu keşfedebileceğini gösteren ilk araştırma olma özelliği taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

Yapay Zeka 'Grokking' Gizeminin Çözümü: Problem Encoder-Decoder Darboğazında

Araştırmacılar, yapay zeka modellerinin matematik problemlerini çözerken yaşadığı 'grokking' fenomeninin nedenini keşfetti. Transformer modellerin eğitim verilerini öğrendikten sonra genelleme yapabilmesi arasında geçen uzun sürenin, bilgiyi işleyen encoder bölümünün öğrendiği yapıyı decoder bölümüne aktaramamasından kaynaklandığı ortaya çıktı. MIT araştırmacıları Collatz tahmin problemini kullanarak yaptıkları deneylerde, encoder'ın sayısal yapıları binlerce adımda öğrendiğini ancak çıktı doğruluğunun on binlerce adım boyunca şans seviyesinde kaldığını gözlemledi. Bu bulgular, AI modellerinin öğrenme süreçlerinin daha iyi anlaşılması ve optimize edilmesi açısından kritik önem taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

Yapay Zeka Modelleri İnsan Gibi Bilişsel Esneklik Kazanabilir mi?

Araştırmacılar, insanların farklı görevler arasında geçiş yapma yeteneği olan bilişsel esnekliği yapay zeka modellerinde nasıl geliştirebileceğini inceledi. Çalışma, çok görevli öğrenme ortamlarında görev yapısının ve çevre koşullarının bilişsel esneklik üzerindeki etkisini araştırıyor. Önceki bilgileri korurken (bilişsel kararlılık) yeni görevlere de aktarabilme (bilişsel genelleme) kabiliyeti, hem insanlar hem de yapay zeka sistemleri için kritik öneme sahip. Araştırmada graf teorisi yöntemleri kullanılarak tasarlanan özel öğrenme ortamında, dikkat tabanlı modellerin görevleri bileşenlerine ayırabildiği ve sıralı dikkat mekanizmaları geliştirebileceği gösterildi. Bu bulgular, gelecekteki yapay zeka sistemlerinin daha esnek ve adaptif olmasına katkı sağlayabilir.

arXiv (CS + AI) 1