“genelleme” için sonuçlar

Teknoloji & Yapay Zeka

6 gün önce

Yapay Zeka Mantık Yürütmeyi Nasıl Öğreniyor? Transformer Modellerde Yeni Keşif

Araştırmacılar, transformer tabanlı yapay zeka modellerinin mantıksal çıkarım yeteneklerini inceledi. Çalışmada, "A, B'den büyük; B, C'den büyük; o halde A, C'den büyük" türü geçişli mantık yürütme davranışı analiz edildi. İki farklı öğrenme türü karşılaştırıldı: model ağırlıklarına gömülü öğrenme ve bağlam içi öğrenme. Bulgular, bu iki yaklaşımın tamamen farklı stratejiler geliştirdiğini gösterdi. Ağırlık tabanlı öğrenen modeller, insanlar ve hayvanlarınkine benzer doğrusal ilişki haritaları oluştururken, bağlam içi öğrenen modeller genellikle ezberleme stratejisi benimsiyor. Ancak eğitim verileri geçişli çıkarımı gerektirdiğinde, bu modeller de mantıksal genelleme yapabiliyorlar. Araştırma, yapay zeka sistemlerinin akıl yürütme mekanizmalarını anlamak açısından önemli ipuçları sunuyor.

arXiv (Nörobilim) 0

Kimya

6 gün önce

GNN Tabanlı Moleküler Dinamik Simülatörlerde Yapı-Odaklı İlk Başlatma Yöntemi

Araştırmacılar, graf sinir ağlarına (GNN) dayalı moleküler dinamik simülatörlerinin temel sınırlarını aşan yeni bir yaklaşım geliştirdi. Geleneksel GNN simülatörleri, doğru tahmin yapabilmek için geçmiş zaman verilerine ihtiyaç duyar, bu da malzeme tasarımında kritik olan ters tasarım uygulamalarında kullanımlarını kısıtlar. Yeni yöntem, simülasyonları tek bir statik yapısal konfigürasyondan başlatabilmeyi mümkün kılıyor. Ayrıca, adayların genellikle eğitim verisi dışında kalan durumlarla başa çıkabilmek için güçlü genelleme yeteneği de sunuyor. Bu gelişme, karmaşık moleküler sistemlerin daha verimli modellenebilmesinin yanı sıra, malzeme tasarımında devrim yaratabilecek farklılaşabilirlik özelliğini de koruyor.

arXiv — Kimyasal Fizik 0

Teknoloji & Yapay Zeka

8 May

Güç Sistemleri için Yapay Zeka Destekli Dijital İkiz Teknolojisi

Elektrik güç sistemleri, farklı zaman ölçeklerinde işleyen karmaşık yapılardır. Araştırmacılar, bu sistemlerin daha verimli yönetimi için yapay zeka ve makine öğrenmesi teknolojilerini birleştiren yeni nesil dijital ikiz modelleri öneriyorlar. 'Foundation Twins' adı verilen bu yaklaşım, temel yapay zeka modellerinin genelleme yetenekleriyle pekiştirmeli öğrenme algoritmalarının karar verme kapasitesini harmanlıyor. Geleneksel dijital ikiz teknolojileri henüz güç sistemlerinde beklenen performansı gösteremezken, bu yeni yaklaşım farklı coğrafi kapsamlar ve zaman dilimlerinde daha hızlı ve doğru karar alma süreçleri vaat ediyor. Enerji sektöründeki dijital dönüşüm için kritik öneme sahip olan bu teknoloji, elektrik şebekelerinin daha akıllı ve verimli yönetilmesine olanak sağlayabilir.

arXiv — Bilgisayar Sistemleri 0

Teknoloji & Yapay Zeka

4 May

Yapay zeka ajanları artık kendi kendine makine öğrenmesi yapabiliyor

Araştırmacılar, büyük dil modeli tabanlı ajanların makine öğrenmesi görevlerini tamamen özerk şekilde gerçekleştirebilmesi için yeni bir yaklaşım geliştirdi. ML-Agent adı verilen bu sistem, geleneksel prompt tabanlı yöntemlerin aksine, pekiştirmeli öğrenme ile deneyimlerinden öğrenerek gelişiyor. Küçük modellerin genelleme yeteneği eksikliği ve büyük modellerin yüksek maliyeti sorunlarına çözüm getiren bu yaklaşım, yapay zeka ajanlarının makine öğrenmesi projelerini baştan sona yönetebilmesini sağlıyor. Sistem, çeşitli eylemler üretebilen keşif odaklı ince ayar, adım adım pekiştirmeli öğrenme ve deneyim toplama hızlandırma gibi yenilikçi bileşenler içeriyor. Bu gelişme, yapay zeka destekli otonom makine öğrenmesi mühendisliğinde önemli bir dönüm noktası olarak değerlendiriliyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

4 May

Yapay zeka modellerinin aşırı güvensizliği çözüldü: ADVICE yöntemi

Büyük dil modelleri doğal dilde güven seviyelerini ifade edebiliyor ancak sistematik olarak aşırı güvenli davranıyorlar. Stanford araştırmacıları bu sorunun temel nedenini keşfetti: modeller güven tahminlerini kendi verdikleri cevaptan bağımsız yapıyor. Geliştirilen ADVICE yöntemi, modellerin güven seviyelerini kendi cevaplarına dayandırmasını sağlayarak bu sorunu çözüyor. Yapılan deneyler, yöntemin güven kalibrasyonunu önemli ölçüde iyileştirdiğini ve farklı durumlara güçlü genelleme yapabildiğini gösteriyor. Bu gelişme yapay zeka sistemlerinin şeffaflığı ve güvenilirliği açısından önemli bir adım.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Nörobilim & Psikoloji

2 May

Erkek Dostluklarının 'Yüzeysel' Olduğu İnancı Sorgulanıyor

Yıllardır psikoloji literatüründe erkeklerin dostluklarının kadınlarınkine kıyasla daha yüzeysel ve duygusal destek açısından yetersiz olduğu savunuluyordu. Bu duruma 'cinsiyet dostluk açığı' adı veriliyor. Ancak yeni bir araştırma, bu durumun tüm erkeklerde geçerli olmadığını ve esas olarak beyaz erkeklere özgü bir durum olduğunu ortaya koyuyor. Çalışma, farklı etnik kökenlerden erkeklerin dostluk ilişkilerini incelediğinde, bu genellemenin ne kadar yanıltıcı olabileceğini gösteriyor. Bulgular, sosyal bilimler alanındaki araştırmaların daha kapsayıcı örneklemlerle yapılması gerektiğini ve kültürel farklılıkların önemini vurguluyor.

PsyPost 0

Tıp & Sağlık

1 May

Fazla kilo Avustralya'da iş bulma şansını azaltmıyor

Avustralya'da yapılan yeni bir araştırma, fazla kiloların iş bulma olasılığını doğrudan olumsuz etkilemediğini ortaya koyuyor. Çalışmada araştırmacılar, geçmiş iş deneyimi faktörü dikkate alındığında, vücut kitle indeksinin mevcut istihdam fırsatları üzerinde önemli bir etkisinin bulunmadığını tespit etti. Bu bulgular, iş piyasasında obezite kaynaklı ayrımcılığın düşünülenden daha az yaygın olabileceğini gösteriyor. Araştırma, toplumsal önyargılar konusunda önemli ipuçları sunarken, istihdam süreçlerinde gerçek belirleyici faktörlerin neler olduğu konusunda da fikir veriyor. Sonuçlar, kilo ile istihdam arasındaki ilişkinin karmaşık olduğunu ve bu konudaki basit genellemelerden kaçınılması gerektiğini işaret ediyor.

PsyPost 0

Biyoloji & Yaşam Bilimleri

1 May

Sanal hücre modelleri gerçek dünya testlerinde yetersiz kalıyor

İlaç keşfi ve kişiselleştirilmiş tıp alanında büyük umut vaat eden sanal hücre modelleri, laboratuvar ortamında etkileyici sonuçlar verse de gerçek dünya koşullarında beklenenden düşük performans sergiliyor. Araştırmacılar, mevcut değerlendirme sistemlerinin çok basitleştirilmiş olduğunu ve biyolojik sistemlerin karmaşıklığını yansıtmadığını tespit etti. Yeni geliştirilen standart test çerçevesi, modellerin görülmemiş hücre türleri, bilinmeyen müdahaleler ve farklı veri setleri arasında genelleme yapma kabiliyetlerini ölçüyor. Sonuçlar, model başarısının büyük ölçüde bağlama bağlı olduğunu ve görev tasarımından güçlü şekilde etkilendiğini gösteriyor. Bu bulgular, sanal hücre teknolojisinin klinik uygulamalara geçmeden önce daha kapsamlı değerlendirmelere ihtiyaç duyduğunu ortaya koyuyor.

arXiv (Biyoloji) 0

Fizik

1 May

Kuantum Alan Teorisinde Feynman Yayılımcılarından Hadamard Durumları İnşası

Matematiksel fizikçiler, kuantum alan teorisinde Feynman yayılımcılarından Hadamard durumları oluşturmak için yeni bir yöntem geliştirdi. Bu çalışma, herhangi bir Hadamard durumunun Wightman iki-nokta fonksiyonunun karşılık gelen bir Feynman yayılımcısını belirlediği gerçeğinden yola çıkıyor. Ancak tersine, bir Feynman yayılımcısının ancak belirli pozitiflik koşulları sağlandığında bir durum belirleyebildiği sorununu ele alıyor. Araştırmacılar, Duistermaat-Hörmander teorisinin son genellemelerini kullanarak bu teknik zorluğu aştı. Çalışma, normal hiperbolik operatörlerle yönetilen karmaşık bozonik alanlar, hermitsel teoriler ve Dirac tipi operatörlerle yönetilen fermiyonik teoriler dahil olmak üzere çeşitli kuantum alan teorilerini kapsamlı bir şekilde inceliyor.

arXiv — Matematiksel Fizik 0

Teknoloji & Yapay Zeka

1 May

Yapay Zeka Modelleri Gerçekten Öğreniyor mu Yoksa Ezberlemiş Şablonları mı Kullanıyor?

Büyük dil modelleri program yazma görevlerinde etkileyici sonuçlar elde ediyor, ancak gerçek öğrenme yetenekleri belirsizliğini koruyor. Araştırmacılar, transformer modellerin gerçekten genelleme yapıp yapmadığını test etmek için kontrollü bir deney ortamı geliştirdi. Milyonlarca benzersiz program üzerinde yapılan testler, modellerin yeni durumlarla karşılaştıklarında ciddi sınırları olduğunu ortaya çıkardı. Bu bulgular, yapay zekanın öğrenme mekanizmalarının düşünülenden daha karmaşık olduğunu gösteriyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

1 May

Yapay Zeka Diyalog Sistemleri Nesne Tanımalarında Daha Akıllı Hale Geliyor

Araştırmacılar, görev odaklı diyalog sistemlerinin nesne referanslarını anlama yeteneğini geliştiren yeni bir yöntem önerdi. Büyük dil modellerinin nesne açıklamaları üzerinde mantıksal çıkarım yapmasını sağlayan bu yaklaşım, özellikle karmaşık görsel ortamlarda chatbot'ların hangi nesneden bahsedildiğini daha doğru tespit etmesini mümkün kılıyor. SIMMC 2.1 veri seti üzerinde yapılan testler, bu yöntemin geleneksel supervised öğrenme modellerinin aksine farklı alanlarda daha iyi genelleme yapabildiğini gösteriyor. Sistem, adım adım mantıksal süreçler oluşturarak kullanıcının kastettiği nesneyi daha başarılı şekilde belirleyebiliyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

1 May

Yapay Zeka Ajansları Gerçek Hafıza Değil, Sadece Not Defteri Kullanıyor

MIT araştırmacıları, mevcut yapay zeka ajanslarının hafıza sistemlerinin aslında gerçek hafıza olmadığını, yalnızca bilgi arama mekanizması olduğunu ortaya koydu. Vektör depoları, bağlamsal pencere yönetimi ve benzer teknolojilerin 'arama' işlevi gördüğünü, ancak gerçek öğrenme sağlamadığını gösterdiler. Bu durum, ajanların sürekli not biriktirmesine rağmen uzmanlık geliştiremediği, kompozisyonel görevlerde genelleme tavanına çarptığı ve kalıcı hafıza zehirlenmesine karşı savunmasız kaldığı anlamına geliyor. Araştırma, sinir bilimindeki Tamamlayıcı Öğrenme Sistemleri teorisinden yola çıkarak, biyolojik zekanın bu sorunu nasıl çözdüğünü inceliyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Matematik

1 May

Matematikçiler Yang-Baxter Denkleminin Yeni Genellemesini Keşfetti

Matematiksel fizik alanında önemli bir gelişme yaşandı. Araştırmacılar, integrallenebilir sistemlerin temelini oluşturan Yang-Baxter denkleminin yeni bir genellemesini ortaya çıkardı. 'Scalene Yang-Baxter haritaları' olarak adlandırılan bu yeni yapılar, matris faktörizasyon problemleriyle derin bağlantılar kuruyor. Özellikle KdV ve NLS tipi integrallenebilir denklemlerle ilişkili olan bu haritalar, matematiksel fiziğin en karmaşık problemlerinden birine yenilikçi bir yaklaşım sunuyor. Yang-Baxter denklemi, istatistiksel mekanik ve kuantum grupları teorisinde kritik rol oynayan bir yapıdır ve bu yeni genelleme, alanın sınırlarını genişletiyor.

arXiv — Matematiksel Fizik 0

Teknoloji & Yapay Zeka

30 Apr

Robotlar İçin Gerçek Dünya Verilerini Çoğaltan Yeni Teknoloji: R2RGen

Araştırmacılar, robotların farklı uzamsal konfigürasyonlarda çalışabilmesi için gerekli olan veri eksikliği sorununa çözüm getiren R2RGen adlı yeni bir framework geliştirdi. Bu sistem, minimal gerçek dünya demonstrasyonlarından yola çıkarak, simülatör kullanmadan doğrudan 3D nokta bulutu verilerini çoğaltabiliyor. Geleneksel yöntemlerin sim-to-real gap sorunu yaşamasının aksine, R2RGen gerçekten gerçeğe veri üretimi yaparak bu problemi ortadan kaldırıyor. Robotik manipülasyonda uzamsal genelleme yeteneği, robotların farklı nesne dizilimleri ve çevre koşullarında etkili çalışabilmesi için kritik öneme sahip.

arXiv (Robotik) 0

Teknoloji & Yapay Zeka

30 Apr

Yapay Zeka Elle Yazılmış Kurallar Olmadan Dil Yapısını Öğrendi

Araştırmacılar, semantik ayrıştırma alanında çığır açan bir yöntem geliştirdiler. Yeni sistem, önceden yazılmış kompozisyonel kurallar kullanmadan dilin yapısal özelliklerini öğrenebiliyor. Nöral hücresel otomaton tabanlı model, SLOG veri setinde 17 yapısal genelleme kategorisinin 11'inde mükemmel sonuçlar elde etti. Transformer tabanlı modeller yapısal genelleme konusunda başarısız olurken, mevcut AM-Parser sistemi elle yazılmış cebirsel kurallara ihtiyaç duyuyor. Yeni yaklaşım ise tüm kompozisyonel kuralları veriden öğrenerek bu sınırlamaları aşıyor. Bu gelişme, doğal dil işleme alanında makinelerin dil yapısını daha esnek şekilde kavramasının önünü açıyor.

arXiv (Dilbilim & NLP) 0

Teknoloji & Yapay Zeka

30 Apr

Yapay Zeka Dil Modelleri Aslında Birer Hafıza Sistemi Gibi Çalışıyor

Araştırmacılar, dil difüzyon modellerinin temel olarak Asosiatif Hafıza sistemleri gibi davrandığını keşfetti. Bu modeller, eğitim verilerini 'anılar' olarak saklayıp geri çağırırken, aynı zamanda yaratıcı yetenekler de geliştirebiliyor. Çalışma, modellerin ne zaman ezberleme yaptığını ve ne zaman gerçek üretkenlik gösterdiğini belirlemenin yollarını araştırıyor. Bulgular, eğitim veri boyutunun modellerin hafızacılıktan genelleme yapma kabiliyetine geçişinde kritik rol oynadığını gösteriyor. Bu keşif, yapay zeka modellerinin çalışma prensiplerini daha iyi anlamamızı sağlayarak, gelecekte daha etkili ve yaratıcı dil modelleri geliştirmemize yardımcı olabilir.

arXiv (Dilbilim & NLP) 0

Tıp & Sağlık

21 Apr

BioVLM: Tıbbi Yapay Zeka Modellerinde Yeni Bir Çıkışyolu

Araştırmacılar, tıbbi görüntü ve metin analizi yapan yapay zeka modellerinin performansını artıran yeni bir yaklaşım geliştirdi. BioVLM adı verilen bu sistem, farklı tıbbi görüntüleme yöntemleri arasında daha başarılı genelleme yapabiliyor. Özellikle az sayıda örnek verinin bulunduğu durumlarda, modelin farklı tıbbi modalitelere uyum sağlamasını kolaylaştırıyor. Sistem, dinamik prompt seçimi ve güçlü dil modeli entegrasyonu kullanarak, geleneksel yöntemlere göre daha etkili sonuçlar elde ediyor. Bu gelişme, tıbbi teşhis ve görüntü analizi alanında yapay zekanın daha geniş kullanım imkanları sunabileceğini gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Çok Dilli Yapay Zeka Modelleri İçin Akıllı Yönlendirme Sistemi Geliştirildi

Araştırmacılar, çok dilli büyük dil modellerinde (LLM) farklı dillerde farklı stratejilerin daha etkili olduğunu keşfetti. Kaynak az dillerde çeviri tabanlı yöntemler başarılı olurken, kaynak zengin dillerde doğrudan yaklaşım daha iyi sonuç veriyor. Bu bulgular doğrultusunda, her örnek için en uygun stratejiyi otomatik seçen hafif sınıflandırıcılar geliştirdiler. Sistem, sabit stratejilere göre dört farklı test setinde istatistiksel olarak anlamlı iyileşmeler sağladı ve eğitim sırasında görmediği görev formatlarına da başarıyla genelleme yapabildi.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka neden başarılı tahminler yapıyor? Genetik programlama sırrı çözülüyor

Araştırmacılar, genetik programlama kullanan yapay zeka sistemlerinin neden eğitim verilerinin ötesinde başarılı tahminler yapabildiğini matematiksel olarak açıkladı. Çalışma, sembolik regresyon adı verilen yöntemde AI'ın genelleme yeteneğini iki temel bileşene ayırıyor: yapı seçimi ve sabit optimizasyonu. Bu teorik çerçeve, AI sistemlerinin karmaşık matematiksel ifadeleri nasıl keşfettiğini ve neden bazı durumlarda beklenenden iyi performans sergilediğini anlamamıza yardımcı oluyor. Bulgular, yapay zeka geliştirmede kullanılan pratiklerin bilimsel temellerini güçlendiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka modelleri çeviriyi nasıl öğreniyor? İki aşamalı süreç keşfedildi

Araştırmacılar, büyük dil modellerinin çok dilli yeteneklerini nasıl geliştirdiğini anlamak için 1,7 milyar parametreli bir modeli dokuz farklı dilde eğitti. Çalışma, modellerin çeviri becerilerini iki aşamada geliştirdiğini ortaya koydu: İlk aşamada kelime kopyalama ve yüzeysel benzerlikler hakimken, ikinci aşamada daha gelişmiş genelleme yetenekleri ortaya çıkıyor. Bu bulgular, yapay zekanın dil öğrenme süreçlerini anlamada önemli bir adım teşkil ediyor ve gelecekteki çok dilli AI sistemlerinin geliştirilmesinde yol gösterici olabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

MARCO: Yapay Zeka Görsel Eşleştirmede Yeni Dönem Başlatıyor

Araştırmacılar, görsel öğeler arasında anlam bağlantısı kurma konusunda devrim niteliğinde bir yapay zeka modeli geliştirdi. MARCO adlı bu sistem, farklı görsellerdeki benzer nesneleri ve bölgeleri eşleştirme konusunda şimdiye kadarki en başarılı sonuçları elde etti. Mevcut sistemler milyarlarca parametre kullanmasına rağmen yeni durumlarla karşılaştıklarında yetersiz kalıyordu. MARCO ise daha az kaynak kullanarak hem hassas konum belirleme hem de anlam genellemesinde üstün performans sergiliyor. Bu gelişme, robotik, artırılmış gerçeklik ve görüntü analizi alanlarında önemli ilerlemeler sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerinin Genelleme Yeteneği İçin Yeni Matematiksel Sınır

Araştırmacılar, yapay zeka modellerinin yeni veriler karşısındaki performansını önceden tahmin edebilmek için yeni bir matematiksel yaklaşım geliştirdi. PAC-Bayes teorisi ve tekil öğrenme teorisini birleştiren bu yöntem, özellikle çok parametreli modellerde klasik yöntemlerin başarısız olduğu durumlarda etkili sonuçlar veriyor. Gibbs posterior dağılımları kullanılarak elde edilen bu sınırlar, modelin karmaşıklığına ve veri yapısına uyum sağlayabiliyor. Matris tamamlama ve sinir ağı uygulamalarında test edilen yöntemin, mevcut tekniklerden çok daha sıkı tahminler verdiği gösterildi.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka modelleri farklı görsel stillere nasıl uyum sağlıyor?

Bilgisayarlı görü sistemlerinin en büyük zorluklarından biri, eğitildikleri ortamdan farklı görsel stillere sahip alanlarda başarısız olmalarıdır. Araştırmacılar bu soruna çözüm olarak CrossFlowDG adlı yeni bir yaklaşım geliştirdi. Bu yöntem, görsel ve metinsel verileri birleştirerek yapay zekanın farklı alanlarda daha kararlı performans göstermesini sağlıyor. Geleneksel yöntemlerin aksine, CrossFlowDG görsel ve metin verilerini geometrik olarak birbirine yaklaştıran akış eşleştirme tekniği kullanıyor. Bu sayede model, görsel stillerdeki değişikliklerden etkilenmeden nesne sınıflandırmasında başarılı oluyor. VMamba görüntü kodlayıcısı ve CLIP metin kodlayıcısı kullanan sistem, alana özgü önyargıları azaltarak daha güvenilir sonuçlar üretiyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka ajanları sahte videoları tartışarak tespit ediyor

Deepfake ve diğer sahte video teknolojilerinin hızla gelişmesiyle birlikte, geleneksel tespit yöntemleri yetersiz kalmaya başladı. Araştırmacılar, bu soruna yenilikçi bir çözüm önerdi: DVAR adlı sistem, video doğruluğunu tespit etmek için iki yapay zeka ajanını birbirine karşı tartıştırıyor. Bu ajanlardan biri videonun yapay üretilmiş olduğunu, diğeri ise doğal olduğunu savunuyor. Karşılıklı sorgulama ve kanıt sunma sürecinde, her ajan kendi hipotezini destekleyen argümanları ortaya koyuyor. Sistem, bu tartışmanın sonucunda hangi açıklamanın daha az karmaşık ve mantıklı olduğunu Occam'ın usturası ilkesiyle belirliyor. Herhangi bir önceden eğitim gerektirmeyen bu yaklaşım, mevcut tespit yöntemlerinin genelleme problemine çözüm sunuyor.

arXiv (CS + AI) 0