"gradyan iniş" araması

Arama Sonuçları

79 haber

Yapay Zeka Modellerinde 'Grokking' Fenomeninin Fizik Yasalarıyla Açıklanması

Yapay zeka araştırmacıları, derin öğrenme modellerinde yaşanan 'grokking' olayını - ezberleme durumundan genelleme yetisine ani geçiş - fizik yasalarıyla açıklayan yeni bir yöntem geliştirdi. TDU-OFC adlı bu teknik, gradyan verilerini çığ istatistiklerine dönüştürerek modellerin öğrenme sürecindeki kritik geçiş anlarını tespit ediyor. Transformer ve MLP modellerinde yapılan deneylerde, genelleme geçişinin tam olarak belirli bir boyutsal kritik noktada gerçekleştiği keşfedildi. Bu bulgu, yapay zekanın nasıl öğrendiğini anlamamızda önemli bir adım.

arXiv — Yoğun Madde Fiziği · 24 gün önce

Matematik

Havalimanı trafiğindeki sıkışıklığa matematiksel çözüm

Araştırmacılar, havaalanlarındaki terminal bölgesinde yaşanan trafik sıkışıklığına yeni bir matematiksel çözüm geliştirdi. Çalışma, uçakların iniş sırasında izleyeceği rotaları optimize eden ve hava trafik kontrolörlerinin yönlendirme manevraları da dahil olmak üzere gerçek koşulları modelleyen bir sistem sunuyor. Geliştirilen doğrusal olmayan programlama modeli, uçakların güvenli mesafeleri koruyarak verimli bir şekilde sıralanmasını sağlıyor. Bu yenilikçi yaklaşım, teorik hesaplamalarla pratik uygulama arasındaki boşluğu kapatarak, havacılık sektöründe yaşanan gecikmelerin azaltılmasına katkı sağlayabilir. Matematik ve havacılık mühendisliğinin bir araya geldiği bu çalışma, artan hava trafiği yoğunluğu karşısında etkili çözümler arayışının önemli bir örneğini oluşturuyor.

arXiv (Matematik) · 24 gün önce

Matematik

Yapay Zeka Öğrenmesinde Değişken Veri Kümesi Yaklaşımı: Yeni Matematiksel Teorem

Matematikçiler, yapay zeka sistemlerinin öğrenme süreçlerinde kullanılan Riemann stokastik gradyan iniş algoritmaları için yeni bir yakınsama teoremi geliştirdi. Bu çalışma, makine öğrenmesi algoritmalarının farklı boyutlardaki veri kümeleriyle çalışırken nasıl daha verimli hale getirilebileceğini matematiksel olarak kanıtlıyor. Araştırma, özellikle büyük veri setleriyle çalışan AI sistemlerinin performansını artırma potansiyeli taşıyor. Geliştirilen teorem, her iterasyonda farklı olasılık uzaylarının kullanılması durumunda bile algoritmanın başarılı sonuçlara ulaşabileceğini gösteriyor. Bu matematiksel gelişme, daha esnek ve uyarlanabilir öğrenme algoritmalarının tasarlanması için teorik temel sağlıyor.

arXiv (Matematik) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Neden Aynı Soruya Farklı Cevap Veriyor? Bilim İnsanları Açıkladı

Büyük dil modellerinin prompt hassasiyeti sorunu matematiksel olarak analiz edildi. Araştırmacılar, ChatGPT gibi yapay zekaların aynı anlama gelen farklı sorulara neden tutarsız cevaplar verdiğini Taylor açılımı ve gradyan analizi kullanarak açıkladı. Çalışma, küçük sinir ağlarının aksine büyük dil modellerinin benzer girdileri kümelemek yerine dağıttığını ortaya koyuyor. Bu dağılma davranışı, anlam olarak aynı olan farklı promptlar arasındaki olasılık farkının çok yüksek olmasına ve sıfıra düşürülmesinin zorlaşmasına neden oluyor. Bulgular, yapay zeka sistemlerinin güvenilirlik ve tutarlılık sorunlarını anlamamızda önemli bir adım.

arXiv (CS + AI) · 24 gün önce

Uzay & Astronomi

Chandrayaan-2, Ay yüzeyinin 3D haritasını en ince detayıyla çıkardı

Hindistan'ın Chandrayaan-2 Ay misyonundan elde edilen yüksek çözünürlüklü görüntüler, bilim insanlarının Ay yüzeyinin topografik haritasını benzeri görülmemiş bir detayda oluşturmasına olanak sağladı. Araştırmacılar, 'Gölge-Şekilden' (Shape-from-Shading) adlı yenilikçi bir teknik kullanarak, geleneksel stereo görüntüleme yöntemlerinin sınırlarını aştı. Bu yöntem, Cyrillus krateri, Vikram iniş bölgesi ve Ay'ın güney kutbu dahil olmak üzere üç farklı bölgede test edildi. Sonuçlar, daha önce görülemeyen küçük ölçekli krater yapılarını ortaya çıkararak, Ay'ın yüzey morfolojisini anlamamızı önemli ölçüde geliştirdi.

arXiv (CS + AI) · 24 gün önce

Matematik

Çok Cisimli Dinamik Sistemler İçin Yeni Sonlu Element Yöntemi Geliştirildi

Araştırmacılar, büyük deformasyonlara uğrayan çoklu cisim sistemlerinin analizinde kullanılmak üzere yeni bir Total Lagrange sonlu element çerçevesi geliştirdi. Bu yöntem, mühendislik eklemleriyle birbirine bağlı deforme olabilen cisimlerin davranışını modellemek için kompakt kinematik temsil ve deformasyon gradyan tabanlı formülasyon kullanıyor. Çerçeve, nokta, yüzey ve hacim boyunca uygulanan alan kuvvetlerini desteklerken, sürtünmeli temas kuvvetleri ve kısıt reaksiyon kuvvetlerinin varlığında sistemin yanıtını formüle edebiliyor. Mooney-Rivlin, Neo-Hookean ve Kelvin-Voigt gibi pratik malzeme modellerini destekleyen bu yöntem, robotik, otomotiv ve havacılık endüstrilerindeki karmaşık mühendislik problemlerinin çözümünde önemli ilerlemeler sağlayabilir.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

MASPO: Yapay Zeka Modellerinin Öğrenme Sürecini Üç Boyutta İyileştiren Yeni Yöntem

Araştırmacılar, büyük dil modellerinin (LLM) akıl yürütme kabiliyetlerini geliştirmek için MASPO adlı yeni bir algoritma geliştirdi. Mevcut takviyeli öğrenme yöntemlerinin üç temel sorunu tespit eden bilim insanları, bu sorunları çözmek için birleşik bir çerçeve önerdi. MASPO, gradyan kullanımını optimize ederek, olasılık dağılımını dengeleyerek ve sinyal güvenilirliğini artırarak yapay zeka modellerinin daha az veriyle daha etkili öğrenmesini sağlıyor. Bu gelişme, AI'ın muhakeme yeteneklerini artırma konusunda önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Eğitiminde Kullanılan SGD Algoritmasının Yeni Sınırları Keşfedildi

Araştırmacılar, yapay zeka modellerinin eğitiminde yaygın olarak kullanılan Stokastik Gradyan İnişi (SGD) algoritmasının teorik sınırlarını yeniden tanımladı. Çalışma, sinir ağı eğitimi gibi gerçek dünya uygulamalarında karşılaşılan 'sınırsız varyans' problemine odaklanıyor. Geleneksel yaklaşımlar, varyansın sabit kalacağını varsayar, ancak bu durum pratikte pek görülmez. Yeni araştırma, varyansın mesafe ile ikinci dereceden büyüyebildiği Blum-Gladyshev koşulu altında, optimal çözüme ulaşmanın ne kadar zor olduğunu matematiksel olarak kanıtlıyor. Bu bulgular, yapay zeka algoritmalarının daha gerçekçi koşullar altında nasıl davrandığını anlamamızı derinleştiriyor.

arXiv (Matematik) · 24 gün önce

Teknoloji & Yapay Zeka

eVTOL Uçakları İçin Yeni Pervaneli Tasarım Optimizasyonu Geliştirildi

Araştırmacılar, elektrikli dikey kalkış ve iniş (eVTOL) uçaklarının pervane tasarımını optimize etmek için yeni bir hibrit hesaplama yöntemi geliştirdi. Viskoz Ayrık Girdap Yöntemi (VDVM) olarak adlandırılan bu teknik, geleneksel akış teorisini viskoz etkileri de kapsayacak şekilde genişleterek daha gerçekçi sonuçlar elde ediyor. Yöntem, Reynolds sayısına bağlı değişkenleri ve kararsız viskoz etkilerini hesaba katarak pervane performansını tahmin edebiliyor. Deneysel veriler ve yüksek doğruluklu CFD analizleriyle doğrulanan sistem, itki ve tork hesaplamalarında mükemmel uyum gösteriyor. Bu gelişme, hızla büyüyen eVTOL pazarında daha verimli ve güvenli hava araçlarının tasarlanmasına katkı sağlayacak.

arXiv (Fizik) · 24 gün önce

Matematik

Karmaşık Akış Modellerini Çözmenin Yeni Yolu: GDM Yöntemi ile Hata Analizi

Araştırmacılar, parabolik minimal yüzey problemleri ve düzenlileştirilmiş toplam varyasyon akışları gibi karmaşık matematiksel modelleri çözmek için Gradyan Ayrıklaştırma Yöntemi (GDM) kullanarak kapsamlı bir sayısal analiz gerçekleştirdi. Bu çalışma, farklı numerik yaklaşımları birleşik bir çerçevede ele alarak, hem uyumlu hem de uyumsuz sonlu elemanlar gibi çeşitli hesaplama yöntemlerini kapsıyor. Geliştirilen tam ayrıklaştırılmış örtük şemanın varlığı ve tekliği matematiksel olarak kanıtlandı. Araştırma, karmaşık akış problemlerinin daha doğru ve güvenilir çözümler üretmesi için kritik önem taşıyor.

arXiv (CS + AI) · 24 gün önce

Matematik

Yüksek Kontrastlı Malzemelerde Elektrik Alan Patlamasının Matematiksel Çözümü

Araştırmacılar, kompozit malzemelerde inklüzyonlar arasındaki dar bölgelerde elektrik alanının nasıl patladığını açıklayan matematiksel bir problemi çözdü. Üç ve daha fazla boyutlu uzayda, herhangi bir dışbükey şekle sahip inklüzyonlar için geçerli olan optimal gradyan tahminleri geliştirildi. Bu çalışma, malzeme biliminde kritik olan elektrik iletkenlik problemlerinin anlaşılmasına katkı sağlıyor. Özellikle inklüzyonlar birbirine yaklaştığında ortaya çıkan matematiksel zorlukları aşan bu sonuçlar, daha önce sadece küresel şekiller için kanıtlanmış olan teorileri genelleştiriyor.

arXiv (Matematik) · 24 gün önce

← 1 2 3 4 5 6 7 →