"doktora eğitimi" için 257 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
257 haber
Yapay Zeka Modelleri Artık Daha Az Veriyle Kendilerini Geliştirebiliyor
Araştırmacılar, büyük dil modellerinin öğrenme sürecini insan bilişsel gelişimine benzer şekilde tasarlayan yeni bir yaklaşım geliştirdi. EasyRL adlı bu yöntem, modellerin önce kolay örneklerle başlayıp giderek zorlaşan verilerle kendilerini geliştirmesini sağlıyor. Geleneksel yöntemlerin aksine, bu yaklaşım çok daha az etiketli veriye ihtiyaç duyarken model çöküşü gibi sorunları da önlüyor. İnsan öğrenme psikolojisinden ilham alan sistem, yapay zeka eğitiminde maliyet ve verimlilik açısından önemli bir ilerleme sunuyor.
arXiv (CS + AI) · 23 gün önce
0
Yapay Zeka Artık Metinlerden Profesyonel Danslar Yaratıyor
Araştırmacılar, metin açıklamalarından detaylı dans hareketleri üretebilen yeni bir yapay zeka sistemi geliştirdi. DanceCrafter adlı bu sistem, dans çalışmaları, anatomi ve biyomekaniğin ilkelerini birleştirerek oluşturulan özel bir 'Koreografik Sözdizimi' teorik çerçevesi üzerine kurulu. Sistem, 41 saatlik yüksek kaliteli hareket verisi ve 6,34 milyon kelimelik detaylı açıklamadan oluşan DanceFlow veri setiyle eğitildi. Bu gelişme, dans eğitiminden oyun endüstrisine kadar pek çok alanda devrim yaratma potansiyeli taşıyor.
arXiv (CS + AI) · 23 gün önce
0
Yapay Zeka Eğitimindeki Telif İhlalleri Sonradan Düzeltilemez
Yapay zeka sistemlerinin yasal zorluklarla karşılaştığı dönemde, araştırmacılar makine unutma ve çıkarım zamanı koruma sistemleri gibi sonradan uygulanan yöntemlerin telif ihlallerini çözebileceğini savunuyorlar. Ancak yeni bir hukuki analiz, bu yaklaşımların eğitim sırasında gerçekleşen yasadışı veri kullanımından kaynaklanan sorumlulukları geçmişe dönük olarak ortadan kaldıramayacağını ortaya koyuyor. Çalışma, uyumluluğun modelin çıktılarından ziyade veri kökenine bağlı olduğunu vurguluyor. Yetkisiz veri kopyalama/alma işleminin hukuken tamamlanmış bir eylem olabileceği ve model ağırlıklarının, eğitimden türetilen ifade değerini koruyan sabit kopyalar olarak işlev görebileceği belirtiliyor. Bu durum, sonradan yapılan filtreleme işlemlerini telif ihlali açısından anlamsız kılıyor.
arXiv (CS + AI) · 23 gün önce
0
Yapay Zeka Modellerini Eğitmenin Yeni Yolu: Discrete Tilt Matching
Araştırmacılar, büyük dil modellerini eğitmek için yeni bir yaklaşım geliştirdi. Discrete Tilt Matching (DTM) adlı bu yöntem, geleneksel otoregresif üretim yerine maskelenmiş difüzyon modellerini kullanıyor. DTM, modellerin eğitiminde karşılaşılan matematiksel zorlukları aşmak için likelihood-free bir yöntem sunuyor. Geleneksel pekiştirmeli öğrenme yöntemlerinin aksine, DTM yerel maskeleme posterior'larının eşleşmesi üzerine kurulu. Araştırmacılar bu yöntemi sentetik maze-planning görevlerinde test ettikten sonra, LLaDA-8B-Instruct modelini DTM ile ince ayarlayarak Sudoku ve Countdown görevlerinde güçlü performans artışları elde etti. Bu gelişme, yapay zeka modellerinin daha kararlı ve etkili şekilde eğitilmesi için yeni olanaklar sunuyor.
arXiv (CS + AI) · 23 gün önce
0
Yapay Sinir Ağlarında Gecikmeli Kayıp Artışlarının Matematiksel Sırrı Çözüldü
MIT ve Stanford'dan araştırmacılar, yapay sinir ağlarının eğitimi sırasında beklenmedik bir şekilde ortaya çıkan 'gecikmeli kayıp artışları' fenomenini matematiksel olarak açıkladı. Bu durum, normalizasyon tekniklerinin başlangıçta kararlı görünen öğrenme sürecini nasıl etkilediğini gösteriyor. Araştırma, batch normalizasyonun etkili öğrenme oranını kademeli olarak artırarak instabiliteyi ertelediğini ortaya koyuyor. Bu keşif, derin öğrenme modellerinin eğitimi sırasında yaşanan beklenmedik performans düşüşlerini anlamak açısından kritik öneme sahip. Bulgular, özellikle büyük ölçekli AI modellerinin daha güvenilir eğitimi için yeni stratejiler geliştirilmesine katkı sağlayabilir.
arXiv (CS + AI) · 24 gün önce
0
Yapay zeka modellerini eğitmek için yeni akıllı yöntem: TLoRA
Araştırmacılar, büyük dil modellerini daha verimli şekilde eğitmek için TLoRA adlı yeni bir yöntem geliştirdi. Bu teknik, mevcut LoRA sisteminin geliştirilmiş versiyonu olarak, modellerin belirli görevlere uyarlanması sürecini optimize ediyor. TLoRA, eğitim başlangıcında veri odaklı bir başlangıç stratejisi kullanarak kaynakları daha akıllı şekilde dağıtıyor. Sistem, önceden eğitilmiş ağırlıklar üzerinde matematiksel analizler yaparak görevle alakalı alt alanları tespit ediyor ve hassasiyet tabanlı ölçümlerle kaynak tahsisini ayarlıyor. Bu yaklaşım, hem eğitim karmaşıklığını azaltmayı hem de pratik verimliliği artırmayı hedefliyor. Yapay zeka modellerinin özelleştirilmesi sürecinde önemli bir adım olan bu çalışma, daha az hesaplama gücüyle daha etkili sonuçlar elde etme potansiyeli taşıyor.
arXiv (CS + AI) · 24 gün önce
0
Yapay zeka cerrahi videoları anlatabilir mi? Yeni sistem doktorların yükünü hafifletebilir
Araştırmacılar, cerrahi operasyonların video kayıtlarını büyük dil modelleriyle otomatik olarak açıklayabilen LIME adlı yeni bir sistem geliştirdi. Bu teknoloji, ameliyat videolarını analiz ederek insan müdahalesi olmadan açıklayıcı metinler üretiyor. Ancak yapay zekanın ürettiği bu açıklamalar hatalı bilgiler içerebileceğinden, araştırmacılar SurgLIME adlı özel bir eğitim sistemi tasarladı. Bu sistem, hatalı açıklamaları filtreleyerek güvenilir tıbbi bilgileri korumayı amaçlıyor. Geliştirilen teknoloji, tıp eğitiminde ve cerrahi prosedürlerin dokümantasyonunda devrim yaratabilir, uzmanların manuel açıklama yapma yükünü önemli ölçüde azaltabilir.
arXiv (CS + AI) · 24 gün önce
0
Büyük Dil Modelleri İçin Bulut ve Dağıtık Sistem Mimarileri
Yapay zeka alanında devrim yaratan büyük dil modellerinin (LLM) hesaplama gereksinimleri, geleneksel sistemlerin kapasitesini aşıyor. Araştırmacılar, bu modellerin eğitimi ve çıkarım süreçlerinde karşılaşılan zorlukları aşmak için bulut-native ve dağıtık sistem mimarilerinin kritik önemini ortaya koyuyor. ChatGPT benzeri modellerin artan popülaritesi, ölçeklenebilir ve verimli altyapı çözümlerine olan ihtiyacı daha da artırıyor. Yeni araştırma alanları arasında sunucusuz çıkarım, kuantum hesaplama ve federatif öğrenme gibi teknolojiler, gelecekteki LLM innovasyonlarının temelini oluşturuyor. Bu gelişmeler, yapay zekanın daha geniş kitlelere ulaşabilmesi ve pratik uygulamalarda daha etkili kullanılabilmesi açısından büyük önem taşıyor.
arXiv (CS + AI) · 24 gün önce
0
Yapay Zeka Veri Setlerinde Depolama Sorunu Çözüldü: 200 Kat Küçük Etiketler
Büyük ölçekli veri seti sıkıştırmasında karşılaşılan kritik bir sorun çözüme kavuştu. Araştırmacılar, yapay zeka modellerinin eğitiminde kullanılan veri setlerini sıkıştırırken, orijinal görüntülerden 30-40 kat daha büyük olan yardımcı etiketlerin gereksiz depolama alanı kapladığı problemini tespit etti. ImageNet-21K gibi büyük veri setlerinde bu oran 200 kata kadar çıkabiliyor. Yeni geliştirilen LPQLD yöntemi, görüntü çeşitliliğinin yetersizliği ve denetim sinyallerindeki tekdüzelik gibi temel sorunları ele alıyor. Sınıf bazlı gruplama ve batch normalizasyon teknikleriyle görüntü çeşitliliği artırılırken, dinamik bilgi yeniden kullanımı ile etiket budaması yapılıyor. Bu breakthrough, yapay zeka modellerinin daha az depolama alanıyla eğitilmesine olanak sağlayarak, özellikle kaynak kısıtlı ortamlarda büyük veri setleriyle çalışmayı mümkün kılıyor.
arXiv (CS + AI) · 24 gün önce
0
Yapay Zeka Modellerinde Akıllı Yönlendirme: Hesaplama Maliyetini Yarıya İndiren Yöntem
Araştırmacılar, büyük dil modellerinin hesaplama maliyetini önemli ölçüde azaltabilecek yeni bir yöntem geliştirdi. 'Koşullu derinlik yönlendirmesi' adı verilen bu teknik, metinlerdeki bazı kelimeleri basit işlemlerden geçirirken, karmaşık olanları tam kapasiteli sistemden geçiriyor. 157 milyon parametreli model üzerinde yapılan testlerde, hesaplama yükünü %50 azaltmak mümkün oldu. Sistemin kalbi, hangi kelimelerin hangi işlemlerden geçeceğine karar veren 'kapı' mekanizması. Bu kapıların eğitimi oldukça zorlu çünkü bir kararın etkisi ancak birçok katmandan sonra görülüyor. Araştırmacılar iki farklı kapı tasarımını karşılaştırdı: basit MLP kapısı ve daha gelişmiş JEPA-güdümlü kapı. Bu çalışma, yapay zeka modellerinin daha verimli çalışması için önemli bir adım teşkil ediyor.
arXiv (CS + AI) · 24 gün önce
0
Optimizasyon Algoritmalarında Yeni Yaklaşım: Geometrik Yapıyı Dikkate Alan Hız
Araştırmacılar, makine öğrenmesi ve yapay zeka optimizasyon problemlerinde kullanılan birinci dereceden algoritmaların performansını artıran yeni bir yaklaşım geliştirdi. Geleneksel yöntemler, optimizasyon sürecinde karşılaşılan gerçek geometrik yapıları göz ardı ederek, en kötü durum senaryolarına göre hesaplama yapar. Bu durum özellikle yüksek boyutlu problemlerde algoritmaların gereksiz yere yavaş çalışmasına neden olur. Yeni geliştirilen 'yörünge-kısıtlı' framework, optimizasyon algoritmasının gerçekte geçtiği bölgelerin geometrik özelliklerini dikkate alarak, daha gerçekçi ve hızlı yakınsama garantileri sağlıyor. Bu yaklaşım, makine öğrenmesi modellerinin eğitimi ve büyük veri analizinde kullanılan optimizasyon süreçlerinin önemli ölçüde hızlanmasını mümkün kılabilir.
arXiv (CS + AI) · 24 gün önce
0