“takviyeli öğrenme” için sonuçlar
4 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yapay Zeka ile Sürekli Zamanlı Kontrol Sistemleri: Veri Tabanlı Yeni Yaklaşım
Araştırmacılar, sürekli zamanlı kontrol sistemlerinin optimizasyonu için veri tabanlı yeni bir yaklaşım geliştirdiler. Linear Quadratic Regulator (LQR) problemi olarak bilinen bu alanda, kapalı döngü ve takviyeli öğrenme parametrizasyonlarını kullanan iki farklı yöntem önerildi. Bu çalışma, robotik, otonom araçlar ve endüstriyel otomasyon gibi alanlarda kritik önem taşıyan kontrol sistemlerinin daha etkili şekilde tasarlanmasına olanak sağlıyor. Özellikle sürekli zamanlı sistemler için geliştirilen bu yaklaşımlar, geleneksel yöntemlere göre daha esnek ve uyarlanabilir çözümler sunuyor.
OGER: Yapay Zeka Öğrenme Sistemlerinde Keşfi Güçlendiren Hibrit Yaklaşım
Araştırmacılar, büyük dil modellerinin mantık yürütme yeteneklerini geliştirmek için OGER adlı yenilikçi bir çerçeve geliştirdi. Bu sistem, çevrimdışı öğretmen rehberliği ile çevrimiçi takviyeli öğrenmeyi birleştirerek, yapay zekanın bilinen çözüm yollarının ötesinde yeni keşifler yapmasını sağlıyor. OGER, çoklu öğretmen işbirlikli eğitim kullanarak modellerin hem geçmiş deneyimlerden yararlanmasını hem de özerk keşiflere yönelmesini teşvik ediyor. Matematik ve genel mantık yürütme testlerinde yapılan deneyler, bu yaklaşımın mevcut yöntemlere göre önemli üstünlükler sağladığını gösteriyor.
Yapay Zeka Modelleri Yüksek Çözünürlüklü Görüntüleri Daha Akıllıca İşliyor
Araştırmacılar, büyük çoklu modal AI modellerinin yüksek çözünürlüklü görüntülerde karşılaştığı verimsizlik sorununu çözmek için yeni bir yöntem geliştirdi. MGPO adlı bu sistem, modellerin görüntünün tamamını işlemek yerine önemli bölgelere odaklanmasını sağlıyor. Takviyeli öğrenme tekniği kullanan yöntem, modelin kendi kendine görüntüde hangi alanların kritik olduğunu öğrenmesini ve bu bölgeleri otomatik olarak kırparak analiz etmesini mümkün kılıyor. Bu yaklaşım, pahalı ek etiketleme gerektiren geleneksel yöntemlere alternatif sunuyor ve modellerin sadece doğru cevap verip vermediğine bakarak öğrenmesini sağlıyor. Geliştirilen sistem, görsel akıl yürütme görevlerinde daha etkili performans gösteriyor.
MASPO: Yapay Zeka Modellerinin Öğrenme Sürecini Üç Boyutta İyileştiren Yeni Yöntem
Araştırmacılar, büyük dil modellerinin (LLM) akıl yürütme kabiliyetlerini geliştirmek için MASPO adlı yeni bir algoritma geliştirdi. Mevcut takviyeli öğrenme yöntemlerinin üç temel sorunu tespit eden bilim insanları, bu sorunları çözmek için birleşik bir çerçeve önerdi. MASPO, gradyan kullanımını optimize ederek, olasılık dağılımını dengeleyerek ve sinyal güvenilirliğini artırarak yapay zeka modellerinin daha az veriyle daha etkili öğrenmesini sağlıyor. Bu gelişme, AI'ın muhakeme yeteneklerini artırma konusunda önemli bir adım teşkil ediyor.