Yapay Zeka Eğitiminde Yeni Dönem: Federe Öğrenme ile İnsan Geri Bildirimi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zekanın insan geri bildirimlerinden öğrenmesini daha verimli hale getiren yeni bir yöntem geliştirdi. Par-S²ZPO adı verilen bu algoritma, akıllı telefonlar gibi sınırlı kaynaklara sahip cihazların bile büyük AI modellerinin eğitimine katkıda bulunmasını sağlıyor. Federe öğrenme prensibiyle çalışan sistem, verileri merkezi bir sunucuda toplamak yerine, her cihazın kendi verisiyle öğrenip sonuçları paylaşmasına dayanıyor. Bu sayede hem gizlilik korunuyor hem de iletişim maliyetleri düşürülüyor. Yöntemin en büyük yenliği, karmaşık matematiksel hesaplamalar yerine basit ikili işlemler kullanması. Deneyler, bu yaklaşımın geleneksel merkezi yöntemler kadar etkili olduğunu ve hatta bazı durumlarda daha hızlı sonuç verdiğini gösteriyor.

Stanford Üniversitesi araştırmacıları, yapay zekanın insan geri bildirimlerinden öğrenmesini devrimsel bir şekilde iyileştiren yeni bir algoritma geliştirdi. Par-S²ZPO (Partitioned, Sign-based Stochastic Zeroth-order Policy Optimization) adı verilen bu yöntem, akıllı telefonlar ve IoT cihazları gibi sınırlı kaynaklara sahip cihazların büyük AI modellerinin eğitimine katılmasını mümkün kılıyor.

Geleneksel yapay zeka eğitiminde, tüm veriler merkezi sunucularda toplanarak işlenir. Bu yaklaşım gizlilik sorunları yaratırken, büyük miktarda veri transferi de gerektiriyor. Yeni algoritma ise federe öğrenme prensibiyle çalışarak, her cihazın kendi verisiyle öğrenmesini ve sadece öğrendiği bilgileri paylaşmasını sağlıyor.

Par-S²ZPO'nun en önemli özelliği, karmaşık matematiksel hesaplamalar yerine basit ikili işlemler kullanması. Bu sayede hem iletişim maliyetleri hem de hesaplama gücü ihtiyacı dramatik şekilde azalıyor. Algoritma, her cihazın sınırlı bellek ve işlem kapasitesiyle çalışabilecek şekilde tasarlanmış.

Araştırma ekibi, MuJoCo simülasyon ortamında yaptığı testlerde, yeni yöntemin geleneksel FedAvg tabanlı sistemlerden daha iyi performans gösterdiğini kanıtladı. Teorik analizler de algoritmanın merkezi yöntemler kadar etkili olduğunu, hatta politika güncellemelerinde daha hızlı yakınsama sağladığını ortaya koyuyor.

Etiketler

#yapay zeka #federe öğrenme #makine öğrenmesi #algoritma #insan geri bildirimi

Özgün Kaynak

Efficient Federated RLHF via Zeroth-Order Policy Optimization

https://arxiv.org/abs/2604.17747

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka · 1 gün önce

Yapay Zeka Eğitiminde Yeni Dönem: Federe Öğrenme ile İnsan Geri Bildirimi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Sosyal medya seçim karşıtı reklamları oy verme davranışını etkiliyor

Çin'de 'Uzanıp Yatma' Akımı: Sosyal Direnişin Dilbilimsel Analizi

Adil Tasarlanan Eşleştirme Sistemleri Bile Eşitsiz Sonuçlar Üretebiliyor