AutoRubric: Yapay Zeka Modellerinin Mantıklı Düşünmesini Sağlayan Yeni Ödül Sistemi

21 Nisan 2026, 07:00 3 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Çok modlu büyük dil modelleri (MLLM'ler) görsel ve metinsel bilgileri işleyerek karmaşık mantıksal çıkarımlar yapabilir, ancak mevcut pekiştirmeli öğrenme yöntemleri yalnızca nihai cevabın doğruluğuna odaklandığı için yanıltıcı akıl yürütme süreçlerine yol açabilir. Araştırmacılar, bu sorunu çözmek için AutoRubric adlı yenilikçi bir çerçeve geliştirdi. Bu sistem, modelin her adımda nasıl düşündüğünü değerlendiren rubrik tabanlı ödül mekanizması kullanarak, hem doğru cevap hem de güvenilir mantık yürütme sürecini destekliyor. AutoRubric, başarılı çözüm yollarından otomatik olarak değerlendirme kriterlerini çıkararak, insan müdahalesi olmadan problem-spesifik rubrikler oluşturabiliyor. Test sonuçları, sistemin altı farklı çok modlu mantık yürütme testinde en iyi performansı sergilediğini ve mantıksal güvenilirliği önemli ölçüde artırdığını gösteriyor.

Yapay zeka alanında çok modlu büyük dil modelleri (MLLM'ler), görsel ve metinsel verileri birlikte işleyerek karmaşık mantıksal çıkarımlar yapma konusunda hızla gelişiyor. Ancak bu modellerin eğitiminde kullanılan geleneksel pekiştirmeli öğrenme yaklaşımları önemli bir eksiklik taşıyor: yalnızca son cevabın doğruluğuna odaklanarak, mantık yürütme sürecinin kalitesini göz ardı ediyor.

Bu problemi çözmek amacıyla araştırmacılar AutoRubric adlı yenilikçi bir sistem geliştirdi. AutoRubric, modelin sadece doğru cevap vermesini değil, aynı zamanda bu cevaba ulaşırken güvenilir bir mantık yürütme süreci izlemesini sağlıyor. Sistemin temel yeniliği, başarılı problem çözme yollarından otomatik olarak tutarlı kontrol noktaları çıkaran 'öz-toplama' yöntemi.

Bu yaklaşım, her problem türü için özel değerlendirme kriterleri (rubrik) oluşturarak, modelin her adımda yaptığı mantıksal çıkarımları ayrı ayrı değerlendiriyor. Böylece model, hem nihai sonucun doğruluğundan hem de düşünce sürecinin kalitesinden ödül alıyor.

AutoRubric'in test sonuçları oldukça etkileyici: altı farklı çok modlu mantık yürütme testinde en yüksek performansı sergilerken, mantıksal güvenilirlik açısından da kayda değer iyileşmeler sağladı. Bu gelişme, yapay zeka modellerinin daha şeffaf ve güvenilir karar verme süreçleri geliştirmesine önemli katkılar sunuyor.

Etiketler

#yapay zeka #çok modlu modeller #pekiştirmeli öğrenme #mantık yürütme #otomasyon

Özgün Kaynak

AutoRubric: Rubric-Based Generative Rewards for Faithful Multimodal Reasoning

https://arxiv.org/abs/2510.14738

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka · 1 gün önce

AutoRubric: Yapay Zeka Modellerinin Mantıklı Düşünmesini Sağlayan Yeni Ödül Sistemi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Sosyal medya seçim karşıtı reklamları oy verme davranışını etkiliyor

Çin'de 'Uzanıp Yatma' Akımı: Sosyal Direnişin Dilbilimsel Analizi

Adil Tasarlanan Eşleştirme Sistemleri Bile Eşitsiz Sonuçlar Üretebiliyor