Teknoloji & Yapay Zeka

Küçük yapay zeka modelleri Vietnamca'da akıl yürütme becerisini kazandı

Araştırmacılar, kaynak kısıtlı cihazlarda çalışabilen küçük dil modellerinin akıl yürütme yeteneklerini geliştirmenin yollarını araştırdı. Vietnamca gibi İngilizce dışındaki dillerde bu modeller genellikle tutarlı düşünce zinciri oluşturmakta zorlanıyor. Çalışmada, Qwen3-1.7B mimarisine sahip küçük bir model kullanılarak Vietnamca matematik problemlerinde test-zamanı ölçeklendirme stratejileri incelendi. Araştırmacılar, Vi-S1K adlı yüksek kaliteli bir veri seti ve Vi-Elementary-Bench değerlendirme ölçütü geliştirdi. Sonuçlar, temel modelin güçlü gizli bilgiye sahip olduğunu ancak iletişimde 'formatlama açığı' yaşadığını gösterdi. Denetimli ince ayar yöntemiyle modelin açıklama kalitesinde %77 iyileşme sağlandı ve bu yaklaşım 'akıl yürütme kilidini açan' kritik rol oynadı.

Yapay zeka teknolojilerinin yaygınlaşması, gelişmiş akıl yürütme yeteneklerinin kaynak kısıtlı cihazlarda çalışabilmesine bağlı. Ancak küçük dil modelleri, özellikle Vietnamca gibi İngilizce dışındaki dillerde 'akıl yürütme açığı' problemiyle karşılaşıyor ve tutarlı düşünce zincirleri oluşturmakta zorlanıyor.

Yeni araştırma, Qwen3-1.7B mimarisine sahip küçük bir dil modelinde test-zamanı ölçeklendirme stratejilerini inceleyerek bu sorunu ele aldı. Çalışma kapsamında Vietnamca temel matematik problemlerine odaklanıldı ve iki önemli kaynak geliştirildi: Gemini 2.5 Flash-Lite destekli bir sistem kullanılarak oluşturulan Vi-S1K yüksek kaliteli akıl yürütme veri seti ve değerlendirme için Vi-Elementary-Bench ölçütü.

LLM-hakim protokolü kullanılarak yapılan analizler ilginç sonuçlar ortaya çıkardı. Temel modelin güçlü gizli bilgiye sahip olduğu (5 üzerinden 4.05 doğruluk skoru) ancak iletişimde ciddi bir 'formatlama açığı' yaşadığı tespit edildi.

Denetimli ince ayar yöntemi, kritik bir 'akıl yürütme kilit açıcısı' rolü oynadı ve modelin açıklama kalitesinde %77 iyileşme sağladı. Bu yaklaşım, küçük dil modellerinin yerel dillerdeki matematik problemlerinde daha etkili çalışabilmesinin yolunu açtı.

Özgün Kaynak
arXiv (CS + AI)
Bridging the Reasoning Gap in Vietnamese with Small Language Models via Test-Time Scaling
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.