Teknoloji & Yapay Zeka

Yapay Zeka Modelleri İçin Yeni Budama Tekniği: STOP ile %90 Doğruluk

Araştırmacılar, büyük mantıksal akıl yürütme modellerinde paralel işleme verimliliğini artıran yenilikçi bir yöntem geliştirdi. STOP (Super TOken for Pruning) adlı bu teknik, modellerin gereksiz hesaplama yollarını erken aşamada tespit edip elemesini sağlıyor. Çalışma, 1.5 milyardan 20 milyar parametreye kadar farklı büyüklükteki modellerde test edildi ve kayda değer başarı elde etti. Özellikle GPT-OSS-20B modelinde AIME25 veri setindeki doğruluk oranı %84'ten %90'a yükseldi. Bu gelişme, yapay zeka modellerinin hem daha verimli çalışmasını hem de daha az enerji tüketmesini mümkün kılıyor.

Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar büyük mantıksal akıl yürütme modellerinin verimliliğini artıran yeni bir teknik geliştirdi. STOP (Super TOken for Pruning) adlı bu yöntem, modellerin paralel işlem yaparken gereksiz hesaplama yollarını erken tespit edip budamasını sağlıyor.

Mevcut büyük dil modelleri karmaşık problemleri çözerken birden fazla yol deniyor ancak erken aşamada yapılan hatalar nedeniyle çoğu yol başarısız oluyor. Bu durum hem zaman kaybına hem de yüksek enerji tüketimine neden oluyor. Araştırma ekibi bu soruna sistematik bir çözüm getirdi.

Çalışmada ilk kez yol budama yöntemleri kapsamlı bir sınıflandırmaya tabi tutuldu. Yöntemler sinyal kaynağına ve öğrenebilirlik özelliğine göre kategorilere ayrıldı. Bu sınıflandırma, öğrenebilir dahili yöntemlerin henüz keşfedilmemiş potansiyelini ortaya çıkardı.

STOP tekniği, 1.5 milyardan 20 milyar parametreye kadar değişen model boyutlarında test edildi. En dikkat çekici sonuç GPT-OSS-20B modelinde elde edildi: AIME25 matematik problemleri setindeki doğruluk oranı %84'ten yaklaşık %90'a yükseldi.

Bu gelişme, yapay zeka modellerinin daha az kaynak tüketip daha yüksek performans göstermesinin yolunu açıyor.

Özgün Kaynak
arXiv (CS + AI)
Cut Your Losses! Learning to Prune Paths Early for Efficient Parallel Reasoning
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.