Yapay Zeka Modellerinde Düşünme ve Düşünmeme Modlarını Ayıran Yeni Mimari

1 Mayıs 2026, 07:00 2 dk okuma 0 görüntülenme arXiv — Hesaplamalı Dilbilim (cs.CL)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zeka modellerinin düşünme ve düşünmeme modları arasındaki karışıklığı gidermek için Path-Lock Expert (PLE) adlı yenilikçi bir mimari geliştirdi. Mevcut hibrit düşünen dil modellerinde, düşünmeme modunda bile uzun ve kendini sorgulayan yanıtlar üretilmesi sorunu yaşanıyor. Bu durum, her iki modun aynı parametrelerde kodlanmasından kaynaklanıyor. PLE sistemi, her çözücü katmanda tek MLP yerine, biri düşünme diğeri düşünmeme için olmak üzere iki ayrı uzman kullanıyor. Sistem, dikkat mekanizması, gömme katmanları ve normalizasyon bileşenlerini paylaşırken, bir kontrol token'ı aracılığıyla tüm dizi için sadece bir uzman yolunu seçiyor. Bu yaklaşım, matematik ve bilim alanlarında test edilerek, modların birbirine karışmasını engellemede başarılı sonuçlar gösterdi.

Stanford Üniversitesi araştırmacıları, yapay zeka modellerinin düşünme süreçlerini daha net bir şekilde kontrol etmek için yenilikçi bir mimari geliştirdi. Path-Lock Expert (PLE) olarak adlandırılan bu sistem, hibrit düşünen dil modellerindeki önemli bir sorunu çözmeyi hedefliyor.

Mevcut hibrit modeller, açık düşünme (think) ve düşünmeme (no-think) modlarına sahip olmalarına rağmen, bu modlar arasında net bir ayrım yapamıyor. Düşünmeme modunda bile modeller uzun ve öz-yansıtmalı yanıtlar üretiyor, bu da 'akıl yürütme sızıntısı' olarak adlandırılan istenmeyen bir duruma yol açıyor.

PLE mimarisi bu soruna mimari düzeyde bir çözüm sunuyor. Geleneksel sistemlerde her çözücü katmandaki tek MLP (çok katmanlı algılayıcı) yerine, semantik olarak kilitli iki ayrı uzman kullanıyor. Bu uzmanlardan biri sadece düşünme modu için, diğeri ise sadece düşünmeme modu için özelleştirilmiş durumda.

Sistem, dikkat mekanizması, gömme katmanları, normalizasyon ve dil modeli başlığı gibi bileşenleri paylaşırken, deterministik bir kontrol token yönlendiricisi aracılığıyla tüm dizi için tam olarak bir uzman yolunu seçiyor. Bu yaklaşım, çıkarım sırasında yoğun modelin token başına hesaplama desenini koruyor.

Matematik ve bilim alanlarında yapılan testlerde, PLE mimarisinin mod karışıklığını önemli ölçüde azalttığı ve her uzmanın kendi modunda daha saf güncellemeler aldığı gözlemlendi.

Etiketler

#yapay zeka #dil modelleri #hibrit düşünme #mimari tasarım #akıl yürütme

Özgün Kaynak

Path-Lock Expert: Separating Reasoning Mode in Hybrid Thinking via Architecture-Level Separation

https://arxiv.org/abs/2604.27201

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka

19 sa önce

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Son 40 yılın başkanlık seçimlerini analiz eden araştırmacılar, Amerikan siyasetindeki büyük değişimin arkasında yaygın kanaatin aksine işçi sınıfının değil, varlıklı ve yüksek eğitimli beyaz seçmenlerin olduğunu ortaya koydu. Çalışma, bu grubun istikrarlı bir şekilde Demokrat Parti'ye yöneldiğini gösteriyor. Bulgular, siyasi yeniden yapılanmanın nedenlerine dair genel kabul görmüş görüşleri sorguluyor ve elit seçmenlerin siyasi tercihlerindeki değişimin rolünü ön plana çıkarıyor. Araştırma, demografik değişimlerin siyasi davranış üzerindeki etkilerini anlamak için önemli veriler sunuyor.

PsyPost Oku

Teknoloji & Yapay Zeka

23 sa önce

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Dil ve dilbilim alanındaki iki yeni çalışma dikkat çekici sorulara yanıt arıyor. Almeida'nın Humanities and Social Sciences Communications'da yayınlanan makalesi gülmenin doğasını felsefi ve bilimsel açıdan inceliyor. Diğer yandan Leivada ve ekibinin Philosophical Transactions of the Royal Society A'da yayınlanan araştırması, büyük dil modellerinin gerçekten insan dilini ve kelimelerin arkasındaki dünyayı anlayıp anlamadığını sorguluyor. Her iki çalışma da insan iletişiminin karmaşıklığını farklı perspektiflerden ele alıyor.

Language Log Oku

Teknoloji & Yapay Zeka

1 gün önce

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor

Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost Oku