Yapay Zeka Modellerinde Durum Transferi ve Yeniden Kullanım Mekanizması Keşfedildi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zeka modellerinin davranışlarını değiştiren prompt tabanlı müdahalelerin nasıl çalıştığını daha iyi anlayabilmek için yeni bir yöntem geliştirdi. GPT-2 ve Qwen modelleri üzerinde yapılan deneyler, modellerin öğrendiği bilgileri farklı görevlerde nasıl yeniden kullandığını ortaya koyuyor. Çalışma, kontrollü yönlendirme görevlerinde 'durum transferi' adı verilen mekanizmayı inceliyor ve modellerin davranışsal olarak önemli bilgileri nerede sakladığını tespit etmeye odaklanıyor. Bulgular, sabit arayüz yeniden kullanımı ile prompt yeniden konumlandırması arasındaki farkı net bir şekilde gösteriyor. Bu keşif, yapay zeka modellerinin iç işleyişini anlamak ve daha verimli model tasarımları geliştirmek açısından önemli.

Yapay zeka alanında yeni bir araştırma, büyük dil modellerinin öğrendikleri bilgileri nasıl transfer ettiklerini ve yeniden kullandıklarını aydınlatıyor. Araştırmacılar, prompt tabanlı müdahalelerin model davranışını değiştirebildiğini bilseler de, davranışsal açıdan önemli durumun modelde nerede temsil edildiği sorusuna yanıt arayışında.

GPT-2 modeli üzerinde gerçekleştirilen deneylerde, araştırmacılar kontrollü yönlendirme görevlerini kullanarak bu mekanizmayı inceledi. Triop görevinde, erken bir arayüzün tam transfer desteği sağladığı gözlemlendi. Toplama ve çıkarma işlemlerinde ise, sabit arayüzde sıfır yeniden eğitim ile derlenmiş transfer, bağışçı yönlendirme doğruluğunun büyük bölümünü geri kazandırabildi.

Özellikle dikkat çeken bulgu, eğitilebilir prompt slotlarının aynı davranışı başka konumlarda yeniden öğrenebilmesi, ancak bunun için ek destek örnekleri ve optimizasyon gerektirmesi. Bu sonuçlar, sabit arayüz yeniden kullanımı ile prompt yeniden konumlandırması arasındaki farkı net bir şekilde ortaya koyuyor.

Qwen modeli üzerinde yapılan çapraz mimari tutarlılık kontrolü, aynı eşleştirilmiş arayüz deseninin operatör belirteci düzeyinde geçerli olduğunu doğruladı. Bu bulgular, yapay zeka modellerinin bilgi işleme ve transfer mekanizmalarını daha iyi anlamamıza katkı sağlıyor.

Yapay Zeka Modellerinde Durum Transferi ve Yeniden Kullanım Mekanizması Keşfedildi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Akıllı toprak tasarımı: Yeraltı borularının korozyonuna karşı yeni çözüm

Masa tenisi robotu dünya şampiyonlarını yendi: Robotik için çığır açan başarı

Robot Takımları İçin Özerk Yapay Zeka: Yeni Nesil İşbirliği Sistemi