Yapay zeka alanında yeni bir araştırma, büyük dil modellerinin öğrendikleri bilgileri nasıl transfer ettiklerini ve yeniden kullandıklarını aydınlatıyor. Araştırmacılar, prompt tabanlı müdahalelerin model davranışını değiştirebildiğini bilseler de, davranışsal açıdan önemli durumun modelde nerede temsil edildiği sorusuna yanıt arayışında.
GPT-2 modeli üzerinde gerçekleştirilen deneylerde, araştırmacılar kontrollü yönlendirme görevlerini kullanarak bu mekanizmayı inceledi. Triop görevinde, erken bir arayüzün tam transfer desteği sağladığı gözlemlendi. Toplama ve çıkarma işlemlerinde ise, sabit arayüzde sıfır yeniden eğitim ile derlenmiş transfer, bağışçı yönlendirme doğruluğunun büyük bölümünü geri kazandırabildi.
Özellikle dikkat çeken bulgu, eğitilebilir prompt slotlarının aynı davranışı başka konumlarda yeniden öğrenebilmesi, ancak bunun için ek destek örnekleri ve optimizasyon gerektirmesi. Bu sonuçlar, sabit arayüz yeniden kullanımı ile prompt yeniden konumlandırması arasındaki farkı net bir şekilde ortaya koyuyor.
Qwen modeli üzerinde yapılan çapraz mimari tutarlılık kontrolü, aynı eşleştirilmiş arayüz deseninin operatör belirteci düzeyinde geçerli olduğunu doğruladı. Bu bulgular, yapay zeka modellerinin bilgi işleme ve transfer mekanizmalarını daha iyi anlamamıza katkı sağlıyor.