NanoKnow: Yapay Zekanın Bilgi Kaynağını Haritalandıran Yeni Araştırma

1 Mayıs 2026, 07:00 2 dk okuma 0 görüntülenme arXiv — Hesaplamalı Dilbilim (cs.CL)

Paylaş: Kopyalandı!

Büyük dil modelleri nasıl öğrendiklerini nereden biliyorlar? Bu sorunun cevabı, eğitim verilerinin genellikle 'kara kutu' gibi kapalı olması nedeniyle zor bulunuyordu. Araştırmacılar, tamamen açık eğitim verileriyle geliştirilmiş nanochat modellerini kullanarak NanoKnow adlı yeni bir veri seti geliştirdi. Bu çalışma, yapay zekanın parametrik bilgisinin nereden geldiğini şeffaf bir şekilde gösteriyor. NanoKnow, Natural Questions ve SQuAD veri setlerindeki soruları, cevaplarının nanochat'in eğitim korpusunda bulunup bulunmamasına göre ayırarak, dil modellerinin çıktı üretirken hangi bilgi kaynaklarına güvendiğini anlamayı mümkün kılıyor. Sekiz farklı nanochat checkpoint'i üzerinde yapılan deneyler, kapalı kitap doğruluğunun eğitim verilerindeki cevap sıklığından güçlü şekilde etkilendiğini ortaya koyuyor.

Yapay zeka alanında büyük dil modellerinin (LLM) bilgiyi nasıl kodladığını anlamak, uzun süredir araştırmacıları meşgul eden bir konu olmuştur. Bu alandaki en büyük engel, modellerin eğitim verilerinin genellikle erişilemez veya bilinmeyen 'kara kutu' niteliğinde olmasıydı.

Yeni geliştirilen NanoKnow benchmark veri seti, bu soruna yenilikçi bir çözüm getiriyor. Tamamen açık eğitim verileriyle geliştirilmiş nanochat model ailesi kullanılarak oluşturulan bu sistem, yapay zekanın parametrik bilgisinin nereden geldiğini şeffaf bir şekilde ortaya koyuyor.

Araştırmacılar, Natural Questions ve SQuAD gibi tanınmış veri setlerindeki soruları, cevaplarının nanochat'in eğitim korpusunda mevcut olup olmamasına göre kategorilere ayırdı. Bu yaklaşım sayesinde, dil modellerinin çıktı üretirken hangi bilgi kaynaklarına güvendiği artık daha net şekilde anlaşılabiliyor.

Sekiz farklı nanochat checkpoint'i üzerinde gerçekleştirilen kapsamlı deneyler, önemli bulgular ortaya koydu. Özellikle kapalı kitap doğruluğunun, eğitim verilerindeki cevap sıklığından güçlü bir şekilde etkilendiği gözlemlendi.

Bu çalışma, yapay zeka modellerinin bilgi işleme mekanizmalarını anlamak için önemli bir adım teşkil ediyor ve gelecekteki AI şeffaflığı araştırmalarına sağlam bir temel sağlıyor.

Etiketler

#yapay zeka #dil modelleri #makine öğrenmesi #AI şeffaflığı #NLP

Özgün Kaynak

NanoKnow: How to Know What Your Language Model Knows

https://arxiv.org/abs/2602.20122

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.