Büyük Dil Modelleri Çok Dilli Kod Analizi Testinde Sınıfta Kaldı

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, yazılım geliştirmede kritik öneme sahip otomatik günlük kaydı (logging) sistemlerini inceleyen kapsamlı bir çalışma yayınladı. MultiLogBench adlı yeni benchmark, altı farklı programlama dili ekosisteminde 63 bin üzeri kod örneği içeriyor. Çalışma, mevcut yapay zeka modellerinin tek dil odaklı eğitim verisiyle sınırlı kaldığını ve gerçek yazılım geliştirme süreçlerindeki çok dilli ortamlarda yetersiz performans gösterdiğini ortaya koyuyor. Günlük kaydı, yazılım hatalarını tespit etme ve sistem performansını izlemede hayati rol oynar, ancak geliştiriciler için zaman alıcı bir süreçtir. Bu nedenle otomatik günlük sistemi geliştirme çabaları büyük önem taşır.

Yazılım geliştirme dünyasında, sistemlerin sağlıklı çalışmasını izlemek ve hataları tespit etmek için günlük kaydı (logging) kritik öneme sahiptir. Geliştiriciler, hangi noktaya günlük kaydı yerleştireceği, hangi API ve önem seviyesi kullanacağı gibi karmaşık kararlar vermek zorundadır.

Yeni yayınlanan araştırma, bu süreci otomatikleştirmeyi hedefleyen yapay zeka modellerinin mevcut durumunu değerlendiriyor. Araştırmacılar, bugüne kadar yapılan çalışmaların ağırlıklı olarak Java programlama dili üzerinde odaklandığını ve bu durumun yanıltıcı sonuçlar doğurabileceğini belirtiyor.

MultiLogBench benchmark'ı, bu eksikliği gidermek için altı farklı programlama dili ekosisteminden toplanan kapsamlı veri seti sunuyor. 63 bin 965 üretim kodu örneği, 744 revizyon geçmişi vakası ve güçlülük analizi için dönüştürülmüş dal yapısı içeren bu veri seti, gerçek yazılım geliştirme süreçlerini yansıtıyor.

Çalışmada yedi güncel büyük dil modeli test edildi. Sonuçlar, tek dil odaklı eğitim verisiyle geliştirilen modellerin çok dilli ortamlarda beklenen performansı gösteremediğini ortaya koyuyor. Bu bulgular, yazılım geliştirme araçlarının geliştirilmesinde daha kapsayıcı yaklaşımların benimsenmesi gerektiğine işaret ediyor.

Etiketler

#yapay zeka #yazılım geliştirme #çok dilli programlama #büyük dil modelleri #otomatik günlük kaydı

Özgün Kaynak

Single-Language Evidence Is Insufficient for Automated Logging: A Multilingual Benchmark and Empirical Study with LLMs

https://arxiv.org/abs/2604.17529

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.