Yapay Zeka ile Antik Sanskritçe Metinler Dijital Dünyaya Taşınıyor

30 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (Dilbilim & NLP)

Paylaş: Kopyalandı!

Binlerce yıllık Sanskritçe literatürün dijitalleştirilmesi, veri eksikliği nedeniyle büyük zorluklarla karşılaşıyordu. Araştırmacılar bu sorunu çözmek için Naamah adlı yeni bir veri seti geliştirdi. 102 bin cümlelik bu veri seti, DBpedia'dan çıkarılan bilgilerle 24 milyar parametreli yapay zeka modelinin üretken yeteneklerini birleştiriyor. Sistem, klasik Sanskritçe gramerinin karmaşık yapısını anlayarak doğal ve çeşitli eğitim verisi oluşturabiliyor. Bu yenilik, antik metinlerdeki kişi, yer ve kavram isimlerini otomatik olarak tanımlayabilme kabiliyeti kazandırıyor. Çalışma, hem çok dilli XLM RoBERTa hem de parametre açısından verimli IndicBERTv2 mimarilerini test etti. Bu gelişme, yalnızca Sanskritçe değil, benzer veri kıtlığı yaşayan diğer antik diller için de umut veriyor.

Antik Sanskritçe literatürün dijital dünyaya aktarılması konusunda çığır açan bir çalışma, yapay zeka ve klasik dil bilimi arasında köprü kuruyor. Araştırmacılar, binlerce yıllık metinlerdeki isim varlıklarını tanımlama sorununun üstesinden gelmek için yenilikçi bir yaklaşım geliştirdi.

Naamah olarak adlandırılan bu yeni veri seti, 102 bin 942 cümlelik zengin bir koleksiyon sunuyor. Sistem, DBpedia'nın geniş bilgi tabanından yararlanarak varlık çıkarımı yapıyor ve bunu 24 milyar parametreli hibrit mantık yürütme modeliyle birleştiriyor. Bu kombinasyon, klasik Sanskritçe gramerinin inceliklerini kavrayabilen, doğal ve çeşitli eğitim verisi üretmeyi mümkün kılıyor.

Geleneksel yöntemlerin aksine, bu yaklaşım genel amaçlı büyük dil modellerinin hata eğilimini minimize ediyor. Klasik gramer için gereken derin mantık yürütme kapasitesini sağlayarak, daha güvenilir sonuçlar elde ediyor.

Araştırma ekibi, geliştirdikleri veri setini iki farklı transformer mimarisi üzerinde test etti. Çok dilli XLM RoBERTa ve parametre açısından verimli IndicBERTv2 modellerinin performansını karşılaştırarak, her ikisinin de Sanskritçe metin işlemede umut verici sonuçlar verdiğini gözlemledi.

Bu çalışma, yalnızca Sanskritçe için değil, benzer veri eksikliği yaşayan diğer antik diller için de yol gösterici nitelikte. Dijital beşeri bilimler alanında önemli bir adım olarak değerlendiriliyor.

Etiketler

#yapay zeka #sanskritçe #dijitalleşme #antik metinler #doğal dil işleme

Özgün Kaynak

Naamah: A Large Scale Synthetic Sanskrit NER Corpus via DBpedia Seeding and LLM Generation

https://arxiv.org/abs/2604.26456

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka

18 sa önce

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Son 40 yılın başkanlık seçimlerini analiz eden araştırmacılar, Amerikan siyasetindeki büyük değişimin arkasında yaygın kanaatin aksine işçi sınıfının değil, varlıklı ve yüksek eğitimli beyaz seçmenlerin olduğunu ortaya koydu. Çalışma, bu grubun istikrarlı bir şekilde Demokrat Parti'ye yöneldiğini gösteriyor. Bulgular, siyasi yeniden yapılanmanın nedenlerine dair genel kabul görmüş görüşleri sorguluyor ve elit seçmenlerin siyasi tercihlerindeki değişimin rolünü ön plana çıkarıyor. Araştırma, demografik değişimlerin siyasi davranış üzerindeki etkilerini anlamak için önemli veriler sunuyor.

PsyPost Oku

Teknoloji & Yapay Zeka

23 sa önce

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Dil ve dilbilim alanındaki iki yeni çalışma dikkat çekici sorulara yanıt arıyor. Almeida'nın Humanities and Social Sciences Communications'da yayınlanan makalesi gülmenin doğasını felsefi ve bilimsel açıdan inceliyor. Diğer yandan Leivada ve ekibinin Philosophical Transactions of the Royal Society A'da yayınlanan araştırması, büyük dil modellerinin gerçekten insan dilini ve kelimelerin arkasındaki dünyayı anlayıp anlamadığını sorguluyor. Her iki çalışma da insan iletişiminin karmaşıklığını farklı perspektiflerden ele alıyor.

Language Log Oku

Teknoloji & Yapay Zeka

1 gün önce

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor

Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost Oku