"RoBERTa" araması — BilimKapsül

...

Arama Sonuçları

5 haber

Teknoloji & Yapay Zeka

Yapay Zeka ile Antik Sanskritçe Metinler Dijital Dünyaya Taşınıyor

Binlerce yıllık Sanskritçe literatürün dijitalleştirilmesi, veri eksikliği nedeniyle büyük zorluklarla karşılaşıyordu. Araştırmacılar bu sorunu çözmek için Naamah adlı yeni bir veri seti geliştirdi. 102 bin cümlelik bu veri seti, DBpedia'dan çıkarılan bilgilerle 24 milyar parametreli yapay zeka modelinin üretken yeteneklerini birleştiriyor. Sistem, klasik Sanskritçe gramerinin karmaşık yapısını anlayarak doğal ve çeşitli eğitim verisi oluşturabiliyor. Bu yenilik, antik metinlerdeki kişi, yer ve kavram isimlerini otomatik olarak tanımlayabilme kabiliyeti kazandırıyor. Çalışma, hem çok dilli XLM RoBERTa hem de parametre açısından verimli IndicBERTv2 mimarilerini test etti. Bu gelişme, yalnızca Sanskritçe değil, benzer veri kıtlığı yaşayan diğer antik diller için de umut veriyor.

arXiv (Dilbilim & NLP) · 14 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Belirsizliği Nasıl Algılıyor? Yeni Topolojik Yöntem Çıkmazları Ortaya Çıkarıyor

Stanford araştırmacıları, dil modellerinin belirsiz durumları nasıl işlediğini anlamak için topolojik veri analizi kullandı. Geleneksel doğruluk ölçütlerinin yakalayamadığı gizli yapıları ortaya çıkaran bu çalışma, özellikle insan değerlendiricilerin farklı görüşlere sahip olduğu durumlarda modellerin iç temsil sistemlerini inceliyor. RoBERTa-Large modelinde yapılan testler, fine-tuning sürecinin embedding uzayını modüler bölgelere ayırdığını ve belirsiz veriler karşısında modelin aşırı güvenli davrandığını gösteriyor. Bu bulgular, yapay zeka sistemlerinin karar verme mekanizmalarını daha iyi anlamamızı sağlıyor.

arXiv (Dilbilim & NLP) · 14 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Günlük Konuşma Dilini Anlayamıyor: Emoji ve Slang Büyük Problem

Araştırmacılar, doğal dil anlama sistemlerinin günlük konuşma dili karşısında nasıl başarısız olduğunu inceledi. ELECTRA ve RoBERTa gibi gelişmiş yapay zeka modellerinin slang, emoji ve güncel internet jargonuyla karşılaştığında ciddi performans kayıpları yaşadığı ortaya çıktı. Özellikle emojilerin büyük sorun oluşturduğu, sistemlerin bu karakterleri tanıyamadığı için metindeki anlamı tamamen kaybettiği görüldü. Slang ifadelerde ise 'gonna', 'homie' gibi kelimeler daha az sorun çıkarırken, 'no cap', 'deadass' gibi Z kuşağı terimleri modelleri şaşırtıyor. Bu bulgular, yapay zekanın gerçek hayattaki dil kullanımına adapte olması gerektiğini gösteriyor.

arXiv (Dilbilim & NLP) · 23 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Galler Medyasındaki Politik Önyargıyı Tespit Etti

Galler medyasında artan önyargı iddiaları bilimsel yöntemlerle test edildi. Araştırmacılar, doğal dil işleme teknolojileri kullanarak Nation.Cymru adlı haber sitesinin politik haberlerini analiz etti. İki aşamalı yapay zeka sistemi, önce haberlerdeki önyargılı ifadeleri tespit etti, ardından bu önyargıların hangi parti lehine veya aleyhine olduğunu belirledi. 15.583 parti bahsinin incelendiği çalışmada, Reform UK partisinin Plaid Cymru'ya göre iki kat daha fazla önyargılı çerçevelemeye maruz kaldığı ve üç kat daha olumsuz duygu içeriğiyle sunulduğu ortaya çıktı. Bu araştırma, medya önyargısının objektif ölçümü için yapay zekanın nasıl kullanılabileceğini gösteren öncü bir çalışma niteliği taşıyor.

arXiv (CS + AI) · 23 gün önce