“çok dilli sistem” için sonuçlar

Teknoloji & Yapay Zeka

1 May

101 Dilde Dil Yapısı Testi: Yapay Zeka Modellerinin Dil Yetenekleri Ölçüldü

Araştırmacılar, yapay zeka modellerinin dil yeteneklerini değerlendirmek için 101 farklı dili kapsayan kapsamlı bir test sistemi geliştirdi. MultiBLiMP 1.0 adlı bu sistem, 128 binden fazla minimal çift kullanarak özellikle özne-yüklem uyumu gibi temel dil bilgisi kurallarını test ediyor. Sistem, Universal Dependencies ve UniMorph gibi büyük ölçekli dil kaynaklarını kullanan tamamen otomatik bir süreçle oluşturuldu. Çalışma, mevcut en gelişmiş dil modellerinin özellikle kaynak açısından kısıtlı dillerde yetersiz kaldığını ortaya koyuyor. Bu araştırma, yapay zeka sistemlerinin çok dilli yeteneklerini daha kapsamlı değerlendirmek için önemli bir araç sunuyor ve gelecekteki model geliştirmelerine rehberlik edecek bulgular içeriyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

1 May

Konuşma Tabanlı Yapay Zeka Modelleri İçin Yeni Değerlendirme Standardı

Araştırmacılar, konuşma tabanlı büyük dil modellerinin gerçek dünya performansını ölçmek için DoWhatISay (DOWIS) adlı yeni bir veri seti geliştirdi. Bu çok dilli veri seti, 9 farklı görevi ve 11 dili kapsayarak, yapay zeka modellerinin sesli talimatları ne kadar iyi anlayıp uygulayabildiğini test ediyor. Mevcut değerlendirme yöntemleri çoğunlukla yazılı metinlere dayanıyor, ancak gerçek hayatta insanlar bu sistemlerle konuşarak etkileşim kuruyor. Araştırma sonuçları, yazılı talimatların hala sesli talimatlara göre daha iyi sonuçlar verdiğini, özellikle az kaynaklı dillerde bu farkın daha belirgin olduğunu ortaya koyuyor. Bu çalışma, konuşma tabanlı AI sistemlerinin geliştirilmesi için önemli bir adım teşkil ediyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

30 Apr

Llama-3 Modeline Çince Öğretmek: Dil Karışım Oranının Sırrı Çözüldü

Meta'nın Llama-3 yapay zeka modelini farklı dillerde daha yetkin hale getirmek için yapılan kapsamlı bir araştırma, büyük dil modellerinin yeni diller öğrenme sürecinde kritik faktörleri ortaya koydu. Araştırmacılar, modelin Çince yeteneklerini geliştirirken ek dil verilerinin karışım oranı ile öğrenme hızı arasındaki optimal ilişkiyi keşfetti. Bu bulgular, yapay zeka modellerinin çok dilli yeteneklerini artırma konusunda önemli ipuçları sunuyor. Çalışma, hem 8 milyar hem de 70 milyar parametreli model versiyonlarında test edildi ve sadece hedef dilde değil, belirli uzmanlık alanlarında da performans artışı sağlandı. Sonuçlar, büyük dil modellerinin eğitim maliyetlerini optimize ederken performansı maksimize etmek isteyen araştırmacılar için değerli veriler içeriyor.

arXiv (Dilbilim & NLP) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Artık İtalyanca ve Rumence Yorumları da Anlıyor

Araştırmacılar, yapay zekanın farklı dillerdeki duygu analizini geliştirmek için İtalyanca ve Rumence içeren yeni bir veri seti geliştirdi. RoIt-XMASA adlı bu veri seti, kitap, film ve müzik alanlarından 36.000 etiketli ve 200.000'den fazla etiketsiz yorum içeriyor. Çalışmada geliştirilen yeni eğitim yöntemi, yapay zekanın hem farklı dilleri hem de farklı konuları aynı anda işleyebilmesini sağlıyor. Bu gelişme, çok dilli müşteri geri bildirimlerinin analiz edilmesinden sosyal medya izlemeye kadar birçok alanda kullanılabilecek. Sonuçlar, özelleştirilmiş eğitim alan modellerin hala daha iyi performans gösterdiğini, ancak büyük dil modellerinin de umut verici sonuçlar verdiğini ortaya koyuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Karma Dil Kullanımı Arama Motorlarını Şaşırtıyor: Yeni Araştırma Büyük Açığı Ortaya Çıkardı

Günlük hayatta birden fazla dili karıştırarak konuşmak oldukça yaygın bir durum. Ancak yeni bir araştırma, modern arama sistemlerinin bu karma dil kullanımında büyük zorlanma yaşadığını ortaya koydu. Araştırmacılar, insanların doğal olarak yaptığı dil karıştırma davranışının, en gelişmiş çok dilli arama modellerinde bile performans düşüşüne yol açtığını keşfetti. Çalışmada, karma dil kullanılan metinlerin arama sistemlerinde farklı şekilde işlendiği ve bu durumun arama sonuçlarının kalitesini önemli ölçüde etkilediği belirlendi. Bu bulgular, küresel iletişimde karma dil kullanımının yaygınlaşması göz önüne alındığında, mevcut teknolojinin bu gerçekliği yakalamakta ne kadar yetersiz kaldığını gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Cümlelerinin İçini Görebilen Yeni Yöntem: FLiP

Araştırmacılar, yapay zeka sistemlerinin cümleleri nasıl anladığını çözümleyen yeni bir yöntem geliştirdi. FLiP adı verilen bu teknik, çok dilli ve çok modlu cümle gömme uzaylarından orijinal kelime içeriğinin %75'ini geri çıkarabiliyor. Sistem, LaBSE, SONAR ve Gemini gibi popüler AI modellerinin cümle işleme biçimlerini inceleyerek, bu modellerin hangi dillerde ve modalitelerde daha başarılı olduğunu ortaya çıkarıyor. Çalışma, geleneksel değerlendirme yöntemlerine alternatif olarak, yapay zeka sistemlerinin iç işleyişini anlamamızda yeni bir tanı aracı sunuyor. Bu gelişme, dil modeli geliştiricilerinin sistemlerindeki önyargıları tespit etmesine ve çok dilli uygulamalarda daha adil sonuçlar elde etmesine yardımcı olabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Çeviri Değerlendirmesi Artık İnsan Gücüyle Kolay: Pearmut Platformu

Makine çevirilerinin kalitesini değerlendirmede insan değerlendirmesi altın standart sayılır, ancak karmaşık kurulum süreçleri nedeniyle genellikle otomatik metrikler tercih edilir. Araştırmacılar, bu sorunu çözmek için Pearmut adlı yeni bir platform geliştirdi. Platform, çok dilli doğal dil işleme görevlerinin insan tarafından değerlendirilmesini otomatik değerlendirme kadar kolay hale getiriyor. DA, ESA ve MQM gibi standart protokolleri destekleyen sistem, belge düzeyinde bağlam analizi, mutlak ve karşılaştırmalı değerlendirme özellikleri sunuyor. Bu gelişme, model geliştirme süreçlerinde güvenilir insan değerlendirmesini rutin bir bileşen haline getirebilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Çok dilli konuşmaları anlayan yapay zeka için yeni test ortamı geliştirildi

Araştırmacılar, farklı dilleri karıştırarak konuşan insanları anlayabilen yapay zeka sistemlerini test etmek için MUSCAT adlı yeni bir veri seti geliştirdi. Bu benchmark, bilimsel konular üzerine yapılan çok dilli tartışmaları içeriyor ve konuşma tanıma sistemlerinin gerçek hayattaki karmaşık durumlarla başa çıkma becerisini ölçüyor. Günümüzde insanlar sıklıkla tek bir konuşmada birden fazla dil kullanıyor, ancak mevcut yapay zeka sistemleri bu durumu başarıyla işleyemiyor. Yeni test ortamı, teknolojinin bu alandaki eksiklerini ortaya koyarak geliştiricilere yol gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Polyglot: Çok Dilli Konuşmadan Yüz Animasyonu Yaratan Yapay Zeka

Araştırmacılar, konuşmadan yüz animasyonu üreten yeni bir yapay zeka sistemi geliştirdi. Polyglot adlı bu sistem, film, video oyunları ve sanal gerçeklik uygulamalarında kullanılmak üzere tasarlandı. Mevcut sistemlerin aksine, Polyglot birden fazla dilde çalışabiliyor ve her kişinin kendine özgü konuşma tarzını koruyabiliyor. Sistem, dilin fonetik yapısı, ritmi ve tonlamasının yüz ifadelerini nasıl etkilediğini öğrenerek, her dil ve konuşmacı için kişiselleştirilmiş animasyonlar üretiyor. Bu teknoloji, küresel içerik üretiminde büyük kolaylık sağlayabilir.

arXiv (CS + AI) 0