...
"konuşma tanıma" için 245 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
245 haber
Teknoloji & Yapay Zeka
İşaret Dili Yapay Zekası: Dil Bilimsel Analiz İçin Yeni Test Sistemi
Araştırmacılar, işaret dili çeviri modellerinin dil bilimsel yeteneklerini değerlendirmek için yeni bir test sistemi geliştirdi. ASL Minimal Translation Pairs (ASL-MTP) adlı bu veri seti, Amerikan İşaret Dili'ndeki çeşitli dil bilimsel olguları analiz etmek için tasarlandı. Mevcut yapay zeka modelleri konuşma dili işlemede büyük başarılar elde etmişken, işaret dili modellerinin gelişimi geride kalmıştı. Bu çalışma, işaret dilinin çok boyutlu yapısını - el hareketleri, üst vücut ve yüz ifadelerini - ne kadar iyi analiz edebildiklerini test ediyor. Güncel bir İngilizce çeviri modelinin analizi, bu alandaki eksiklikleri ve gelişim alanlarını ortaya koyuyor.
Teknoloji & Yapay Zeka
MiniCPM-o 4.5: İnsan Gibi Eş Zamanlı Görüp Konuşabilen Yapay Zeka
Araştırmacılar, geleneksel yapay zeka modellerinin sınırlarını aşan yeni bir sistem geliştirdi. MiniCPM-o 4.5 adlı bu model, insanlar gibi aynı anda görebilir, duyabilir ve konuşabilir. Mevcut yapay zeka sistemleri genellikle önce kullanıcıyı dinler, sonra cevap verir - tıpkı sırayla konuşmak gibi. Ancak gerçek insan etkileşimi böyle değildir. Bu yeni sistem, konuşma sırasında bile yeni bilgileri işleyebilir ve tepkisini buna göre ayarlayabilir. Daha da önemlisi, sadece sorulara cevap vermekle kalmayıp, duruma göre kendiliğinden hatırlatmalar yapabilir ve proaktif davranışlar sergileyebilir. Bu gelişme, yapay zekanın insan-bilgisayar etkileşiminde yeni bir dönüm noktası olabilir ve gerçek zamanlı çok modlu iletişimde önemli bir adım teşkil eder.
Teknoloji & Yapay Zeka
Konuşma Tanıma Sistemleri İçin Yeni Değerlendirme Yöntemleri Geliştirildi
Araştırmacılar, otomatik konuşma tanıma sistemlerinin kalitesini ölçmek için geleneksel kelime hata oranının ötesinde iki yeni metrik geliştirdi. POSER adlı ölçüm dilbilgisel doğruluğu, EmbER ise semantik anlamı değerlendiriyor. Bu yenilikçe yaklaşım, yapay zeka destekli konuşma tanıma teknolojilerinin gerçek performansını daha kapsamlı şekilde anlamamızı sağlıyor. Özellikle dil modelleriyle desteklenen sistemlerin ne kadar başarılı olduğunu sadece doğru kelime sayısıyla değil, dilbilgisel ve anlamsal doğrulukla da ölçebilmemizi mümkün kılıyor.
Teknoloji & Yapay Zeka
Konuşma tanıma sistemleri artık insan algısıyla değerlendiriliyor
Fransız araştırmacılar, yapay zeka destekli konuşma tanıma sistemlerinin performansını değerlendirmek için yeni bir yaklaşım geliştirdi. Geleneksel ölçüm yöntemlerinin yetersizliğini fark eden bilim insanları, 143 kişinin katılımıyla HATS adlı veri setini oluşturdu. Bu çalışmada, insanlar farklı konuşma tanıma sistemlerinin ürettiği transkriptler arasından en iyisini seçti. Araştırma, mevcut teknik ölçüm yöntemlerinin insan algısını tam olarak yansıtmadığını ortaya koydu. Yeni yaklaşım, konuşma tanıma teknolojilerinin geliştirilmesinde insan deneyimini merkeze alarak daha kullanıcı odaklı değerlendirme imkanı sunuyor.
Teknoloji & Yapay Zeka
Çağrı merkezi sohbetleri, ses tanıma sistemlerini zorluyor
Yapay zeka destekli ses tanıma sistemlerinin gerçek dünya performansını değerlendirmek için yeni bir test veri seti geliştirildi. AppTek Call-Center Dialogues adlı bu koleksiyon, on dört farklı İngilizce aksanında spontan müşteri-temsilci konuşmalarını içeriyor. Araştırma, mevcut açık kaynak ses tanıma sistemlerinin farklı aksanlar karşısında büyük performans farklılıkları gösterdiğini ortaya koyuyor. Bu çalışma, Amerikan İngilizcesi üzerinde iyi performans gösteren sistemlerin, küresel kullanıcı tabanının çeşitli aksanları karşısında aynı başarıyı gösteremediğini kanıtlıyor. Özellikle konuşmalı yapay zeka uygulamaları için kritik olan bu bulgular, ses tanıma teknolojilerinin daha kapsayıcı geliştirilmesi gerektiğine işaret ediyor.
Teknoloji & Yapay Zeka
Tayland'dan ses klonlama devrimi: İnsanı geçen yapay zeka modeli
Tayland'da geliştirilen JaiTTS-v1.0 adlı yapay zeka modeli, ses klonlama teknolojisinde çığır açıcı bir başarı elde etti. Model, kısa süreli konuşmalarda insan performansını aşarak %1.94 karakter hata oranına ulaştı. Bu başarı, insan konuşmacıların %1.98'lik hata oranından bile daha iyi. Özellikle Tayca ve İngilizce'nin karışık kullanıldığı gerçek hayat durumlarında bile doğal sonuçlar üretiyor. Ticari yazılımlarla yapılan karşılaştırmalarda 400 testin 283'ünde öne geçmeyi başardı. Bu gelişme, ses teknolojilerinde yeni bir dönemin habercisi olarak görülüyor.
Teknoloji & Yapay Zeka
Yapay Zeka Diyalog Sistemleri Nesne Tanımalarında Daha Akıllı Hale Geliyor
Araştırmacılar, görev odaklı diyalog sistemlerinin nesne referanslarını anlama yeteneğini geliştiren yeni bir yöntem önerdi. Büyük dil modellerinin nesne açıklamaları üzerinde mantıksal çıkarım yapmasını sağlayan bu yaklaşım, özellikle karmaşık görsel ortamlarda chatbot'ların hangi nesneden bahsedildiğini daha doğru tespit etmesini mümkün kılıyor. SIMMC 2.1 veri seti üzerinde yapılan testler, bu yöntemin geleneksel supervised öğrenme modellerinin aksine farklı alanlarda daha iyi genelleme yapabildiğini gösteriyor. Sistem, adım adım mantıksal süreçler oluşturarak kullanıcının kastettiği nesneyi daha başarılı şekilde belirleyebiliyor.
Teknoloji & Yapay Zeka
İnsan-Yapay Zeka İş Birliğinde Beş Farklı Liderlik Modeli Tanımlandı
Araştırmacılar, insan ve yapay zeka arasındaki iş birliğini anlamak için yeni bir çerçeve geliştirdi. Çalışma, karar verme süreçlerinde beş farklı model tanımlıyor: Tamamen İnsan, Centaur (insan ağırlıklı), Eşit Ortaklık, Minotaur (YZ ağırlıklı) ve Tamamen YZ. Bu spektrum, liderlik görevinin kim tarafından yapıldığını, problemin kim tarafından çerçevelendiğini ve sonuçlardan kimin sorumlu olduğunu belirlemeye odaklanıyor. Araştırmada en büyük riskin 'yanlış tanıma' olduğu vurgulanıyor - liderler, karar verme yetkisi başka yerlere kaymış olmasına rağmen insan merkezli yaklaşımın devam ettiğini düşünebiliyor. Bu durum, özellikle hibrit takımlarda gözetim ve kontrol mekanizmalarının etkinliğini sorgulatıyor.
Teknoloji & Yapay Zeka
Yapay Zeka Konuşmalarda 'Unutma' Sorununu Çözdü: EviMem Sistemi
Araştırmacılar, yapay zekanın uzun süreli konuşmalarda önemli bilgileri kaybetme problemine çözüm getiren EviMem sistemini geliştirdi. Sistem, eksik kanıtları tespit edebilen IRIS çerçevesi ve katmanlı hafıza mimarisi LaceMem'i birleştiriyor. Geleneksel tek geçişli arama yöntemleri, zaman içinde dağılmış bilgileri bir araya getirmekte yetersiz kalıyor. EviMem ise kanıt boşluklarını tespit edip hedefli sorgular yaparak bu sorunu çözüyor. Test sonuçları, sistemin zamansal sorularda %73,3'ten %81,6'ya, çok aşamalı sorularda ise %65,9'dan %85,2'ye doğruluk oranını artırdığını gösteriyor. Bu gelişme, sohbet botları ve AI asistanları için daha tutarlı ve kapsamlı konuşma deneyimi sağlayabilir.
Teknoloji & Yapay Zeka
Mutfak Kültürleri Matematiksel Yasalara Uyuyor
Bilim insanları, dünya mutfaklarından binlerce geleneksel tarifi analiz ederek şaşırtıcı bir keşif yaptı: yemek tarifleri, dil ve diğer sembolik sistemlerde görülen evrensel matematiksel yasalara uyuyor. Araştırma, malzeme kullanımının Zipf yasasını takip ettiğini, mutfak çeşitliliğinin Heaps yasasına göre geliştiğini ve tarif karmaşıklığının Menzerath-Altmann ilişkilerine uyduğunu ortaya koydu. Bu bulgular, görünürde birbirinden çok farklı olan dünya mutfaklarının altında yatan ortak matematiksel yapıları işaret ediyor. Çalışma, yapay zeka destekli varlık tanıma algoritmaları kullanılarak malzemeler, pişirme teknikleri ve mutfak araçları kategorilere ayrıldı. Sonuçlar, insan yaratıcılığının farklı alanlarında benzer istatistiksel kalıpların var olduğuna dair güçlü kanıtlar sunuyor.
Teknoloji & Yapay Zeka
Çoklu Konuşmalarda Yapay Zeka Hafıza Kaybının Önüne Geçen Yeni Yöntem
Büyük dil modelleri tek seferde verilen talimatlarda başarılı olsalar da, çok turlu konuşmalarda bilgiyi takip etmede zorluk yaşıyor ve performansları düşüyor. Bu soruna 'Konuşmada Kaybolma' adı veriliyor. Araştırmacılar, yapay zeka modellerinin hem doğru cevap vermesini hem de bir soruyu çözüp çözemeyeceğini değerlendirmesini sağlayan yeni bir eğitim yöntemi geliştirdi. RLAAR adlı bu yaklaşım, modellerin zorluğu kademeli olarak artan diyaloglarla eğitilmesini ve erken cevap verme davranışlarını azaltmasını hedefliyor. Yöntem, çatışma öğrenme prensibiyle çalışarak modellerin güvenilirliğini artırıyor.