...
"konuşma tanıma" için 245 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
245 haber
Teknoloji & Yapay Zeka
Konuşma Tabanlı Yapay Zeka Modelleri İçin Yeni Değerlendirme Standardı
Araştırmacılar, konuşma tabanlı büyük dil modellerinin gerçek dünya performansını ölçmek için DoWhatISay (DOWIS) adlı yeni bir veri seti geliştirdi. Bu çok dilli veri seti, 9 farklı görevi ve 11 dili kapsayarak, yapay zeka modellerinin sesli talimatları ne kadar iyi anlayıp uygulayabildiğini test ediyor. Mevcut değerlendirme yöntemleri çoğunlukla yazılı metinlere dayanıyor, ancak gerçek hayatta insanlar bu sistemlerle konuşarak etkileşim kuruyor. Araştırma sonuçları, yazılı talimatların hala sesli talimatlara göre daha iyi sonuçlar verdiğini, özellikle az kaynaklı dillerde bu farkın daha belirgin olduğunu ortaya koyuyor. Bu çalışma, konuşma tabanlı AI sistemlerinin geliştirilmesi için önemli bir adım teşkil ediyor.
Teknoloji & Yapay Zeka
Ses Analizinde Entropi: Depresyonu Teşhis Eden Yeni Dijital Biyobelirteç
Araştırmacılar, depresyon tespiti için geleneksel ses analizi yöntemlerinin ötesine geçerek, entropi tabanlı yeni bir yaklaşım geliştirdi. DAIC-WOZ korpusundaki 142 katılımcının ses kayıtları üzerinde yapılan çalışmada, konuşma dinamiklerinin zamana bağlı değişimlerini analiz eden entropi biyobelirteçleri, depresyon tespitinde %64,6 doğruluk oranına ulaştı. Bu yöntem, statik ses özelliklerini kullanan geleneksel yöntemlerin %59,3'lük performansını önemli ölçüde geride bıraktı. Shannon entropisi, fraktal karmaşıklık ve tekrarlama niceleme gibi matematiksel araçlarla ses kalıplarındaki düzensizlikleri ölçen bu yaklaşım, depresyonun erken teşhisinde yeni umutlar vaat ediyor.
Arkeoloji & Tarih
Dinozorlarla yaşayan hamster büyüklüğünde memeli keşfedildi
Baja California'da yapılan kazılarda bulunan fosil kalıntıları, bilim insanlarına yeni bir memeli türünü tanıma fırsatı verdi. Hamster büyüklüğündeki bu küçük yaratık, dinozorların hüküm sürdüğü dönemde yaşamış. Keşif, erken dönem memelilerin çeşitliliği ve evrimi hakkında önemli ipuçları sunuyor. Fosil kayıtları, memelilerin dinozor çağında da var olduğunu ve çeşitli çevresel koşullara uyum sağladığını gösteriyor. Bu tür bulgular, yaşam tarihinin karmaşık yapısını anlamamıza yardımcı oluyor ve memeli evriminin kökenlerine ışık tutuyor.
Teknoloji & Yapay Zeka
Yapay Zeka Endüstriyel Otomasyonu Fotoğraflarla Tasarlayacak
Launchpad Build AI şirketi, Manufacturing Language Model (MLM) adlı yeni sistemini tanıttı. Bu teknoloji, sadece fotoğraf, video veya CAD dosyalarından yararlanarak endüstriyel otomasyon sistemlerini tasarlayabiliyor. Özellikle çeşitli ürün türlerinin az miktarlarda üretildiği fabrikalar için geliştirilen sistem, otomasyon tasarımını demokratikleştirmeyi hedefliyor. Geleneksel yöntemlerde karmaşık mühendislik bilgisi gerektiren süreçleri, görsel girdi ile basitleştiren bu yaklaşım, küçük ve orta ölçekli üreticiler için büyük fırsatlar sunuyor.
Teknoloji & Yapay Zeka
Yapay zeka artık konuşmalardaki duygu değişimlerini anlayabiliyor
Araştırmacılar, yapay zekanın insan konuşmalarındaki duygu geçişlerini anlayabilmesi için yeni bir sistem geliştirdi. EmoTransCap adı verilen bu teknoloji, tek cümledeki statik duyguları tanımakla kalmayıp, uzun konuşmalar boyunca duyguların nasıl değiştiğini de takip edebiliyor. Sistem, sesli konuşmaları analiz ederken hem akustik özellikleri hem de zamansal ipuçlarını kullanarak daha zengin açıklamalar üretiyor. Bu gelişme, insan-robot etkileşiminde daha doğal ve empati kurabilecek yapay zeka sistemleri yaratmanın yolunu açıyor. Araştırmacılar, bu alanda ilk büyük ölçekli veri setini oluşturarak gelecek çalışmalara da zemin hazırladı.
Teknoloji & Yapay Zeka
Gerçek Dünya İçecek Siparişleri için Yeni Yapay Zeka Test Veri Seti Geliştirildi
Araştırmacılar, yapay zeka asistanlarının gerçek dünya koşullarında ne kadar başarılı olduğunu ölçmek için StarDrinks adlı yeni bir test veri seti geliştirdi. İçecek sipariş senaryolarını kapsayan bu veri seti, İngilizce ve Korece dillerinde hazırlanarak, konuşma tanıma ve dil anlama sistemlerinin performansını değerlendirmek için tasarlandı. Mevcut test sistemleri genellikle kontrollü ortamlarda çalışırken, yeni veri seti tereddütler, kendini düzeltmeler ve marka özel terimler gibi doğal konuşma özelliklerini içeriyor. Bu gelişme, ses asistanlarının günlük yaşamda karşılaştığı karmaşık durumları daha iyi anlamasına yardımcı olabilir.
Teknoloji & Yapay Zeka
Konuşma Tanıma Sistemleri İçin Yeni Metin Tabanlı Öğrenme Yöntemi
Araştırmacılar, konuşma tanıma sistemlerinin performansını artırmak için sadece metin verilerini kullanan yenilikçi bir yöntem geliştirdi. Enkoder-ağırlıklı modeller üzerine odaklanan bu çalışma, geleneksel yaklaşımların aksine daha küçük çözücülerle daha büyük enkoderlerin kullanılmasının daha etkili olduğunu gösteriyor. LibriSpeech veri seti üzerinde yapılan deneyler, basit yapılandırmaların karmaşık alternatiflere göre daha iyi sonuç verdiğini ortaya koyuyor. Bu yaklaşım, ses tanıma teknolojilerinin hem hızını hem de doğruluğunu artırırken eğitim sürecini de önemli ölçüde basitleştiriyor. Çalışma, yapay zeka destekli ses işleme uygulamalarında önemli bir ilerleme anlamına geliyor.
Tıp & Sağlık
Yapay Zeka Çocukların Konuşma Bozukluklarını Teşhis Etmede Yeni Umut
Çocukların yüzde beşini etkileyen konuşma ses bozuklukları için yeni bir yapay zeka yaklaşımı geliştirildi. Araştırmacılar, uzman eksikliğinin yaşandığı dil ve konuşma terapisi alanında önemli bir atılım gerçekleştirdi. Konuşma Temsil Modelleri kullanılarak geliştirilen sistem, mevcut dil modellerinden çok daha başarılı sonuçlar elde etti. Hiyerarşik sınıflandırma yaklaşımı benimseyen sistem, önce genel teşhis yapıyor, ardından bozukluğun tipini ve semptomlarını belirliyor. Özel veri artırma teknikleriyle önceki çalışmalardaki önyargılar da giderildi. Bu gelişme, personel sıkıntısı çeken klinikte önemli destek sağlayabilir.
Teknoloji & Yapay Zeka
Yapay zeka konuşmacının sesini koruyarak farklı dillerde konuşabiliyor
Araştırmacılar, bir kişinin ses özelliklerini koruyarak farklı dillerde konuşma üretebilen gelişmiş yapay zeka sistemleri geliştirdi. Bu teknoloji, özellikle bilimsel iletişimde büyük potansiyel taşıyor. Çalışmada, Arapça, Çince ve Fransızca dillerinde ses klonlama modelleri test edildi ve OmniVoice temel modelini kullanan sistemler oluşturuldu. Araştırma ekibi, çoklu model topluluk damıtma yöntemiyle veri artırma tekniklerini kullanarak sistemin performansını iyileştirdi. Sonuçlar, konuşmacının ses benzerliğini korurken tüm dillerde anlaşılabilirliğin önemli ölçüde arttığını gösteriyor. Bu gelişme, bilimsel sunumların farklı dillere çevrilmesi, eğitim içeriklerinin yerelleştirilmesi ve çok dilli iletişim alanlarında devrim yaratabilir.
Teknoloji & Yapay Zeka
Yapay zekanın duygu analizi yeteneği tartışma konusu oldu
Araştırmacılar, konuşma sentezinde duygu değerlendirmesi için yaygın kullanılan metriklerin aslında yanıltıcı olduğunu ortaya koydu. Emotion2vec gibi duygu kodlayıcılarının benzerlik ölçümlerinin, gerçek duygusal ifadeleri değerlendirmede yetersiz kaldığı belirlendi. Çalışma, bu sistemlerin linguistic ve konuşmacı farklılıklarından etkilenerek, duygusal özellikleri doğru algılayamadığını gösteriyor. İnsan algısıyla uyumsuz olan bu yaklaşımın, gerçek duygusal sentez yerine sadece akustik taklidi ödüllendirdiği tespit edildi. Bu bulgular, konuşma teknolojilerinde duygu değerlendirme yöntemlerinin yeniden gözden geçirilmesi gerektiğine işaret ediyor.
Teknoloji & Yapay Zeka
Su Altı Görüntü Tanımada Alan Etkisi: Gerçek Koşullar Yapay Zekayı Yanıltıyor
Bilim insanları, su altı ortamlarında çalışan yapay zeka sistemlerinin neden beklenmedik hatalar yaptığını araştırıyor. Mevcut test yöntemlerinin gerçek su altı koşullarını yeterince simüle edemediği ortaya çıktı. Araştırmacılar, görünürlük, aydınlatma ve sahne kompozisyonu gibi fiziksel faktörleri dikkate alan yeni bir değerlendirme çerçevesi geliştirdi. Bu yaklaşım, su altı robotlarından deniz bilimine kadar birçok alanda kullanılan görüntü tanıma sistemlerinin performansını artırabilir.