"program doğrulama" araması

Arama Sonuçları

173 haber

Yapay Zeka Sesli Diyaloglarda Konuşmacı Tutarlılığını Değerlendirmekte Zorlanıyor

Araştırmacılar, büyük ses-dil modellerinin çoklu konuşmalı diyaloglarda konuşmacı tutarlılığını ne kadar iyi değerlendirebildiğini test eden SpeakerSleuth adlı yeni bir kıyas sistemi geliştirdi. 12 popüler yapay zeka modelinin test edildiği çalışmada, modellerin aynı kişinin farklı konuşma turlarındaki ses tutarlılığını güvenilir şekilde tespit etmekte ciddi zorluklar yaşadığı ortaya çıktı. 1.818 insan doğrulamalı test örneğinin kullanıldığı araştırma, bazı modellerin gereksiz yere tutarsızlık algıladığını, diğerlerinin ise çok hoşgörülü davrandığını gösterdi. Bu bulgular, ses teknolojilerinde kalite değerlendirme sistemlerinin geliştirilmesi gereken alanları işaret ediyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Büyük Dil Modelleriyle Metin Kümeleme Devrimleşiyor

Araştırmacılar, büyük metin koleksiyonlarını analiz etmek için kullanılan denetimsiz kümeleme yöntemlerinin zayıflıklarını gidermede çığır açan bir yaklaşım geliştirdi. Geleneksel yöntemler çoğunlukla tutarsız, tekrarlayan veya anlamsız kümeler üretiyor. Yeni çerçeve, büyük dil modellerini gömme üreticisi olarak değil, semantik hakim olarak kullanarak kümeleme sonuçlarını doğruluyor ve yeniden yapılandırıyor. Sistem üç aşamalı akıl yürütme süreci içeriyor: tutarlılık doğrulama, gereksizlik değerlendirmesi ve etiket temellendirme. Bu yaklaşım, etiketli veri gerektirmeden metin analizi sonuçlarının kalitesini önemli ölçüde artırıyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Otonom araçlar için uydu destekli güvenlik sisteminde yeni planlama algoritması

Araştırmacılar, otonom araç konvoylarının alçak yörünge uyduları üzerinden aldığı güvenlik kritik güncellemeler için yeni bir zamanlama sistemi geliştirdi. Sistem, hem uydu hem de araç hareketinden kaynaklanan Doppler etkisi, uydu geçişlerinde yaşanan kesintiler ve farklı öncelik sınıflarındaki araçların değişken veri tazelik ihtiyaçlarını bir arada ele alıyor. Mevcut sistemlerin aksine, bu yaklaşım kaba kontrol dilimlerinin gizlediği kısa süreli kesintileri de hesaba katarak, güvenlik doğrulamasını ve veri yaşı analizini daha doğru hale getiriyor. Ping-pong tipi uydu geçişlerinin neden olduğu veri yaşı maliyetinin kümülatif cezasının, salınım uzunluğuyla karesel olarak arttığı matematiksel olarak kanıtlandı.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Belge Analizi İçin Yeni Hiyerarşik Model Geliştirildi

Araştırmacılar, farklı belgeler arasındaki bağlantıları tespit etmek için büyük dil modelleri tabanlı yeni bir sistem geliştirdi. HCRE adlı bu sistem, belgelerdeki varlıklar arasındaki ilişkileri hiyerarşik bir yaklaşımla sınıflandırıyor. Geleneksel küçük dil modellerinin sınırlı anlama kapasitesi nedeniyle büyük dil modellerine yönelimin arttığı bu alanda, araştırma ekibi beklenmedik bir keşif yaptı: büyük dil modelleri her zaman daha iyi performans göstermiyordu. Sorunun çok sayıda önceden tanımlanmış ilişki türünden kaynaklandığını tespit eden bilim insanları, bu zorluğu aşmak için tahmin-ardından-doğrulama stratejisi kullanan iki bileşenli bir model tasarladı. Bu gelişme, belge analizi ve bilgi çıkarma alanında önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Kod Üretiminde Yeni Yaklaşım: Olasılıklı Düşünce Programları

Araştırmacılar, büyük dil modellerinin kod üretimi ve matematiksel akıl yürütme performansını artırmak için 'olasılıklı düşünce programları' adını verdikleri yeni bir test-zamanı çerçevesi geliştirdi. Bu yöntem, modelin daha az GPU hesaplaması kullanarak daha fazla kod örneği üretmesini sağlıyor. Geleneksel yaklaşımda uygun bir program elde edilene kadar sürekli örnekleme yapılırken, yeni teknik modelin olasılık dağılımını doğrudan programlara entegre ederek maliyetli hesaplama sürecini optimize ediyor. Özellikle büyük ölçekli kod üretimi projelerinde kaynak kullanımını dramatik şekilde azaltma potansiyeline sahip bu gelişme, yapay zeka destekli programlama araçlarının verimliliğini artırabilir.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

RefineStat: Yapay Zeka ile Olasılıklı Program Yazımında Yeni Dönem

Araştırmacılar, küçük dil modellerinin olasılıklı program yazarken yaptıkları hataları düzelten yenilikçi bir çerçeve geliştirdi. RefineStat adlı sistem, yapay zekanın belirsizlik içeren matematiksel modeller oluştururken karşılaştığı sözdizimi ve anlam hatalarını otomatik olarak tespit edip düzeltiyor. Olasılıklı programlama, belirsizliklerle dolu gerçek dünya problemlerini modellemek için güçlü bir araç olmasına rağmen, AI modellerinin bu alanda doğru kod üretmesi oldukça zordu. Yeni yaklaşım, alan uzmanlarının hata ayıklama stratejilerinden ilham alarak, üretilen programların geçerli dağılımlar içermesini ve parametrelerin doğru biçimde oluşturulmasını sağlıyor. Güvenilirlik kontrolleri başarısız olduğunda sistem, problematik bileşenleri yeniden örnekliyor ve iyileştiriyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Güvenlik Kritik Sistemlerin Gereksinimlerini Otomatik Formalize Ediyor

Güvenlik kritik sistemlerin erken geliştirme aşamalarında doğal dille yazılan gereksinimler, doğrulama için uygun formal özelliklere dönüştürülmesi zor belgeler oluşturuyor. Araştırmacılar, büyük dil modellerini kullanan yeni bir yaklaşım geliştirerek bu soruna çözüm getirdi. Geliştirilen otonom metodoloji, yapılandırılmamış şartnamelerden doğrulama için hazır özellikler otomatik olarak çıkarabiliyor. Sistem, gereksinim çıkarma, uyumluluk filtreleme ve formal özelliklere çeviri işlemlerini modüler bir yapıda birleştiriyor. Üç farklı senaryoda yapılan deneyler, sistemin %77.8 doğruluk oranıyla hem sözdizimsel hem de anlamsal olarak uyumlu formal özellikler ürettiğini gösteriyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ajanları Ağ Güvenliğini Otomatik Doğruluyor

Araştırmacılar, ağ değişikliklerini doğrulamak için yapay zeka ajanları ve dijital ikiz teknolojisini birleştiren Aether adlı yeni bir sistem geliştirdiler. Modern ağ işletiminde kritik öneme sahip olan ağ değişikliği doğrulama süreci, şu anda büyük oranda manuel olarak yapılıyor ve bu durum zaman kaybına ve hatalara yol açıyor. Mevcut yaklaşımlar genellikle dağınık test araçları kullanıyor ve kısmi kapsama sunuyor, hatalar ancak sistemin devreye alınmasından sonra ortaya çıkıyor. Aether sistemi, beş özel ağ operasyonu AI ajanının işbirliği içinde çalıştığı bir mimariyle bu sorunu çözmeyi hedefliyor. Bu ajanlar, niyet analizinden ağ doğrulama ve testine kadar tüm değişiklik doğrulama yaşam döngüsünü otomatik olarak yönetebiliyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay zeka ajanları artık kendi performanslarını değerlendirebiliyor

Araştırmacılar, yapay zeka ajanlarının kendi davranışlarını değerlendirmesini sağlayan yeni bir sistem geliştirdi. 'Agent-as-a-Judge' adlı bu yaklaşım, geleneksel değerlendirme yöntemlerinin aksine çevreyle aktif etkileşim kurarak kanıt toplama yeteneğine sahip. Üç farklı alanda 155 görev üzerinde yapılan testlerde, bu sistem mevcut LLM tabanlı değerlendirici modellerin performansını geride bıraktı. Sistem, arama motorları, veri sistemleri ve grafik kullanıcı arayüzleri gibi karmaşık ortamlarda bilgi edinme, durum doğrulama ve süreç değerlendirme konularında başarılı sonuçlar verdi. Bu gelişme, yapay zeka sistemlerinin güvenilirliği ve özerk karar verme yetenekleri açısından önemli bir adım sayılıyor.

arXiv (CS + AI) · 25 gün önce

Uzay & Astronomi

Gizli Kara Delikler Avcılığında Yeni Yöntem: Ultraviyole Işık İzinde

Avrupa Uzay Ajansı'nın Gaia misyonundan elde edilen veriler sayesinde, astronomlar binlerce potansiyel kara delik ve nötron yıldızı ikili sistemi tespit etmişti. Yeni bir çalışmada araştırmacılar, bu adayların gerçekten de egzotik nesneler barındırıp barındırmadığını anlamak için spektral enerji dağılımı analizi ve ultraviyole fotometri yöntemlerini kullandı. 1.328 aday sistem incelenerek, gizli sıcak yoldaş yıldızların varlığı araştırıldı. Çalışma, ultraviyole fazlalığını ölçerek ve galaktik kinematiği analiz ederek, hangi sistemlerin gerçekten dormant kara delik veya nötron yıldızı barındırabileceğini belirlemeye odaklandı. Bu yaklaşım, önceki çalışmalarda sadece Gaia verilerine dayanan tespitleri doğrulamak için kritik öneme sahip.

arXiv (Astronomi) · 25 gün önce

Teknoloji & Yapay Zeka

Dijital Gizlilik Eğitimi: HCI Alanında Yeni Nesil Öğretim Yaklaşımı

Araştırmacılar, insan-bilgisayar etkileşimi (HCI) alanında gizlilik konusunun öğretimi için yenilikçi bir eğitim programı geliştirdi. Geleneksel teori ağırlıklı derslerden farklı olarak, 15 haftalık bu lisansüstü program aktif öğrenme yöntemleriyle gerçek dünya uygulamalarına odaklanıyor. Program, rol yapma aktiviteleri, vaka analizleri ve çok aşamalı araştırma projeleriyle öğrencilerin gizliliği farklı paydaş perspektiflerinden değerlendirmesini sağlıyor. Modern Gizlilik çerçevesine dayanan müfredat, hem kavramsal anlayış hem de uygulamalı araştırma becerilerini geliştirmeyi hedefliyor. Dijital sistemlerin yaygın veri toplama ve çıkarım süreçlerine dayandığı günümüzde, gelecekteki tasarımcı ve araştırmacıların kullanılabilir gizlilik konusunda eğitilmesi kritik önem taşıyor. İki yıl üst üste uygulanan programın değerlendirme sonuçları, bu yaklaşımın etkinliğini gösteriyor.

arXiv (CS + AI) · 25 gün önce

← 1 … 4 5 6 7 8 … 15 →