"program doğrulama" için 173 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
173 haber
Yapay zeka ajanları artık kendi yazdıkları kodları test edebiliyor
Araştırmacılar, büyük dil modellerinin kod yazabildiği ama doğruluğunu kontrol edemediği sorununa çözüm getiren AgentForge adlı sistemi geliştirdi. Bu yenilikçi çerçeve, beş farklı AI ajanının koordineli çalışmasıyla yazılım geliştirme sürecini otomatikleştiriyor. Planlayıcı, kodlayıcı, test edici, hata ayıklayıcı ve eleştiri ajanlarından oluşan ekip, her kod değişikliğini güvenli bir test ortamında çalıştırarak doğruluğunu kontrol ediyor. Sistem, yazılım mühendisliğini iteratif bir karar süreci olarak modelleyerek, geleneksel token tabanlı yaklaşımlar yerine gerçek çalıştırma geri bildirimini kullanıyor. SWE-BENCH Lite test setinde %40 başarı oranına ulaşan AgentForge, tek ajan sistemlerinden 26-28 puan daha iyi performans gösteriyor. Bu gelişme, AI destekli yazılım geliştirmede önemli bir adım teşkil ediyor.
arXiv (CS + AI) · 30 gün önce
0
Yapay Zeka Program Sentezi Hızlandı: Yeni Öngörü Tekniği Geliştirildi
Araştırmacılar, bilgisayar programlarını otomatik olarak üreten yapay zeka sistemlerini hızlandırmak için yenilikçi bir yaklaşım geliştirdi. 'Presynthesis' adı verilen bu teknik, program sentezi sürecinde karşılaşılan temel bir sorunu çözüyor. Normalde daha ayrıntılı soyut semantikler kullanıldığında, yanlış programlar daha iyi ayıklanabilir ancak bu işlem daha uzun sürer. Yeni yaklaşım, çevrimdışı bir ön-hazırlık aşaması ekleyerek bu dengeyi optimize ediyor. İlk aşamada girdi uzayı için bir ağaç otomatı oluşturuluyor, ikinci aşamada ise bu otomatın gereksiz kısımları ayıklanıyor. Bu sayede program sentezi hem daha hızlı hem de daha verimli hale geliyor. Gelişme, otomatik kod üretimi ve yazılım geliştirme araçları için önemli iyileştirmeler vaat ediyor.
arXiv (CS + AI) · 30 gün önce
0
Yapay zeka güvenlik filtrelerinde yeni örnekleme yöntemi geliştirildi
Otonom sistemlerde güvenlik kısıtlamalarının korunması için kullanılan güvenlik filtrelerinin performansını artıran yeni bir yöntem geliştirildi. Araştırmacılar, Pontryagin Maksimum Prensibi kullanarak güvenlik ihlallerini zar zor önleyen sınır yörüngelerini karakterize etti. Bu yaklaşım, öğrenme tabanlı Hamilton-Jacobi Erişilebilirlik sistemlerinde veri toplama sürecini yönlendirerek, güvenlik açısından kritik durumlar yakınında öğrenme çabalarını yoğunlaştırıyor. Geliştirilen Kontrol Bariyeri Değer Fonksiyonu doğrudan güvenlik filtrelemesi için kullanılabiliyor. Yöntem, özellikle yüksek boyutlu karmaşık sistemlerde kısıt ihlallerine yol açabilecek durumları içeren bilgilendirici verilerin örneklenmesi sorununa çözüm getiriyor. Otonom araç yarışı uygulamasında yapılan deneysel doğrulamalar, PMP örnekleme yönteminin öğrenme verimliliğini artırdığını, daha hızlı yakınsama sağladığını ve başarısızlık oranlarını azalttığını gösterdi.
arXiv (CS + AI) · 30 gün önce
0
VerifAI: Tıbbi Sorulara Doğrulanabilir Yanıt Veren Yeni Yapay Zeka Sistemi
Araştırmacılar, biyomedikal alanda sorulan sorulara yanıt veren ve her bilgiyi kaynaklarıyla doğrulayabilen VerifAI adlı yeni bir yapay zeka sistemi geliştirdi. Sistem, ürettiği her yanıtı küçük parçalara bölerek bilimsel literatürle karşılaştırıyor ve yanlış bilgi üretme riskini minimize ediyor. Geleneksel yapay zeka modellerinden farklı olarak, VerifAI her iddiasını kaynaklarıyla destekliyor ve şeffaf bir doğrulama mekanizması sunuyor. Test sonuçları, sistemin GPT-4'ü bile geride bırakacak doğrulukta çalıştığını gösteriyor. Sağlık alanında yapay zeka kullanımının güvenilirliğini artırmayı hedefleyen bu sistem, açık kaynak olarak sunularak tüm araştırmacıların erişimine açıldı. Özellikle tıbbi karar verme süreçlerinde yanlış bilginin hayati sonuçlar doğurabileceği düşünüldüğünde, bu gelişme büyük önem taşıyor.
arXiv (CS + AI) · 33 gün önce
0