"program doğrulama" araması — BilimKapsül

...

Arama Sonuçları

173 haber

Teknoloji & Yapay Zeka

Yapay zeka ajanları artık kendi yazdıkları kodları test edebiliyor

Araştırmacılar, büyük dil modellerinin kod yazabildiği ama doğruluğunu kontrol edemediği sorununa çözüm getiren AgentForge adlı sistemi geliştirdi. Bu yenilikçi çerçeve, beş farklı AI ajanının koordineli çalışmasıyla yazılım geliştirme sürecini otomatikleştiriyor. Planlayıcı, kodlayıcı, test edici, hata ayıklayıcı ve eleştiri ajanlarından oluşan ekip, her kod değişikliğini güvenli bir test ortamında çalıştırarak doğruluğunu kontrol ediyor. Sistem, yazılım mühendisliğini iteratif bir karar süreci olarak modelleyerek, geleneksel token tabanlı yaklaşımlar yerine gerçek çalıştırma geri bildirimini kullanıyor. SWE-BENCH Lite test setinde %40 başarı oranına ulaşan AgentForge, tek ajan sistemlerinden 26-28 puan daha iyi performans gösteriyor. Bu gelişme, AI destekli yazılım geliştirmede önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 30 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Program Sentezi Hızlandı: Yeni Öngörü Tekniği Geliştirildi

Araştırmacılar, bilgisayar programlarını otomatik olarak üreten yapay zeka sistemlerini hızlandırmak için yenilikçi bir yaklaşım geliştirdi. 'Presynthesis' adı verilen bu teknik, program sentezi sürecinde karşılaşılan temel bir sorunu çözüyor. Normalde daha ayrıntılı soyut semantikler kullanıldığında, yanlış programlar daha iyi ayıklanabilir ancak bu işlem daha uzun sürer. Yeni yaklaşım, çevrimdışı bir ön-hazırlık aşaması ekleyerek bu dengeyi optimize ediyor. İlk aşamada girdi uzayı için bir ağaç otomatı oluşturuluyor, ikinci aşamada ise bu otomatın gereksiz kısımları ayıklanıyor. Bu sayede program sentezi hem daha hızlı hem de daha verimli hale geliyor. Gelişme, otomatik kod üretimi ve yazılım geliştirme araçları için önemli iyileştirmeler vaat ediyor.

arXiv (CS + AI) · 30 gün önce

Teknoloji & Yapay Zeka

Yapay zeka güvenlik filtrelerinde yeni örnekleme yöntemi geliştirildi

Otonom sistemlerde güvenlik kısıtlamalarının korunması için kullanılan güvenlik filtrelerinin performansını artıran yeni bir yöntem geliştirildi. Araştırmacılar, Pontryagin Maksimum Prensibi kullanarak güvenlik ihlallerini zar zor önleyen sınır yörüngelerini karakterize etti. Bu yaklaşım, öğrenme tabanlı Hamilton-Jacobi Erişilebilirlik sistemlerinde veri toplama sürecini yönlendirerek, güvenlik açısından kritik durumlar yakınında öğrenme çabalarını yoğunlaştırıyor. Geliştirilen Kontrol Bariyeri Değer Fonksiyonu doğrudan güvenlik filtrelemesi için kullanılabiliyor. Yöntem, özellikle yüksek boyutlu karmaşık sistemlerde kısıt ihlallerine yol açabilecek durumları içeren bilgilendirici verilerin örneklenmesi sorununa çözüm getiriyor. Otonom araç yarışı uygulamasında yapılan deneysel doğrulamalar, PMP örnekleme yönteminin öğrenme verimliliğini artırdığını, daha hızlı yakınsama sağladığını ve başarısızlık oranlarını azalttığını gösterdi.

arXiv (CS + AI) · 30 gün önce

Tıp & Sağlık

VerifAI: Tıbbi Sorulara Doğrulanabilir Yanıt Veren Yeni Yapay Zeka Sistemi

Araştırmacılar, biyomedikal alanda sorulan sorulara yanıt veren ve her bilgiyi kaynaklarıyla doğrulayabilen VerifAI adlı yeni bir yapay zeka sistemi geliştirdi. Sistem, ürettiği her yanıtı küçük parçalara bölerek bilimsel literatürle karşılaştırıyor ve yanlış bilgi üretme riskini minimize ediyor. Geleneksel yapay zeka modellerinden farklı olarak, VerifAI her iddiasını kaynaklarıyla destekliyor ve şeffaf bir doğrulama mekanizması sunuyor. Test sonuçları, sistemin GPT-4'ü bile geride bırakacak doğrulukta çalıştığını gösteriyor. Sağlık alanında yapay zeka kullanımının güvenilirliğini artırmayı hedefleyen bu sistem, açık kaynak olarak sunularak tüm araştırmacıların erişimine açıldı. Özellikle tıbbi karar verme süreçlerinde yanlış bilginin hayati sonuçlar doğurabileceği düşünüldüğünde, bu gelişme büyük önem taşıyor.

arXiv (CS + AI) · 33 gün önce

← 1 … 13 14 15 →