“değerlendirme platformu” için sonuçlar
2 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yer Gözlem Uyduları İçin Kapsamlı Çizelgeleme Kıyaslama Platformu Geliştirildi
Bilim insanları, yer gözlem uydularının görev planlaması için kapsamlı bir değerlendirme platformu geliştirdi. EOS-Bench adı verilen bu sistem, yeni nesil çevik uyduların artan operasyonel karmaşıklığına çözüm arıyor. Platform, yüksek hassasiyetli yörünge dinamikleri ve platform kısıtlamalarını entegre ederek 1.390 senaryo ve 13.900 test örneği üretiyor. Küçük ölçekli doğrulama vakalarından 1.000 uyduya ve 10.000 isteğe kadar çıkabilen büyük koordinasyon problemlerine uzanan geniş bir yelpazeyi kapsıyor. Bu gelişme, uzay misyon operasyonlarında algoritma karşılaştırmasını standardize edecek ve gelecekteki uydu operasyonlarının verimliliğini artıracak.
Yapay zeka ajanları astrofizik testlerinde fiziksel gerçekleri göz ardı ediyor
Stanford araştırmacıları, yapay zeka ajanlarının bilimsel araştırmalardaki yeteneklerini test etmek için Stargazer adlı yeni bir değerlendirme platformu geliştirdi. Bu platform, AI ajanlarının gezegen keşfi için kullanılan radyal hız verilerini analiz etme becerilerini ölçüyor. 120 farklı görevden oluşan test ortamında, sekiz farklı yapay zeka ajanının performansı değerlendirildi. Sonuçlar, AI ajanlarının istatistiksel olarak iyi sonuçlar elde etmesine rağmen, fiziksel kısıtlamaları dikkate almada ciddi eksiklikleri olduğunu ortaya koydu. Ajanlar matematiksel optimizasyonda başarılı olsa da, gerçek fiziksel sistem parametrelerini doğru şekilde tespit etmekte zorlanıyor. Bu durum, yapay zekanın bilimsel araştırmalarda kullanımında dikkat edilmesi gereken önemli bir sınırlılığa işaret ediyor.