Yapay zeka teknolojisinin güvenlik açısından kritik alanlarda kullanımı, standart testlerden çok daha sıkı değerlendirme kriterleri gerektiriyor. Bu ihtiyacı karşılamak için araştırmacılar, hipersonik araçların termal koruma sistemlerinde yapay zekanın hesaplama yeteneğini test eden yeni bir benchmark sistemi geliştirdi.

TPS-CalcBench adı verilen bu sistem, hipersonik aerodinamik ve yüksek sıcaklık gaz dinamiği alanlarındaki kapalı-form analitik hesaplamaları değerlendiriyor. Bu hesaplamalar, deneyimli termal koruma sistemi mühendislerinin simülasyon kullanmadan gerçekleştirdiği kritik işlemler.

Sistemin geliştirilmesindeki temel motivasyon, mevcut bilimsel benchmarkların yetersizlikleri. Geleneksel testler sadece soyut matematik ve temel fizik bilgisini ölçüyor, nihai cevapları değerlendiriyor ancak mühendislik mantık sürecini göz ardı ediyor. En kritik eksiklik ise, fiziksel olarak geçersiz ama sayısal olarak makul görünen yanıtları tespit edememesi.

Hipersonik araçlarda durgunluk noktası ısı akısı veya sınır tabaka hesaplamalarındaki hatalar, tasarım güvenlik marjlarının ihlal edilmesine ve felaketle sonuçlanabilecek durumlara yol açabilir. Bu nedenle, yanlış ama mantıklı görünen cevaplar veren AI modelleri, hiç cevap vermeyen modellerden daha tehlikeli.

Yeni benchmark, 4 farklı zorluk seviyesi ve 8 kategoriyi kapsayan kapsamlı bir test paketi sunuyor. Bu sistemle hipersonik havacılık mühendisliğinde AI'ın güvenli kullanımı için gerekli sıkı değerlendirme standartları sağlanmış oluyor.