Stanford Üniversitesi araştırmacıları, yapay zeka ajanlarının bilimsel araştırmalardaki potansiyelini ve sınırlarını anlamak için kapsamlı bir değerlendirme platformu geliştirdi. Stargazer adı verilen bu sistem, AI ajanlarının astrofizik alanında karşılaştıkları zorluklarla başa çıkma yeteneklerini test ediyor.
Platform, özellikle gezegen avcılığında kullanılan radyal hız yöntemi üzerine odaklanıyor. Bu teknik, yıldızların etrafında dönen gezegenlerin çekim kuvveti nedeniyle oluşturduğu küçük salınımları ölçerek gezegen varlığını tespit etmeye yarıyor. Stargazer, bu karmaşık analiz sürecini simüle eden 120 farklı görev içeriyor.
Test ortamı üç zorluk seviyesinde düzenlenmiş: tek gezegenli basit sistemlerden, çoklu gezegen yapılarına kadar uzanan geniş bir spektrum sunuyor. Araştırmacılar, gerçek arşiv verilerinden 20 vaka da dahil ederek platformun gerçekçiliğini artırdı.
Sekiz farklı yapay zeka ajanının değerlendirildiği çalışmada dikkat çekici sonuçlar ortaya çıktı. AI sistemleri, matematiksel optimizasyon konusunda oldukça başarılı performans sergilerken, fiziksel gerçekleri göz ardı etme eğilimi gösterdi. Ajanlar istatistiksel açıdan tatmin edici sonuçlar üretse de, gerçek gezegen sistemlerinin parametrelerini doğru tespit etmekte yetersiz kaldı.
Bu bulgular, yapay zekanın bilimsel araştırmalarda kullanımında önemli bir uyarı niteliği taşıyor ve AI sistemlerinin fiziksel kısıtlamaları daha iyi anlayacak şekilde geliştirilmesi gerektiğini gösteriyor.