Teknoloji & Yapay Zeka
BAGEL: Yapay Zekâ Modellerinin Hayvan Bilgisi Ölçülüyor
Araştırmacılar, büyük dil modellerinin hayvan bilgisi konusundaki uzmanlığını değerlendirmek için BAGEL adlı yeni bir kıyaslama sistemi geliştirdi. Bu sistem, yapay zekâ modellerinin taksonomi, morfoloji, yaşam alanları, davranış kalıpları ve coğrafi dağılım gibi hayvan bilimi konularındaki performanslarını ölçüyor. BAGEL, bioRxiv, Wikipedia ve diğer bilimsel kaynaklardan toplanan verilerle oluşturulmuş sorular içeriyor ve modellerin dış kaynaklara erişim olmadan ne kadar bilgi sahibi olduğunu test ediyor. Bu çalışma, genel bilgi testlerinde başarılı olan yapay zekâ sistemlerinin özelleşmiş alanlardaki performanslarının henüz net olmadığı bir dönemde önemli bir değerlendirme aracı sunuyor.