Büyük dil modellerinin matematik yetenekleri genellikle sözel problemlerle test edilirken, gerçek hayattaki uygulamalarda sıkça karşılaşılan tablo verisiyle çalışma becerileri göz ardı ediliyordu. Bu eksikliği gidermek için araştırmacılar TabularMath sistemini geliştirdi.

Yeni sistem, AutoT2T adlı nöro-sembolik bir çerçeve kullanarak geleneksel matematik problemlerini kontrollü bir şekilde tablo formatına dönüştürüyor. Bu yaklaşım, manuel olarak toplanan tablolara bağımlılığı ortadan kaldırarak ölçeklenebilir bir değerlendirme imkanı sunuyor.

TabularMath'in en önemli özelliği, gerçek dünya koşullarını simüle etmesi. İş zekası uygulamalarında sıkça karşılaşılan eksik bilgiler, tutarsız veriler ve yanıltıcı unsurlarla başa çıkma yeteneğini test ediyor. Bu durum, yapay zekanın sadece ideal koşullarda değil, gerçek çalışma ortamlarında da güvenilir sonuçlar üretebilmesini sağlıyor.

Sistem dört farklı alt kategori içeriyor ve hem metin tabanlı hem de tablo formatındaki görevleri kapsıyor. Bu çok boyutlu yaklaşım, AI modellerinin farklı veri türleriyle çalışma yeteneklerini kapsamlı bir şekilde değerlendirme imkanı veriyor.

Bu gelişme, finans analizi, iş zekası ve veri bilimi alanlarında AI'nın daha etkili kullanılmasının yolunu açıyor.