Derin öğrenme modelleri her ne kadar matematiksel fonksiyonları çalıştırsa da, bu modellerin mimarilerini tanımlayacak resmi bir matematiksel çerçeveden yoksunduk. Araştırmacılar bu soruna çözüm getiren yenilikçi bir yaklaşım geliştirdi.
Mevcut yöntemlerde model mimarileri genellikle geçici notasyonlar, diyagramlar ve sözde kodlarla tanımlanıyor. Ancak bu yaklaşımlar, özellikle doğrusal olmayan yayın işlemlerini ve bireysel bileşenler ile birleştirilmiş modeller arasındaki ilişkiyi yeterince ele alamıyor.
Yeni araştırma, kategori teorisine dayanan bir çerçeve sunuyor. Bu sistem, 'eksen-adım' ve 'dizi-yayınlanmış' kategoriler adı verilen yenilikçi kavramlarla yayın işlemlerini resmileştiriyor. Bu sayede, mimari yapıların altında yatan matematiksel fonksiyonlar kesin bir şekilde ifade edilebiliyor ve bileşimsel bir şekilde manipüle edilebiliyor.
Araştırmacılar, bu matematiksel tanımlamaları hem insanlar tarafından yönetilebilir diyagramlara hem de makineler tarafından işlenebilir veri yapılarına dönüştürmeyi başardı. Sistemin evrensel uygulanabilirliğini göstermek için Python ve TypeScript dillerinde paralel uygulamalar hazırlandı.
Bu çalışma, yapay zeka modellerinin tasarımı ve analizinde daha sistematik bir yaklaşımın temellerini atıyor.