Makine öğrenmesinin temel araçlarından olan karar ormanları, veri örnekleri arasındaki benzerlikleri ağaç yapılarının bölümleme mantığı üzerinden hesaplıyor. Ancak bu yakınlık hesaplamaları, büyük veri setlerinde ciddi performans darboğazlarına neden oluyordu.
Araştırmacılar, bu sorunu çözmek için Ayrılabilir Ağırlıklı Yaprak Çarpışması (SWLC) adını verdikleri yeni bir çekirdek yaklaşımı geliştirdi. Bu yöntem, mevcut yakınlık ölçüm tekniklerinin aslında sadece ağırlıklandırma şemalarında farklılaştığını, temelinde ise ortak bir seyrek yaprak yapısı paylaştığını ortaya koyuyor.
Geleneksel yaklaşımlarda, n örnekli bir veri setinde yakınlık hesaplaması n² işlem gerektiriyordu - yani her örneği diğer tüm örneklerle karşılaştırmak gerekiyordu. Yeni algoritma, bu yaklaşım yerine seyrek lineer cebir işlemlerini kullanarak hesaplama karmaşıklığını önemli ölçüde azaltıyor.
Araştırmacılar, bu teorik gelişmeyi pratik uygulamaya dönüştürmek için bellek verimli bir Python kütüphanesi de geliştirdi. Bu kütüphane, büyük veri setlerinde kernel yöntemleri ve temsil öğrenme algoritmalarında karar ormanlarının daha yaygın kullanımını mümkün kılacak.
Çalışma, yapay zeka ve makine öğrenmesi alanlarında scalability (ölçeklenebilirlik) sorunlarına yenilikçi bir çözüm sunarak, büyük veri analitiği uygulamalarında önemli performans iyileştirmeleri vaat ediyor.