Makine öğrenmesinde ensemble yöntemleri, birden fazla modelin tahminlerini birleştirerek daha güvenilir sonuçlar elde etmeyi amaçlar. Ancak yeni bir araştırma, bu yaklaşımın zaman serisi verileri gibi birbirine bağımlı veri kümelerinde beklenen performansı gösteremediğini matematiksel olarak kanıtladı.
Çoğunluk oylama ensemble sistemleri, farklı ve yaklaşık olarak bağımsız öğrenicilerin ortalamalarını alarak varyans azaltımı sağlar. Ancak veri noktaları arasında Markov bağımlılığı bulunduğunda - finansal zaman serileri, pekiştirmeli öğrenme hafıza tamponları ve uzaysal ızgaralar gibi durumlarda - bu klasik garanti zayıflar.
Araştırmacılar, sabit boyutlu Markov ortamında ayrık sınıflandırma için minimax karakterizasyonu sağladı ve grafik düzenli alt sınıfta optimal hızla eşleşen uyarlanabilir bir algoritma geliştirdi. Sabit ortam boyutunda durağan, tersine çevrilebilir ve geometrik ergodik zincirler için bilgi-teorik alt sınır belirlediler.
Bulgulara göre, hiçbir ölçülebilir tahmin edici karışma süresi ile veri sayısının oranının karekökünden daha iyi sınıflandırma risk performansı elde edemez. Bu matematiksel sınır, bağımlı verilerde ensemble yöntemlerinin doğal limitlerini gösteriyor.
Çalışma, yapay zeka sistemlerinin gerçek dünya verilerinde daha etkili çalışması için yeni yaklaşımlar geliştirilmesi gerektiğini ortaya koyuyor.