Bilim dünyasında karşımıza çıkan pek çok veri türü, belirli olayların ne kadar sıklıkla gerçekleştiğini gösteren sayımlardan oluşur. Bir dokümanın hangi kelimeleri kaç kez içerdiği, nöronların belirli zaman aralıklarında kaç kez ateşlediği veya günlük e-posta trafiği gibi ölçümler bu kategoriye girer.

Bu tür veriler genellikle Poisson dağılımına uyar ve çoğunlukla düşük oranlarla gerçekleşen olayları içerir. Bu durum, veri setlerinde çok sayıda sıfır değerinin bulunmasına yol açar ve analizi zorlaştırır. Araştırmacılar bu sorunu çözmek için genellikle boyut indirgeme yöntemlerine başvurur - yani yüksek boyutlu veriyi daha düşük boyutlarda temsil ederek anlamlı yapıları korumaya çalışır.

Ancak mevcut yöntemler önemli bir eksiklik taşıyor. PCA gibi doğrusal yöntemler ve t-SNE gibi doğrusal olmayan yaklaşımlar, sürekli Öklid geometrisi varsayımına dayanıyor. Bu da ayrık ve sparse doğaya sahip düşük oranlı sayma verileriyle uyumsuzluk yaratıyor.

Yeni geliştirilen p-SNE (Poisson Stochastic Neighbor Embedding) yöntemi bu soruna doğrudan hitap ediyor. Bu nonlinear komşu gömme tekniği, sparse Poisson verilerinin kendine özgü özelliklerini dikkate alarak daha uygun bir boyut indirgeme sağlıyor. Özellikle metin madenciliği, nörobilim ve dijital iletişim araştırmalarında kullanılması bekleniyor.