Sparse Veriler İçin Yeni Boyut İndirgeme Yöntemi: p-SNE

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, kelime sayıları, nöron aktiviteleri veya e-posta istatistikleri gibi sparse (seyrek) sayma verilerini analiz etmek için özel olarak tasarlanmış yeni bir boyut indirgeme yöntemi geliştirdi. Geleneksel PCA ve t-SNE gibi yöntemler sürekli veriler için optimize edilirken, yeni p-SNE yöntemi Poisson dağılımını takip eden discrete (ayrık) verilerin doğasına uygun şekilde tasarlandı. Bu yaklaşım, özellikle düşük oranlarla gerçekleşen olayların sayımında ortaya çıkan yoğun sıfır değerleri içeren veri setlerinde daha anlamlı sonuçlar üretiyor. Bilim insanları için metin analizi, nörobilim ve dijital iletişim araştırmalarında önemli bir araç olma potansiyeli taşıyor.

Bilim dünyasında karşımıza çıkan pek çok veri türü, belirli olayların ne kadar sıklıkla gerçekleştiğini gösteren sayımlardan oluşur. Bir dokümanın hangi kelimeleri kaç kez içerdiği, nöronların belirli zaman aralıklarında kaç kez ateşlediği veya günlük e-posta trafiği gibi ölçümler bu kategoriye girer.

Bu tür veriler genellikle Poisson dağılımına uyar ve çoğunlukla düşük oranlarla gerçekleşen olayları içerir. Bu durum, veri setlerinde çok sayıda sıfır değerinin bulunmasına yol açar ve analizi zorlaştırır. Araştırmacılar bu sorunu çözmek için genellikle boyut indirgeme yöntemlerine başvurur - yani yüksek boyutlu veriyi daha düşük boyutlarda temsil ederek anlamlı yapıları korumaya çalışır.

Ancak mevcut yöntemler önemli bir eksiklik taşıyor. PCA gibi doğrusal yöntemler ve t-SNE gibi doğrusal olmayan yaklaşımlar, sürekli Öklid geometrisi varsayımına dayanıyor. Bu da ayrık ve sparse doğaya sahip düşük oranlı sayma verileriyle uyumsuzluk yaratıyor.

Yeni geliştirilen p-SNE (Poisson Stochastic Neighbor Embedding) yöntemi bu soruna doğrudan hitap ediyor. Bu nonlinear komşu gömme tekniği, sparse Poisson verilerinin kendine özgü özelliklerini dikkate alarak daha uygun bir boyut indirgeme sağlıyor. Özellikle metin madenciliği, nörobilim ve dijital iletişim araştırmalarında kullanılması bekleniyor.

Etiketler

#boyut indirgeme #makine öğrenmesi #veri analizi #poisson dağılımı #sparse veri

Özgün Kaynak

Neighbor Embedding for High-Dimensional Sparse Poisson Data

https://arxiv.org/abs/2604.16932

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka

16 sa önce

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Son 40 yılın başkanlık seçimlerini analiz eden araştırmacılar, Amerikan siyasetindeki büyük değişimin arkasında yaygın kanaatin aksine işçi sınıfının değil, varlıklı ve yüksek eğitimli beyaz seçmenlerin olduğunu ortaya koydu. Çalışma, bu grubun istikrarlı bir şekilde Demokrat Parti'ye yöneldiğini gösteriyor. Bulgular, siyasi yeniden yapılanmanın nedenlerine dair genel kabul görmüş görüşleri sorguluyor ve elit seçmenlerin siyasi tercihlerindeki değişimin rolünü ön plana çıkarıyor. Araştırma, demografik değişimlerin siyasi davranış üzerindeki etkilerini anlamak için önemli veriler sunuyor.

PsyPost Oku

Teknoloji & Yapay Zeka

20 sa önce

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Dil ve dilbilim alanındaki iki yeni çalışma dikkat çekici sorulara yanıt arıyor. Almeida'nın Humanities and Social Sciences Communications'da yayınlanan makalesi gülmenin doğasını felsefi ve bilimsel açıdan inceliyor. Diğer yandan Leivada ve ekibinin Philosophical Transactions of the Royal Society A'da yayınlanan araştırması, büyük dil modellerinin gerçekten insan dilini ve kelimelerin arkasındaki dünyayı anlayıp anlamadığını sorguluyor. Her iki çalışma da insan iletişiminin karmaşıklığını farklı perspektiflerden ele alıyor.

Language Log Oku

Teknoloji & Yapay Zeka

22 sa önce

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor

Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost Oku