ScholarGate
Asistan

Boyut İndirgeme

Boyut indirgeme, birçok ilişkili değişkeni az sayıda türetilmiş nicelikle özetleyen, yorumlamayı ve görselleştirmeyi kolaylaştırırken mümkün olduğunca fazla yapıyı koruyan çok değişkenli yöntemleri içermektedir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Boyut indirgeme, çok değişkenli verilerin varyans, yeniden yapılandırma hatası, ikili mesafe veya kümeler arası korelasyon gibi belirlenmiş bir bilgi kriterini koruyan daha düşük boyutlu bir temsilinin oluşturulmasıdır.

Kapsam

Bu alan, yüksek boyutlu gözlemleri daha düşük boyutlu bir uzaya eşleyen teknikleri kapsamaktadır. Bu teknikler arasında varyansı maksimize eden doğrusal izdüşümler (temel bileşen analizi), paylaşılan kovaryans için gizli faktör modelleri (faktör analizi), mesafeyi koruyan gömmeler (çok boyutlu ölçekleme) ve çapraz korelasyonu maksimize ederek iki değişken kümesini birlikte indirgeyen yöntemler (kanonik korelasyon analizi) yer almaktadır. Vurgu, disiplinin temelini oluşturan doğrusal ve klasik yaklaşımlar üzerindedir; doğrusal olmayan manifold öğrenimi bir uzantı olarak ele alınmaktadır.

Alt konular

Temel sorular

  • Büyük bir ilişkili ölçüm kümesi, minimum bilgi kaybıyla nasıl az sayıda ilişkisiz türetilmiş değişkenle değiştirilebilir?
  • Varyans koruma, mesafe koruma veya gizli faktör açıklaması ne zaman indirgeme kriteri olmalıdır?
  • Veriyi yeterince temsil etmek için kaç boyuta ihtiyaç vardır?
  • İndirgenmiş temsiller görselleştirmeyi, gürültü gidermeyi ve sonraki modellemeyi nasıl desteklemektedir?

Temel kuramlar

Varyansı maksimize eden doğrusal izdüşüm
Önde gelen temel eksenler, ardışık olarak maksimum varyansı yakalayan, kovaryans matrisinin özvektörlerine ve verinin en iyi düşük ranklı en küçük kareler yaklaşımına eşdeğer olan ortonormal yönlerdir.
Gizli ortak faktör modeli
Değişkenler arasındaki gözlemlenen korelasyonlar, daha az sayıda gözlemlenmeyen ortak faktör ve değişkene özgü benzersizlik ile açıklanmakta, bu da kovaryans yapısını paylaşılan ve benzersiz kısımlara ayırmaktadır.

Klinik önem

Boyut indirgeme, genomikten ekonometriye ve görüntü analizine kadar çeşitli alanlarda keşifsel veri analizi, veri görselleştirme, sinyal gürültü giderme, sıkıştırma ve regresyon ile sınıflandırma için özelliklerin ön işlenmesinin temelini oluşturmaktadır.

Tarihçe

Varyansı maksimize etme görüşü, Pearson'ın 1901'deki en uygun çizgiler ve düzlemlerin geometrik formülasyonuyla ortaya çıkmış ve 1933'te Hotelling tarafından temel bileşenlerin modern istatistiksel yöntemine dönüştürülmüştür. Faktör analizi, psikometriden paralel olarak gelişmiş, mesafe tabanlı ölçekleme ve kanonik korelasyon bunu takip ederek yirminci yüzyıl ortalarındaki çok değişkenli metinlerde bulunan boyut indirgemenin birleşik bir yaklaşımına dönüşmüştür.

Öne çıkan isimler

  • Karl Pearson
  • Harold Hotelling

İlgili konular

Temel eserler

  • pearson1901
  • mardia1979
  • johnson2007

Sıkça sorulan sorular

Boyut indirgeme ile değişken seçimi arasındaki fark nedir?
Değişken seçimi, orijinal değişkenlerin bir alt kümesini korurken, boyut indirgeme genellikle tüm orijinallerin kombinasyonları olan yeni türetilmiş değişkenler (bileşenler veya faktörler gibi) oluşturmaktadır.
Boyut indirgeme her zaman doğrusal mıdır?
Hayır. Klasik çekirdek yöntemler doğrusaldır, ancak aynı hedefler doğrusal olmayan manifold öğrenme ve gömme teknikleri tarafından da takip edilmektedir; doğrusal yöntemler temel ve yorumlanabilir kalmaktadır.

Bu kavram için yöntemler

İlgili kavramlar