Boyut İndirgeme
Boyut indirgeme, yüksek boyutlu verileri, en önemli yapısını koruyan az sayıda koordinatla temsil ederek görselleştirmeye, sıkıştırmaya ve sonraki öğrenme süreçlerine yardımcı olmaktadır.
Tanım
Boyut indirgeme, verileri yüksek boyutlu bir uzaydan daha düşük boyutlu bir uzaya, ya maksimum varyans yönlerine doğrusal izdüşümle ya da verinin altında yatan manifoldu gözeten doğrusal olmayan gömmelerle mümkün olduğunca ilgili bilgiyi koruyarak eşleştirmektedir.
Kapsam
Bu konu, en büyük varyans yönlerini bulan temel bileşen analizi ve faktör analizi gibi doğrusal yöntemleri ve eğrisel düşük boyutlu yapıyı ortaya çıkaran doğrusal olmayan manifold öğrenimi ve gömme yöntemlerini kapsamaktadır. Boyutluluk laneti, yeniden yapılandırma hatası ve küresel geometri ile yerel komşulukları koruma arasındaki dengeyi ele almaktadır.
Temel sorular
- Birçok ilişkili özellik birkaç taneyle nasıl özetlenebilir?
- Temel bileşen analizi neyi optimize eder?
- Doğrusal olmayan yöntemler eğrisel manifoldları nasıl kurtarır?
- Hangi bilgiler kaybolur ve bu kayıp nasıl ölçülür?
Temel kuramlar
- Temel bileşen analizi
- Temel bileşen analizi, verileri en büyük varyansın ortogonal yönlerine yansıtarak en küçük kareler anlamında en iyi doğrusal düşük boyutlu yaklaşımı sağlamakta ve baskın varyasyon modellerini ortaya çıkarmaktadır.
- Olasılıksal gizli doğrusal modeller
- Olasılıksal temel bileşen analizi ve faktör analizi, boyut indirgemeyi bir gizli değişken modeli olarak çerçevelemekte, üretken bir yorum ve gürültü ile eksik verileri ele almak için prensipli bir yol sunmaktadır.
- Manifold öğrenimi
- Doğrusal olmayan yöntemler, verilerin düşük boyutlu bir manifold yakınında bulunduğunu varsaymakta ve yerel komşuluk ilişkilerini koruyan gömmeler oluşturarak doğrusal izdüşümlerin yakalayamadığı yapıyı yakalamaktadır.
Klinik önem
Boyut indirgeme, karmaşık veri kümelerini görselleştirmek, sinyalleri sıkıştırmak ve gürültüyü gidermek ve sonraki öğrenmeyi daha hızlı ve aşırı uyuma daha az eğilimli hale getiren kompakt özellikler üretmek için kullanılmaktadır; özellik sayısı arttıkça mesafelerin ve yoğunlukların bilgilendirici olmaktan çıktığı boyutluluk lanetini doğrudan ele almaktadır.
Tarihçe
Temel bileşen analizi Pearson tarafından tanıtılmış ve Hotelling tarafından yirminci yüzyılın başlarında geliştirilmiştir. Faktör analizi psikometride ortaya çıkmış, 2000'li yılların başlarından itibaren doğrusal olmayan manifold öğrenimi ve komşu gömme yöntemleri, boyut indirgemeyi eğrisel düşük boyutlu yapıya sahip verilere genişleterek yüksek boyutlu görselleştirme için standart araçlar haline gelmiştir.
Öne çıkan isimler
- Karl Pearson
- Harold Hotelling
- Trevor Hastie
İlgili konular
Temel eserler
- hastie2009
- bishop2006
- murphy2012
Sıkça sorulan sorular
- Temel bileşen analizi aslında neyi hesaplar?
- Verilerin ne kadar varyansını yakaladıklarına göre sıralanmış ortogonal yönler olan yeni eksenler, yani temel bileşenler bulur. İlk birkaç bileşeni tutmak, en küçük kareler anlamında verilerin en iyi doğrusal düşük boyutlu yaklaşımını verir.
- Tüm özellikleri kullanmak yerine neden boyutları indirgeyelim?
- Yüksek boyutlarda veriler seyrek hale gelir ve mesafeler daha az anlamlı olur, modeller daha kolay aşırı uyum gösterir ve hesaplama yavaşlar. Birkaç bilgilendirici koordinata indirgeme, genellemeyi, hızı ve verileri görselleştirme ve yorumlama yeteneğini geliştirebilir.