Hiyerarşik Kümeleme Analizi
Hiyerarşik kümeleme analizi, bir bağlantı kriterine göre grupları art arda birleştirerek veya ayırarak, bir dendrogram olarak görselleştirilen iç içe geçmiş bir küme dizisi oluşturmaktadır.
Tanım
Hiyerarşik kümeleme analizi, seçilen kümeler arası mesafeye göre en benzer kümeleri yinelemeli olarak birleştirerek veya en az uyumlu olanları ayırarak iç içe geçmiş bölümlemelerden oluşan bir ağaç üreten bir kümeleme yaklaşımıdır.
Kapsam
Bu konu, birleştirici (aşağıdan yukarıya) ve bölücü (yukarıdan aşağıya) hiyerarşik kümelemeyi, tekli, tam, ortalama ve Ward'ın minimum varyans bağlantısı gibi yaygın bağlantı kurallarını, dendrogramın oluşturulmasını ve yorumlanmasını ve düz bir bölümleme elde etmek için ağacın kesilmesini kapsamaktadır.
Temel sorular
- İkili farklılıklardan iç içe geçmiş bir kümeleme ailesi nasıl oluşturulabilir?
- Farklı bağlantı kuralları ortaya çıkan kümeleri nasıl şekillendirmektedir?
- Dendrogram nasıl okunur ve nerede kesilmelidir?
- Hiyerarşik bir yapı, tek bir düz bölümlemeden ne zaman daha bilgilendirici olmaktadır?
Temel kuramlar
- Bağlantı Tanımlı Birleştirme
- Birleştirici kümeleme, bir bağlantı tanımı altında en yakın olan iki kümeyi tekrar tekrar birleştirmektedir; tekli, tam, ortalama ve Ward bağlantıları, kümeler arası mesafenin farklı kavramlarını kodlamakta ve karakteristik olarak farklı küme şekilleri üretmektedir.
- Dendrogram Gösterimi
- Birleştirmelerin sırası, birleştirme yüksekliklerinin farklılığı kaydettiği bir dendrogram olarak kodlanmaktadır ve bu, ağacın seçilen bir yükseklikte kesilmesiyle herhangi bir sayıda küme elde edilmesine olanak tanımaktadır.
Klinik önem
Hiyerarşik kümeleme, taksonomilerin oluşturulması, gen ekspresyonu ısı haritalarının düzenlenmesi ve belge veya organizma benzerliğinin araştırılması gibi iç içe geçmiş bir gruplamanın doğal veya bilgilendirici olduğu durumlarda yaygın olarak kullanılmaktadır.
Tarihçe
Hiyerarşik gruplama yöntemleri, Ward'ın minimum varyans kriteri de dahil olmak üzere 1960'ların başında resmileştirilmiş ve bilgisayarın dendrogram oluşturmayı rutin hale getirmesiyle sayısal taksonomi ve keşifsel veri analizinin temel unsurları haline gelmiştir.
Tartışmalar
- Bağlantı Seçimi
- Tekli bağlantı kümeleri birbirine zincirleyebilirken, tam bağlantı kompakt gruplar üretme eğilimindedir ve Ward'ın yöntemi eşit büyüklükte küresel kümeleri tercih etmektedir, bu nedenle bağlantı seçimi sonuçları güçlü bir şekilde şekillendirmekte ve nadiren benzersiz bir şekilde doğru olmaktadır.
Öne çıkan isimler
- Joe Ward
- Peter Rousseeuw
İlgili konular
Temel eserler
- everitt2011
- kaufman1990
- wardjr1963
Sıkça sorulan sorular
- Birleştirici ve bölücü kümeleme arasındaki fark nedir?
- Birleştirici kümeleme, her nesneyi kendi kümesi olarak başlatır ve yukarı doğru birleştirirken, bölücü kümeleme tek bir küme ile başlar ve aşağı doğru ayırır; birleştirici yöntemler pratikte çok daha yaygındır.
- Bir dendrogramdan küme sayısını nasıl seçerim?
- Ağacı seçilen bir yükseklikte keserek, genellikle birleştirme yüksekliklerinin keskin bir şekilde sıçradığı yerde, bu da aşağıda birleştirilenlerden çok daha az benzer olan grupları birleştirmeye karşılık gelmektedir.