ScholarGate
Asisten

Analisis Klaster Hierarkis

Analisis klaster hierarkis membangun urutan klaster bersarang, yang divisualisasikan sebagai dendrogram, dengan secara berturut-turut menggabungkan atau memisahkan kelompok sesuai dengan kriteria keterkaitan.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Analisis klaster hierarkis adalah pendekatan pengklasteran yang menghasilkan pohon partisi bersarang dengan secara iteratif menggabungkan klaster yang paling mirip, atau memisahkan klaster yang paling tidak kohesif, sesuai dengan jarak antar-klaster yang dipilih.

Scope

Topik ini mencakup pengklasteran hierarkis aglomeratif (bottom-up) dan divisif (top-down), aturan keterkaitan umum seperti keterkaitan tunggal (single), lengkap (complete), rata-rata (average), dan keterkaitan varians minimum Ward, konstruksi dan interpretasi dendrogram, serta pemotongan pohon untuk mendapatkan partisi datar.

Core questions

  • Bagaimana keluarga pengklasteran bersarang dapat dibangun dari disimilaritas berpasangan?
  • Bagaimana aturan keterkaitan yang berbeda membentuk klaster yang dihasilkan?
  • Bagaimana dendrogram dibaca dan di mana seharusnya dipotong?
  • Kapan struktur hierarkis lebih informatif daripada satu partisi datar?

Key theories

Penggabungan yang ditentukan oleh keterkaitan
Pengklasteran aglomeratif berulang kali menggabungkan dua klaster yang paling dekat di bawah definisi keterkaitan; keterkaitan tunggal, lengkap, rata-rata, dan Ward mengkodekan gagasan yang berbeda tentang jarak antar-klaster dan menghasilkan bentuk klaster yang secara karakteristik berbeda.
Representasi dendrogram
Urutan penggabungan dikodekan sebagai dendrogram yang tinggi penggabungannya mencatat disimilaritas, memungkinkan sejumlah klaster diperoleh dengan memotong pohon pada tinggi yang dipilih.

Clinical relevance

Pengklasteran hierarkis banyak digunakan di mana pengelompokan bersarang bersifat alami atau informatif, seperti membangun taksonomi, mengatur peta panas ekspresi gen, dan menjelajahi kesamaan dokumen atau organisme.

History

Metode pengelompokan hierarkis diformalkan pada awal tahun 1960-an, termasuk kriteria varians minimum Ward, dan menjadi pokok taksonomi numerik serta analisis data eksplorasi seiring dengan kemajuan komputasi yang membuat konstruksi dendrogram menjadi rutin.

Debates

Pilihan keterkaitan
Keterkaitan tunggal dapat merangkai klaster bersama sementara keterkaitan lengkap cenderung menghasilkan kelompok yang kompak, dan metode Ward mendukung klaster sferis berukuran sama, sehingga pilihan keterkaitan sangat membentuk hasil dan jarang secara unik benar.

Key figures

  • Joe Ward
  • Peter Rousseeuw

Related topics

Seminal works

  • everitt2011
  • kaufman1990
  • wardjr1963

Frequently asked questions

Apa perbedaan antara pengklasteran aglomeratif dan divisif?
Pengklasteran aglomeratif dimulai dengan setiap objek sebagai klaster tersendiri dan menggabungkan ke atas, sementara pengklasteran divisif dimulai dengan satu klaster dan memisahkan ke bawah; metode aglomeratif jauh lebih umum dalam praktiknya.
Bagaimana cara memilih jumlah klaster dari dendrogram?
Dengan memotong pohon pada tinggi yang dipilih, seringkali di mana tinggi penggabungan melonjak tajam, yang sesuai dengan penggabungan kelompok yang jauh kurang mirip daripada yang digabungkan di bawahnya.

Methods for this concept

Related concepts