ScholarGate
Asistente

Análisis de conglomerados jerárquico

El análisis de conglomerados jerárquico construye una secuencia anidada de conglomerados, visualizada como un dendrograma, fusionando o dividiendo grupos sucesivamente según un criterio de enlace.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

El análisis de conglomerados jerárquico es un enfoque de agrupación que produce un árbol de particiones anidadas combinando iterativamente los conglomerados más similares, o dividiendo los menos cohesivos, según una distancia elegida entre conglomerados.

Scope

Este tema cubre la agrupación jerárquica aglomerativa (de abajo hacia arriba) y divisiva (de arriba hacia abajo), las reglas de enlace comunes como el enlace simple, completo, promedio y de mínima varianza de Ward, la construcción e interpretación del dendrograma y el corte del árbol para obtener una partición plana.

Core questions

  • ¿Cómo se puede construir una familia anidada de agrupaciones a partir de disimilitudes por pares?
  • ¿Cómo influyen las diferentes reglas de enlace en los conglomerados resultantes?
  • ¿Cómo se lee el dendrograma y dónde debe cortarse?
  • ¿Cuándo es una estructura jerárquica más informativa que una única partición plana?

Key theories

Fusión definida por enlace
La agrupación aglomerativa fusiona repetidamente los dos conglomerados más cercanos bajo una definición de enlace; los enlaces simple, completo, promedio y de Ward codifican diferentes nociones de distancia entre conglomerados y producen formas de conglomerados característicamente diferentes.
Representación de dendrograma
La secuencia de fusiones se codifica como un dendrograma cuyas alturas de fusión registran la disimilitud, lo que permite obtener cualquier número de conglomerados cortando el árbol a una altura elegida.

Clinical relevance

La agrupación jerárquica se utiliza ampliamente cuando una agrupación anidada es natural o informativa, como la construcción de taxonomías, la organización de mapas de calor de expresión génica y la exploración de la similitud de documentos u organismos.

History

Los métodos de agrupación jerárquica se formalizaron a principios de la década de 1960, incluido el criterio de mínima varianza de Ward, y se convirtieron en elementos básicos de la taxonomía numérica y el análisis exploratorio de datos a medida que la computación hizo rutinaria la construcción de dendrogramas.

Debates

Elección del enlace
El enlace simple puede encadenar conglomerados, mientras que el enlace completo tiende a producir grupos compactos, y el método de Ward favorece los conglomerados esféricos de igual tamaño, por lo que la elección del enlace influye fuertemente en los resultados y rara vez es la única correcta.

Key figures

  • Joe Ward
  • Peter Rousseeuw

Related topics

Seminal works

  • everitt2011
  • kaufman1990
  • wardjr1963

Frequently asked questions

¿Cuál es la diferencia entre la agrupación aglomerativa y la divisiva?
La agrupación aglomerativa comienza con cada objeto como su propio conglomerado y se fusiona hacia arriba, mientras que la agrupación divisiva comienza con un conglomerado y se divide hacia abajo; los métodos aglomerativos son mucho más comunes en la práctica.
¿Cómo elijo el número de conglomerados de un dendrograma?
Cortando el árbol a una altura elegida, a menudo donde las alturas de fusión saltan bruscamente, lo que corresponde a combinar grupos que son mucho menos similares que los fusionados por debajo.

Methods for this concept

Related concepts