Gap Statistic
De Gap Statistic, ontwikkeld door Tibshirani, Walther en Hastie in 2001, is een principiële statistische methode voor het bepalen van het optimale aantal clusters in een dataset. Het vergelijkt de waargenomen binnen-cluster som van kwadraten met de verwachte waarde onder een nulhypothese van geen clusterstructuur, wat een theoretisch onderbouwde benadering biedt voor de selectie van het aantal clusters.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Tibshirani, R., Walther, G., & Hastie, T. (2001). Estimating the number of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 63(2), 411-423. DOI: 10.1111/1467-9868.00293 ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Gap Statistic for Cluster Evaluation. ScholarGate. https://scholargate.app/nl/model-evaluation/gap-statistic
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Calinski-Harabasz IndexModelevaluatie↔ compare
- Davies-Bouldin IndexModelevaluatie↔ compare
- Elbow-methodeModelevaluatie↔ compare
- TraagheidModelevaluatie↔ compare
- Silhouette ScoreModelevaluatie↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →