Gap Statistic for Cluster Evaluation
Основната идея е да се сравни действителното качество на клъстеризацията с това, което бихте очаквали при случайна вероятност. Ако данните естествено се групират, наблюдаваната WCSS трябва да бъде много по-малка от WCSS на случайно разпределени референтни данни. Статистиката Gap измерва тази разлика. Чрез тестване на различни бройки клъстери се намира k, което дава най-голямата разлика (gap), което показва най-доброто отделяне на структурата от случайността. Това измества избора на клъстери от визуални евристики към статистическа рамка.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Карта на методите
Обкръжението на сродните методи — изберете възел, за да го разгледате.
Източници
- Tibshirani, R., Walther, G., & Hastie, T. (2001). Estimating the number of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 63(2), 411-423. DOI: 10.1111/1467-9868.00293 ↗
Как да цитирате тази страница
ScholarGate. (2026, June 3). Gap Statistic for Cluster Evaluation. ScholarGate. https://scholargate.app/bg/model-evaluation/gap-statistic
Кой метод?
Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.
- Индекс на Калински-ХарабашОценка на модели↔ сравняване
- Индекс на Дейвис-БолдинОценка на модели↔ сравняване
- Метод на лакътяОценка на модели↔ сравняване
- ИнерцияОценка на модели↔ сравняване
- Коефициент на силуетОценка на модели↔ сравняване
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →