ScholarGate
Асистент
MCDMCluster Number Selection

Gap Statistic for Cluster Evaluation

Основната идея е да се сравни действителното качество на клъстеризацията с това, което бихте очаквали при случайна вероятност. Ако данните естествено се групират, наблюдаваната WCSS трябва да бъде много по-малка от WCSS на случайно разпределени референтни данни. Статистиката Gap измерва тази разлика. Чрез тестване на различни бройки клъстери се намира k, което дава най-голямата разлика (gap), което показва най-доброто отделяне на структурата от случайността. Това измества избора на клъстери от визуални евристики към статистическа рамка.

Отворете в MethodMindСкороВидеоСкороИзтегляне на слайдове

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Карта на методите

Обкръжението на сродните методи — изберете възел, за да го разгледате.

Източници

  1. Tibshirani, R., Walther, G., & Hastie, T. (2001). Estimating the number of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 63(2), 411-423. DOI: 10.1111/1467-9868.00293

Как да цитирате тази страница

ScholarGate. (2026, June 3). Gap Statistic for Cluster Evaluation. ScholarGate. https://scholargate.app/bg/model-evaluation/gap-statistic

Кой метод?

Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.

Сравняване едно до друго

Цитиран в

ScholarGateGap Statistic (Gap Statistic for Cluster Evaluation). Извлечено на 2026-06-15 от https://scholargate.app/bg/model-evaluation/gap-statistic · Набор от данни: https://doi.org/10.5281/zenodo.20539026