Меры центральной тенденции
Меры центральной тенденции — это единичные значения, которые суммируют основную часть набора данных — типичное или центральное наблюдение, вокруг которого группируются остальные. Три классические меры — это среднее арифметическое, медиана и мода, и выбор между ними зависит от уровня измерения и формы распределения.
Definition
Мера центральной тенденции — это единичное значение, которое определяет центр распределения: среднее арифметическое — это сумма значений, деленная на их количество, медиана — это среднее значение при упорядочивании наблюдений, а мода — это наиболее часто встречающееся значение.
Scope
Эта статья охватывает среднее арифметическое, медиану и моду: как каждая из них вычисляется, что она представляет и когда каждая из них является подходящим обобщением местоположения. Это методологический справочник, который не предоставляет клинических рекомендаций.
Core questions
- Какая мера местоположения лучше всего представляет эту переменную?
- Как форма распределения влияет на выбор между средним арифметическим и медианой?
- Когда мода является наиболее информативным обобщением?
Key concepts
- Среднее арифметическое
- Медиана
- Мода
- Устойчивость к выбросам
- Влияние асимметрии на среднее арифметическое и медиану
- Уровень измерения и выбор среднего значения
Mechanisms
Среднее арифметическое использует каждое наблюдение и является естественным обобщением для симметричных данных интервальной или относительной шкалы, но именно потому, что оно включает все значения, оно смещается к экстремальным наблюдениям и искажается асимметрией и выбросами. Медиана, среднее значение упорядоченных данных, игнорирует величину экстремальных значений и поэтому является робастной, что делает ее предпочтительным обобщением для асимметричных непрерывных данных и порядковых переменных. Мода, наиболее часто встречающееся значение, является единственной мерой, применимой к номинальным данным, и полезна для определения наиболее типичной категории или пика в распределении. В идеально симметричном одномодальном распределении все три меры совпадают; по мере увеличения асимметрии среднее арифметическое смещается дальше всего в направлении хвоста.
Clinical relevance
Сообщаемые средние значения — среднее артериальное давление, медиана выживаемости, наиболее частый диагноз — являются центральными в том, как сообщаются клинические данные, и распознавание того, какая мера была использована, защищает от неверного толкования асимметричных данных. Эта статья описывает, как суммируется местоположение для оценки, и не является основой для индивидуальных диагностических или лечебных решений.
Epidemiology
Поскольку многие медицинские измерения асимметричны, медиана часто является более точным обобщением типичного значения, и сообщение среднего арифметического для таких данных может завышать центральное значение. Таким образом, выбор меры влияет на то, как передаются характеристики и результаты популяции.
History
Среднее арифметическое использовалось с древних времен для объединения измерений, а формальное различие между средним арифметическим, медианой и модой было закреплено по мере развития описательной статистики в девятнадцатом и начале двадцатого веков. Признание того, что медиана лучше представляет асимметричные распределения, является давним принципом, повторяющимся во всей прикладной статистической литературе.
Debates
- Среднее арифметическое или медиана для асимметричных клинических данных?
- Для правосторонне асимметричных величин, распространенных в медицине — затрат, продолжительности пребывания, уровней биомаркеров — среднее арифметическое завышается хвостом, в то время как медиана отслеживает типичное значение, поэтому рекомендации обычно отдают предпочтение медиане, а среднее арифметическое оставляют для примерно симметричных данных.
Key figures
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-mean
- manikandan-2011-median-mode
Frequently asked questions
- Когда следует сообщать медиану вместо среднего арифметического?
- Когда распределение асимметрично или содержит выбросы, или когда переменная является порядковой. В этих ситуациях медиана представляет типичное значение более точно, чем среднее арифметическое, которое смещается к крайним значениям.
- Можно ли использовать моду для любого типа данных?
- Да. Мода — единственная мера центральной тенденции, применимая к номинальным (категориальным) данным, и она также может выделять пики или наиболее часто встречающееся значение в числовых данных.