Описательная статистика
Описательная статистика — это методы, используемые для обобщения и представления характеристик набора данных без выхода за его пределы. Они конденсируют набор наблюдений в несколько интерпретируемых чисел и изображений, описывая, где центрируются данные, насколько они варьируются и какую форму принимает их распределение.
Definition
Описательная статистика — это числовые и графические сводки, характеризующие центральную тенденцию, изменчивость и распределение имеющихся данных, описывающие саму выборку, а не выводящие свойства более широкой популяции.
Scope
Эта статья охватывает понятия описательной статистики, ее отличия от инференциальной статистики, а также основные семейства описательных мер: частоты и пропорции для категориальных данных, а также меры положения и разброса для числовых данных. Это методологический справочник, который не содержит клинических рекомендаций.
Core questions
- Какой тип переменной обобщается и какая описательная мера ей подходит?
- Где центрируются данные и насколько широко они распределены?
- Как следует обобщать категориальную переменную по сравнению с непрерывной?
Key concepts
- Описательная и инференциальная статистика
- Частоты, счетчики и пропорции для категориальных данных
- Меры центральной тенденции
- Меры дисперсии
- Табличное и графическое обобщение
- Уровни измерения (номинальный, порядковый, интервальный, относительный)
Mechanisms
Описательный анализ начинается с классификации каждой переменной по ее уровню измерения. Категориальные переменные обобщаются с помощью частот, пропорций и таблиц частот; числовые переменные обобщаются с помощью меры центральной тенденции в паре с мерой дисперсии, выбранной в соответствии с формой распределения — среднее значение со стандартным отклонением для приблизительно симметричных данных и медиана с межквартильным диапазоном для асимметричных данных. Эти числовые сводки обычно сопровождаются графическими представлениями, чтобы стали видны особенности распределения, которые числа не могут передать.
Clinical relevance
Описательная статистика заполняет таблицы исходных характеристик и разделы результатов практически всех клинических исследований, поэтому ее интерпретация необходима для чтения медицинской литературы. Эта статья описывает, как данные обобщаются для оценки, и не является основой для индивидуальных диагностических или лечебных решений.
Epidemiology
В эпидемиологических и клинических исследованиях описательная статистика является первым аналитическим результатом, используемым для характеристики выборок исследования, воздействий и исходов до оценки какой-либо ассоциации или эффекта. Прозрачное представление описательных мер является основным требованием стандартов отчетности исследований.
History
Описательное обобщение предшествовало формальному статистическому выводу, развиваясь из демографического и актуарного учета. В двадцатом веке концептуально разделились описательные и инференциальные роли статистики, а программа Джона Тьюки по разведочному анализу данных позже вновь подчеркнула описание и визуальное обобщение как отдельную и важную фазу анализа.
Key figures
- John W. Tukey
- Douglas G. Altman
Related topics
Seminal works
- tukey-1977
- gupta-2019
Frequently asked questions
- Чем описательная статистика отличается от инференциальной статистики?
- Описательная статистика обобщает собранные данные; инференциальная статистика использует эти данные для формулирования вероятностных утверждений о более широкой популяции. Описательные меры не делают никаких утверждений, выходящих за рамки наблюдаемой выборки.
- Какие описательные меры следует сообщать для непрерывной переменной?
- Мера центральной тенденции вместе с мерой разброса, выбранная в соответствии с распределением: среднее значение и стандартное отклонение, когда данные приблизительно симметричны, медиана и межквартильный диапазон, когда они асимметричны.