Estadística Descriptiva
La estadística descriptiva comprende los métodos utilizados para resumir y presentar las características de un conjunto de datos sin generalizar más allá de este. Condensa una colección de observaciones en unos pocos números e imágenes interpretables, describiendo dónde se centran los datos, cuánto varían y qué forma adopta su distribución.
Definition
La estadística descriptiva consiste en resúmenes numéricos y gráficos que caracterizan la tendencia central, la variabilidad y la distribución de los datos disponibles, describiendo la muestra en sí misma en lugar de inferir propiedades de una población más grande.
Scope
Esta entrada aborda qué es la estadística descriptiva, cómo difiere de la estadística inferencial, y las principales familias de medidas descriptivas: recuentos y proporciones para datos categóricos, y medidas de posición y dispersión para datos numéricos. Es una referencia metodológica y no proporciona orientación clínica.
Core questions
- ¿Qué tipo de variable se está resumiendo y qué medida descriptiva le conviene?
- ¿Dónde se centran los datos y cuán ampliamente se dispersan?
- ¿Cómo debe resumirse una variable categórica en comparación con una continua?
Key concepts
- Estadística descriptiva versus inferencial
- Frecuencias, recuentos y proporciones para datos categóricos
- Medidas de tendencia central
- Medidas de dispersión
- Resumen tabular y gráfico
- Niveles de medición (nominal, ordinal, de intervalo, de razón)
Mechanisms
El análisis descriptivo comienza clasificando cada variable según su nivel de medición. Las variables categóricas se resumen con recuentos, proporciones y tablas de frecuencia; las variables numéricas se resumen con una medida de tendencia central emparejada con una medida de dispersión, elegidas según la forma de la distribución — la media con la desviación estándar para datos aproximadamente simétricos, y la mediana con el rango intercuartílico para datos asimétricos. Estos resúmenes numéricos suelen ir acompañados de representaciones gráficas para que las características de la distribución que los números no pueden transmitir se hagan visibles.
Clinical relevance
La estadística descriptiva se encuentra en las tablas de características basales y en las secciones de resultados de prácticamente todos los estudios clínicos, por lo que su interpretación es esencial para la lectura de la literatura médica. Esta entrada describe cómo se resumen los datos para su evaluación y no constituye una base para decisiones diagnósticas o de tratamiento individuales.
Epidemiology
En la investigación epidemiológica y clínica, la estadística descriptiva es el primer resultado analítico, utilizada para caracterizar las muestras de estudio, las exposiciones y los resultados antes de estimar cualquier asociación o efecto. La presentación transparente de las medidas descriptivas es una expectativa básica de los estándares de notificación de estudios.
History
La elaboración de resúmenes descriptivos es anterior a la inferencia estadística formal, surgiendo de la teneduría de registros demográficos y actuariales. El siglo XX separó conceptualmente los roles descriptivos e inferenciales de la estadística, y el programa de análisis exploratorio de datos de John Tukey posteriormente re-enfatizó la descripción y el resumen visual como una fase distinta e importante del análisis.
Key figures
- John W. Tukey
- Douglas G. Altman
Related topics
Seminal works
- tukey-1977
- gupta-2019
Frequently asked questions
- ¿En qué se diferencia la estadística descriptiva de la estadística inferencial?
- La estadística descriptiva resume los datos que se recopilaron; la estadística inferencial utiliza esos datos para hacer afirmaciones probabilísticas sobre una población más amplia. Las medidas descriptivas no hacen ninguna afirmación más allá de la muestra observada.
- ¿Qué medidas descriptivas deben reportarse para una variable continua?
- Una medida de tendencia central junto con una medida de dispersión, elegidas para coincidir con la distribución: la media y la desviación estándar cuando los datos son aproximadamente simétricos, la mediana y el rango intercuartílico cuando están sesgados.