ScholarGate
Asistente

Descripción de Datos y Estadísticas Resumen

La descripción de datos y las estadísticas resumen son la parte de la bioestadística que se ocupa de organizar, condensar y presentar un conjunto de observaciones para que sus características esenciales puedan comprenderse de un vistazo. Antes de intentar cualquier inferencia, los investigadores describen cómo se distribuyen los datos, dónde se centran, cuán ampliamente se dispersan y qué forma adoptan, utilizando resúmenes numéricos y representaciones gráficas.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

La descripción de datos y las estadísticas resumen comprenden los métodos numéricos y gráficos utilizados para caracterizar la ubicación central, la dispersión, la forma distribucional y la estructura de un conjunto de datos, antes e independientemente de la generalización inferencial a una población.

Scope

Esta área orienta al lector hacia el aspecto descriptivo de la bioestadística: las estadísticas descriptivas en su conjunto, la distribución y normalidad de los datos, las medidas de tendencia central, las medidas de variabilidad y la visualización de datos. Es una visión general de referencia sobre cómo se resumen los datos de salud, no una prescripción para el análisis o la acción clínica.

Sub-topics

Core questions

  • ¿Dónde se encuentra el centro de los datos y qué medida de ubicación lo representa mejor?
  • ¿Cuánto varían las observaciones y cómo se cuantifica esa dispersión?
  • ¿Cuál es la forma de la distribución y es aproximadamente normal?
  • ¿Cómo se pueden mostrar los datos para que su patrón, asimetría y valores atípicos sean visibles?

Key concepts

  • Estadísticas descriptivas versus inferenciales
  • Medidas de tendencia central (media, mediana, moda)
  • Medidas de variabilidad (rango, varianza, desviación estándar, rango intercuartílico)
  • Forma de la distribución, asimetría y curtosis
  • Normalidad y su evaluación
  • Resúmenes gráficos (histogramas, diagramas de caja (box plots), diagramas de dispersión)
  • Análisis exploratorio de datos

Mechanisms

La descripción procede reduciendo muchas observaciones a unas pocas cantidades e imágenes informativas. Una medida de ubicación (media, mediana o moda) resume dónde se sitúan los datos; una medida de dispersión (desviación estándar, rango intercuartílico, rango) resume cuán lejos se dispersan alrededor de esa ubicación; y el emparejamiento de ubicación con dispersión se elige para que coincida con la forma de la distribución, prefiriéndose la mediana y el rango intercuartílico para datos asimétricos y la media y la desviación estándar para datos aproximadamente simétricos. Las representaciones gráficas, como los histogramas y los diagramas de caja (box plots), revelan la forma, la asimetría y los valores atípicos que los números individuales pueden ocultar, y juntas estas herramientas forman la etapa exploratoria que precede a la inferencia formal.

Clinical relevance

Casi todos los estudios clínicos, auditorías e informes de vigilancia comienzan con resúmenes descriptivos de sus participantes y mediciones, por lo que comprender estos resúmenes es fundamental para la lectura de la literatura en ciencias de la salud. Esta área describe cómo se caracterizan los datos y está destinada a servir como base para la evaluación de la evidencia, no como fundamento para decisiones diagnósticas o de tratamiento individuales.

Epidemiology

El resumen descriptivo es el primer paso analítico en la investigación epidemiológica y clínica, utilizado para caracterizar poblaciones de estudio, tablas de referencia y la distribución de exposiciones y resultados antes de estimar las asociaciones. La elección de las medidas resumen y las representaciones afecta directamente la transparencia con la que se comunican los datos de un estudio.

History

La elaboración de resúmenes numéricos de datos tiene profundas raíces en la astronomía y las estadísticas vitales de los siglos XVIII y XIX, pero el conjunto de herramientas descriptivas moderno se consolidó en el siglo XX. El Análisis Exploratorio de Datos (1977) de John Tukey redefinió la descripción como una actividad de investigación por derecho propio y popularizó representaciones como el diagrama de caja (box plot), mientras que los educadores de estadística en las ciencias de la salud codificaron posteriormente los resúmenes estándar que ahora se informan en las revistas médicas.

Debates

¿Cuándo deberían la media y la desviación estándar ceder el paso a la mediana y el rango intercuartílico?
Dado que la media y la desviación estándar se ven afectadas por la asimetría y los valores atípicos, existe una recomendación de larga data de resumir los datos no normales con la mediana y el rango intercuartílico; el umbral práctico para el cambio depende de la forma de la distribución y el tamaño de la muestra.

Key figures

  • John W. Tukey
  • William S. Cleveland
  • Douglas G. Altman
  • J. Martin Bland

Related topics

Seminal works

  • tukey-1977
  • gupta-2019

Frequently asked questions

¿Cuál es la diferencia entre estadísticas descriptivas e inferenciales?
Las estadísticas descriptivas resumen y muestran los datos realmente recopilados, mientras que las estadísticas inferenciales utilizan esos datos para extraer generalizaciones sobre una población más amplia. La descripción es lo primero y no hace ninguna afirmación probabilística más allá de la muestra disponible.
¿Por qué describir los datos antes de ejecutar pruebas?
Los resúmenes y gráficos revelan la forma, la dispersión y cualquier valor atípico o error de la distribución, lo que determina si los análisis posteriores son apropiados y cómo deben interpretarse sus resultados.

Methods for this concept

Related concepts