Mesures de variabilité
Les mesures de variabilité, ou de dispersion, quantifient l'étendue d'un ensemble d'observations autour de son centre. Deux ensembles de données peuvent avoir la même moyenne tout en différant considérablement quant à la manière dont leurs valeurs se regroupent, et des mesures telles que l'étendue, la variance, l'écart type et l'intervalle interquartile saisissent cette différence.
Definition
Une mesure de variabilité quantifie la dispersion des observations autour d'une valeur centrale : l'étendue est la différence entre les valeurs la plus grande et la plus petite, la variance est la moyenne des carrés des écarts par rapport à la moyenne, l'écart type est sa racine carrée exprimée dans les unités d'origine, et l'intervalle interquartile est l'étendue de la moitié centrale des données ordonnées.
Scope
Cette entrée couvre les principales mesures de dispersion — l'étendue, la variance, l'écart type et l'intervalle interquartile — ainsi que la manière dont chacune est calculée et interprétée. Elle distingue l'écart type de l'erreur type et constitue une référence méthodologique, non une directive clinique.
Core questions
- Dans quelle mesure les observations se dispersent-elles autour de leur centre ?
- Quelle mesure de dispersion s'associe-t-elle de manière appropriée à la mesure de tendance centrale choisie ?
- En quoi l'écart type diffère-t-il de l'erreur type ?
Key concepts
- Étendue
- Variance
- Écart type
- Intervalle interquartile
- Coefficient de variation
- Écart type versus erreur type
- Association de la dispersion et de la tendance centrale
Mechanisms
L'étendue, l'écart entre les extrêmes, est simple mais instable car elle ne dépend que de deux valeurs et augmente avec la taille de l'échantillon. La variance calcule la moyenne des carrés des écarts des observations par rapport à la moyenne, et l'écart type ramène cette quantité aux unités de mesure d'origine, ce qui en fait le complément naturel de la moyenne pour des données approximativement symétriques. L'intervalle interquartile, qui s'étend du 25e au 75e percentile, décrit la moitié centrale des données et est robuste aux valeurs aberrantes (outliers), ce qui en fait le complément de la médiane pour les distributions asymétriques. Une source de confusion récurrente est la différence entre l'écart type, qui décrit la dispersion des observations individuelles, et l'erreur type, qui décrit la précision d'une estimation telle que la moyenne et diminue à mesure que l'échantillon s'agrandit.
Clinical relevance
Les mesures de dispersion informent les lecteurs sur la variabilité d'une mesure ou d'un résultat, ce qui est important pour évaluer la cohérence, les intervalles de référence et la précision des estimations rapportées. Cette entrée décrit comment la variabilité est résumée à des fins d'évaluation et ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.
Epidemiology
La présentation de la variabilité parallèlement à la tendance centrale est une attente fondamentale dans la recherche en santé, et la distinction entre l'écart type et l'erreur type est une erreur de rapportage courante : les confondre peut faire paraître les estimations plus ou moins précises qu'elles ne le sont. L'intervalle interquartile est généralement préféré lorsque les données sont asymétriques.
History
La variance et l'écart type ont été formalisés à la fin du XIXe et au début du XXe siècle, le terme « écart type » ayant été introduit par Karl Pearson et le cadre analytique de la variance développé par Ronald Fisher. L'intervalle interquartile, robuste et basé sur les quantiles, a gagné en importance avec l'essor de l'analyse exploratoire des données et du diagramme en boîte (box plot) au XXe siècle.
Debates
- Écart type ou erreur type dans les rapports ?
- Les auteurs rapportent fréquemment l'erreur type à la place de l'écart type car elle est numériquement plus petite, ce qui peut induire les lecteurs en erreur quant à la variabilité des observations sous-jacentes ; les directives méthodologiques soulignent l'importance de rapporter l'écart type pour décrire la dispersion et de réserver l'erreur type pour la précision des estimations.
Key figures
- Douglas G. Altman
- J. Martin Bland
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-dispersion
- altman-bland-2005
Frequently asked questions
- Quelle est la différence entre l'écart type et l'erreur type ?
- L'écart type décrit la variabilité des observations individuelles autour de la moyenne, tandis que l'erreur type décrit la précision avec laquelle la moyenne elle-même est estimée. L'erreur type diminue à mesure que la taille de l'échantillon augmente ; l'écart type, lui, ne diminue pas.
- Quand l'intervalle interquartile devrait-il être utilisé à la place de l'écart type ?
- Lorsque les données sont asymétriques ou contiennent des valeurs aberrantes (outliers), l'intervalle interquartile décrit la dispersion plus fidèlement car, comme la médiane, il n'est pas affecté par les valeurs extrêmes.