Les données doivent-elles être normalement distribuées pour utiliser la distribution normale en inférence ?

Pas toujours ; de nombreuses méthodes s'appuient sur le fait que la distribution d'échantillonnage d'une moyenne est approximativement normale selon le théorème central limite, ce qui peut être valable même lorsque les mesures individuelles ne sont pas normalement distribuées, à condition que l'échantillon soit suffisamment grand.

Distribution normale

La distribution normale, également appelée distribution gaussienne ou courbe en cloche, est une distribution continue, symétrique autour de sa moyenne et entièrement caractérisée par sa moyenne et son écart-type. Elle est considérée comme la distribution la plus importante en biostatistique car de nombreuses mesures tendent à l'approximer et parce que les moyennes d'échantillons convergent vers elle, ce qui en fait la base de la plupart des inférences statistiques standards.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

La distribution normale est une distribution de probabilité continue avec une densité symétrique en forme de cloche, entièrement déterminée par deux paramètres : sa moyenne (centre) et son écart-type (dispersion).

Scope

Cette entrée aborde la forme et les paramètres de la distribution normale, la règle empirique reliant les écarts-types à la couverture, la distribution normale standard et les scores z, les intervalles de référence, ainsi que la distinction entre une distribution normale d'individus et une distribution normale de moyennes d'échantillons. Il s'agit d'une référence méthodologique qui ne fournit pas de seuils cliniques pour les patients individuels.

Core questions

Quelle est la forme de la distribution normale et qu'est-ce qui la détermine ?
Quelle proportion de la distribution se situe à l'intérieur d'un nombre donné d'écarts-types ?
Qu'est-ce qu'un score z et comment fonctionne la standardisation ?
Quand est-il approprié de supposer la normalité ?

Key concepts

Moyenne et écart-type
Symétrie et forme en cloche
Règle empirique (68-95-99.7)
Distribution normale standard
Score z et standardisation
Intervalle de référence
Asymétrie et écarts par rapport à la normalité

Mechanisms

Une distribution normale est définie par deux nombres : la moyenne, qui détermine son centre, et l'écart-type, qui fixe son étendue. Environ 68 % des valeurs se situent à moins d'un écart-type de la moyenne, environ 95 % à moins de deux, et environ 99,7 % à moins de trois — c'est la règle empirique qui confère à la distribution son utilité pratique. Toute variable normale peut être standardisée en soustrayant la moyenne et en divisant par l'écart-type pour obtenir un score z suivant la distribution normale standard (moyenne 0, écart-type 1), ce qui permet à un ensemble unique de tables ou de formules de s'appliquer à toutes les distributions normales. En recherche médicale, les intervalles de référence pour des mesures telles que les valeurs sanguines sont souvent construits à partir des 95 % centraux d'une distribution normale supposée, et de nombreux tests statistiques supposent soit que les données, soit la distribution d'échantillonnage d'une statistique est approximativement normale.

Clinical relevance

De nombreuses mesures biologiques sont résumées et comparées sous l'hypothèse d'une normalité approximative, et les intervalles de référence sont fréquemment établis à partir de celle-ci ; ainsi, la compréhension de cette distribution facilite l'interprétation des résultats de laboratoire et d'étude. Cette entrée décrit la distribution en tant que méthodologie et ne fixe pas de seuils diagnostiques pour les individus.

History

La courbe en cloche est apparue au XVIIIe siècle à partir de l'approximation de de Moivre à la distribution binomiale et a été développée par Laplace et Gauss, ce dernier l'utilisant dans l'analyse des erreurs de mesure, raison pour laquelle elle est souvent appelée distribution gaussienne. Au cours des XIXe et XXe siècles, elle est devenue le modèle par défaut pour les quantités biologiques mesurées et la pierre angulaire de l'inférence statistique classique.

Debates

Quand l'hypothèse de normalité peut-elle induire en erreur ?: De nombreuses variables biologiques sont asymétriques plutôt que symétriques, et les traiter comme normales peut fausser les intervalles de référence et les tests ; la décision de transformer les données, d'utiliser des méthodes non paramétriques (distribution-free methods) ou de s'appuyer sur le théorème central limite pour les moyennes est un jugement méthodologique récurrent.

Key figures

Carl Friedrich Gauss
Pierre-Simon Laplace
Abraham de Moivre

Seminal works

altman-bland-1995-normal
rosner-2015

Frequently asked questions

Qu'est-ce que la règle des 68-95-99.7 ?: Pour une distribution normale, environ 68 % des valeurs se situent à moins d'un écart-type de la moyenne, environ 95 % à moins de deux, et environ 99,7 % à moins de trois ; cette règle empirique relie directement l'écart-type à la proportion de valeurs couvertes.
Les données doivent-elles être normalement distribuées pour utiliser la distribution normale en inférence ?: Pas toujours ; de nombreuses méthodes s'appuient sur le fait que la distribution d'échantillonnage d'une moyenne est approximativement normale selon le théorème central limite, ce qui peut être valable même lorsque les mesures individuelles ne sont pas normalement distribuées, à condition que l'échantillon soit suffisamment grand.