Distribution normale
La distribution normale, également appelée distribution gaussienne ou courbe en cloche, est une distribution continue, symétrique autour de sa moyenne et entièrement caractérisée par sa moyenne et son écart-type. Elle est considérée comme la distribution la plus importante en biostatistique car de nombreuses mesures tendent à l'approximer et parce que les moyennes d'échantillons convergent vers elle, ce qui en fait la base de la plupart des inférences statistiques standards.
Definition
La distribution normale est une distribution de probabilité continue avec une densité symétrique en forme de cloche, entièrement déterminée par deux paramètres : sa moyenne (centre) et son écart-type (dispersion).
Scope
Cette entrée aborde la forme et les paramètres de la distribution normale, la règle empirique reliant les écarts-types à la couverture, la distribution normale standard et les scores z, les intervalles de référence, ainsi que la distinction entre une distribution normale d'individus et une distribution normale de moyennes d'échantillons. Il s'agit d'une référence méthodologique qui ne fournit pas de seuils cliniques pour les patients individuels.
Core questions
- Quelle est la forme de la distribution normale et qu'est-ce qui la détermine ?
- Quelle proportion de la distribution se situe à l'intérieur d'un nombre donné d'écarts-types ?
- Qu'est-ce qu'un score z et comment fonctionne la standardisation ?
- Quand est-il approprié de supposer la normalité ?
Key concepts
- Moyenne et écart-type
- Symétrie et forme en cloche
- Règle empirique (68-95-99.7)
- Distribution normale standard
- Score z et standardisation
- Intervalle de référence
- Asymétrie et écarts par rapport à la normalité
Mechanisms
Une distribution normale est définie par deux nombres : la moyenne, qui détermine son centre, et l'écart-type, qui fixe son étendue. Environ 68 % des valeurs se situent à moins d'un écart-type de la moyenne, environ 95 % à moins de deux, et environ 99,7 % à moins de trois — c'est la règle empirique qui confère à la distribution son utilité pratique. Toute variable normale peut être standardisée en soustrayant la moyenne et en divisant par l'écart-type pour obtenir un score z suivant la distribution normale standard (moyenne 0, écart-type 1), ce qui permet à un ensemble unique de tables ou de formules de s'appliquer à toutes les distributions normales. En recherche médicale, les intervalles de référence pour des mesures telles que les valeurs sanguines sont souvent construits à partir des 95 % centraux d'une distribution normale supposée, et de nombreux tests statistiques supposent soit que les données, soit la distribution d'échantillonnage d'une statistique est approximativement normale.
Clinical relevance
De nombreuses mesures biologiques sont résumées et comparées sous l'hypothèse d'une normalité approximative, et les intervalles de référence sont fréquemment établis à partir de celle-ci ; ainsi, la compréhension de cette distribution facilite l'interprétation des résultats de laboratoire et d'étude. Cette entrée décrit la distribution en tant que méthodologie et ne fixe pas de seuils diagnostiques pour les individus.
History
La courbe en cloche est apparue au XVIIIe siècle à partir de l'approximation de de Moivre à la distribution binomiale et a été développée par Laplace et Gauss, ce dernier l'utilisant dans l'analyse des erreurs de mesure, raison pour laquelle elle est souvent appelée distribution gaussienne. Au cours des XIXe et XXe siècles, elle est devenue le modèle par défaut pour les quantités biologiques mesurées et la pierre angulaire de l'inférence statistique classique.
Debates
- Quand l'hypothèse de normalité peut-elle induire en erreur ?
- De nombreuses variables biologiques sont asymétriques plutôt que symétriques, et les traiter comme normales peut fausser les intervalles de référence et les tests ; la décision de transformer les données, d'utiliser des méthodes non paramétriques (distribution-free methods) ou de s'appuyer sur le théorème central limite pour les moyennes est un jugement méthodologique récurrent.
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- Qu'est-ce que la règle des 68-95-99.7 ?
- Pour une distribution normale, environ 68 % des valeurs se situent à moins d'un écart-type de la moyenne, environ 95 % à moins de deux, et environ 99,7 % à moins de trois ; cette règle empirique relie directement l'écart-type à la proportion de valeurs couvertes.
- Les données doivent-elles être normalement distribuées pour utiliser la distribution normale en inférence ?
- Pas toujours ; de nombreuses méthodes s'appuient sur le fait que la distribution d'échantillonnage d'une moyenne est approximativement normale selon le théorème central limite, ce qui peut être valable même lorsque les mesures individuelles ne sont pas normalement distribuées, à condition que l'échantillon soit suffisamment grand.