Probabilité et distributions de probabilité
La probabilité est le langage mathématique permettant de quantifier l'incertitude, et les distributions de probabilité décrivent la répartition des valeurs possibles d'une variable aléatoire. Ensemble, elles constituent le fondement théorique sur lequel repose l'inférence statistique dans les sciences de la santé : chaque intervalle de confiance, valeur p et estimation de risque repose finalement sur un modèle de probabilité décrivant comment les données auraient pu être générées.
Definition
La probabilité attribue des nombres entre 0 et 1 aux événements pour exprimer leur vraisemblance ; une distribution de probabilité est une fonction qui spécifie les probabilités des valeurs possibles d'une variable aléatoire.
Scope
Ce domaine oriente le lecteur vers les concepts fondamentaux de la probabilité et vers les distributions les plus utilisées en biostatistique. Il couvre les règles de base de la probabilité, la probabilité conditionnelle et l'indépendance, la distribution normale, les distributions binomiale et de Poisson pour les dénombrements et les événements, ainsi que les distributions d'échantillonnage qui relient un échantillon à la population par le théorème central limite. Il s'agit d'un aperçu méthodologique à visée éducative et de référence, et non d'une orientation clinique.
Sub-topics
Core questions
- Comment l'incertitude est-elle quantifiée afin de pouvoir raisonner formellement sur les données ?
- Quelle distribution décrit un type de mesure ou de dénombrement donné ?
- Comment le comportement d'une statistique d'échantillon est-il lié à la population sous-jacente ?
- Pourquoi la distribution normale apparaît-elle si souvent dans les quantités agrégées ?
Key concepts
- Variable aléatoire
- Espace d'échantillons et événements
- Axiomes de probabilité
- Probabilité conditionnelle et indépendance
- Distributions discrètes et continues
- Espérance et variance
- Distribution d'échantillonnage
- Théorème central limite
Mechanisms
Un modèle de probabilité spécifie un espace d'échantillons de résultats possibles et attribue des probabilités conformes aux axiomes (non-négativité, probabilité totale égale à un, additivité pour les événements mutuellement exclusifs). Les variables aléatoires associent les résultats à des nombres, et leurs distributions résument les probabilités de ces nombres, caractérisées par des quantités telles que la moyenne (espérance) et la variance. Les distributions discrètes telles que la binomiale et de Poisson modélisent les dénombrements d'événements ; la distribution normale continue modélise de nombreuses quantités mesurées et, via le théorème central limite, elle approxime la distribution des sommes et des moyennes. La statistique inférentielle fonctionne en traitant une statistique observée comme un tirage issu de sa distribution d'échantillonnage.
Clinical relevance
Les distributions de probabilité sous-tendent les méthodes statistiques utilisées pour résumer les données de santé et pour tirer des inférences des études, ainsi, leur compréhension favorise une lecture critique de la littérature quantitative. Cette entrée décrit le fondement méthodologique de ces analyses et ne constitue pas une base pour des décisions individuelles de diagnostic ou de traitement.
History
La probabilité mathématique est née des analyses des jeux de hasard au XVIIe siècle et a été développée par Bernoulli, Laplace, Gauss et Poisson pour devenir une théorie générale des distributions. La formulation axiomatique de Kolmogorov dans les années 1930 a donné à la probabilité une base rigoureuse. Tout au long du XXe siècle, ces outils sont devenus la base de l'inférence statistique, et la biostatistique les a adoptés pour modéliser les mesures et les dénombrements dans la recherche médicale et en santé publique.
Key figures
- Pierre-Simon Laplace
- Carl Friedrich Gauss
- Siméon Denis Poisson
- Jacob Bernoulli
- Andrey Kolmogorov
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
- ross-2014
Frequently asked questions
- Pourquoi les cours de biostatistique consacrent-ils autant de temps aux distributions de probabilité ?
- Parce que l'inférence statistique fonctionne en comparant les données observées à ce qu'un modèle de probabilité prédit ; la distribution est le pont entre un échantillon et une affirmation concernant la population, de sorte que la validité des intervalles de confiance et des tests dépend du choix d'une distribution appropriée.
- Quelle est la différence entre une probabilité et une distribution de probabilité ?
- Une probabilité est un nombre unique décrivant la vraisemblance d'un événement, tandis qu'une distribution de probabilité spécifie les probabilités pour toutes les valeurs possibles d'une variable aléatoire simultanément.