Wahrscheinlichkeit und Wahrscheinlichkeitsverteilungen
Wahrscheinlichkeit ist die mathematische Sprache zur Quantifizierung von Unsicherheit, und Wahrscheinlichkeitsverteilungen beschreiben, wie die möglichen Werte einer Zufallsvariablen verteilt sind. Zusammen bilden sie die theoretische Grundlage, auf der die statistische Inferenz in den Gesundheitswissenschaften aufbaut: Jedes Konfidenzintervall, jeder p-Wert und jede Risikoschätzung beruht letztlich auf einem Wahrscheinlichkeitsmodell, das beschreibt, wie Daten hätten entstehen können.
Definition
Wahrscheinlichkeit weist Ereignissen Zahlen zwischen 0 und 1 zu, um auszudrücken, wie wahrscheinlich sie sind; eine Wahrscheinlichkeitsverteilung ist eine Funktion, die die Wahrscheinlichkeiten der möglichen Werte einer Zufallsvariablen angibt.
Scope
Dieser Bereich führt den Leser in die Kernideen der Wahrscheinlichkeit und in die in der Biostatistik am häufigsten verwendeten Verteilungen ein. Er behandelt die grundlegenden Regeln der Wahrscheinlichkeit, die bedingte Wahrscheinlichkeit und Unabhängigkeit, die Normalverteilung, die Binomial- und Poisson-Verteilungen für Zählungen und Ereignisse sowie die Stichprobenverteilungen, die eine Stichprobe über den zentralen Grenzwertsatz mit der Population verbinden. Es handelt sich um eine referenz-edukative Übersicht über die Methodik, nicht um eine klinische Leitlinie.
Sub-topics
Core questions
- Wie wird Unsicherheit quantifiziert, damit Daten formal begründet werden können?
- Welche Verteilung beschreibt einen bestimmten Typ von Messung oder Zählung?
- Wie verhält sich eine Stichprobenstatistik zur zugrunde liegenden Population?
- Warum tritt die Normalverteilung bei aggregierten Größen so häufig auf?
Key concepts
- Zufallsvariable
- Stichprobenraum und Ereignisse
- Wahrscheinlichkeitsaxiome
- Bedingte Wahrscheinlichkeit und Unabhängigkeit
- Diskrete und kontinuierliche Verteilungen
- Erwartungswert und Varianz
- Stichprobenverteilung
- Zentraler Grenzwertsatz
Mechanisms
Ein Wahrscheinlichkeitsmodell spezifiziert einen Stichprobenraum möglicher Ergebnisse und weist Wahrscheinlichkeiten zu, die mit den Axiomen (Nicht-Negativität, Gesamtwahrscheinlichkeit eins, Additivität für sich gegenseitig ausschließende Ereignisse) übereinstimmen. Zufallsvariablen bilden Ergebnisse auf Zahlen ab, und ihre Verteilungen fassen die Wahrscheinlichkeiten dieser Zahlen zusammen, charakterisiert durch Größen wie den Mittelwert (Erwartungswert) und die Varianz. Diskrete Verteilungen wie die Binomial- und Poisson-Modelle zählen Ereignisse; die kontinuierliche Normalverteilung modelliert viele gemessene Größen und approximiert über den zentralen Grenzwertsatz die Verteilung von Summen und Durchschnitten. Die Inferenzstatistik funktioniert, indem sie eine beobachtete Statistik als eine Ziehung aus ihrer Stichprobenverteilung behandelt.
Clinical relevance
Wahrscheinlichkeitsverteilungen untermauern die statistischen Methoden, die zur Zusammenfassung von Gesundheitsdaten und zur Ableitung von Schlussfolgerungen aus Studien verwendet werden. Ein Verständnis dieser Verteilungen unterstützt daher die kritische Lektüre der quantitativen Literatur. Dieser Eintrag beschreibt die methodische Grundlage solcher Analysen und ist keine Basis für individuelle diagnostische oder therapeutische Entscheidungen.
History
Die mathematische Wahrscheinlichkeit entwickelte sich aus den Analysen von Glücksspielen im siebzehnten Jahrhundert und wurde von Bernoulli, Laplace, Gauss und Poisson zu einer allgemeinen Theorie der Verteilungen ausgebaut. Kolmogorows axiomatische Formulierung in den 1930er Jahren stellte die Wahrscheinlichkeit auf eine rigorose Grundlage. Im Laufe des zwanzigsten Jahrhunderts wurden diese Werkzeuge zur Grundlage der statistischen Inferenz, und die Biostatistik übernahm sie, um Messungen und Zählungen in der medizinischen und öffentlichen Gesundheitsforschung zu modellieren.
Key figures
- Pierre-Simon Laplace
- Carl Friedrich Gauss
- Siméon Denis Poisson
- Jacob Bernoulli
- Andrey Kolmogorov
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
- ross-2014
Frequently asked questions
- Warum widmen Biostatistik-Kurse so viel Zeit den Wahrscheinlichkeitsverteilungen?
- Weil die statistische Inferenz funktioniert, indem beobachtete Daten mit dem verglichen werden, was ein Wahrscheinlichkeitsmodell vorhersagt; die Verteilung ist die Brücke zwischen einer Stichprobe und einer Aussage über die Population, daher hängt die Gültigkeit von Konfidenzintervallen und Tests von der Wahl einer geeigneten Verteilung ab.
- Was ist der Unterschied zwischen einer Wahrscheinlichkeit und einer Wahrscheinlichkeitsverteilung?
- Eine Wahrscheinlichkeit ist eine einzelne Zahl, die beschreibt, wie wahrscheinlich ein Ereignis ist, während eine Wahrscheinlichkeitsverteilung die Wahrscheinlichkeiten über alle möglichen Werte einer Zufallsvariablen auf einmal angibt.