Warum widmen Biostatistik-Kurse so viel Zeit den Wahrscheinlichkeitsverteilungen?

Weil die statistische Inferenz funktioniert, indem beobachtete Daten mit dem verglichen werden, was ein Wahrscheinlichkeitsmodell vorhersagt; die Verteilung ist die Brücke zwischen einer Stichprobe und einer Aussage über die Population, daher hängt die Gültigkeit von Konfidenzintervallen und Tests von der Wahl einer geeigneten Verteilung ab.

Was ist der Unterschied zwischen einer Wahrscheinlichkeit und einer Wahrscheinlichkeitsverteilung?

Eine Wahrscheinlichkeit ist eine einzelne Zahl, die beschreibt, wie wahrscheinlich ein Ereignis ist, während eine Wahrscheinlichkeitsverteilung die Wahrscheinlichkeiten über alle möglichen Werte einer Zufallsvariablen auf einmal angibt.

Wahrscheinlichkeit und Wahrscheinlichkeitsverteilungen

Wahrscheinlichkeit ist die mathematische Sprache zur Quantifizierung von Unsicherheit, und Wahrscheinlichkeitsverteilungen beschreiben, wie die möglichen Werte einer Zufallsvariablen verteilt sind. Zusammen bilden sie die theoretische Grundlage, auf der die statistische Inferenz in den Gesundheitswissenschaften aufbaut: Jedes Konfidenzintervall, jeder p-Wert und jede Risikoschätzung beruht letztlich auf einem Wahrscheinlichkeitsmodell, das beschreibt, wie Daten hätten entstehen können.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Wahrscheinlichkeit weist Ereignissen Zahlen zwischen 0 und 1 zu, um auszudrücken, wie wahrscheinlich sie sind; eine Wahrscheinlichkeitsverteilung ist eine Funktion, die die Wahrscheinlichkeiten der möglichen Werte einer Zufallsvariablen angibt.

Scope

Dieser Bereich führt den Leser in die Kernideen der Wahrscheinlichkeit und in die in der Biostatistik am häufigsten verwendeten Verteilungen ein. Er behandelt die grundlegenden Regeln der Wahrscheinlichkeit, die bedingte Wahrscheinlichkeit und Unabhängigkeit, die Normalverteilung, die Binomial- und Poisson-Verteilungen für Zählungen und Ereignisse sowie die Stichprobenverteilungen, die eine Stichprobe über den zentralen Grenzwertsatz mit der Population verbinden. Es handelt sich um eine referenz-edukative Übersicht über die Methodik, nicht um eine klinische Leitlinie.

Sub-topics

Core questions

Wie wird Unsicherheit quantifiziert, damit Daten formal begründet werden können?
Welche Verteilung beschreibt einen bestimmten Typ von Messung oder Zählung?
Wie verhält sich eine Stichprobenstatistik zur zugrunde liegenden Population?
Warum tritt die Normalverteilung bei aggregierten Größen so häufig auf?

Key concepts

Zufallsvariable
Stichprobenraum und Ereignisse
Wahrscheinlichkeitsaxiome
Bedingte Wahrscheinlichkeit und Unabhängigkeit
Diskrete und kontinuierliche Verteilungen
Erwartungswert und Varianz
Stichprobenverteilung
Zentraler Grenzwertsatz

Mechanisms

Ein Wahrscheinlichkeitsmodell spezifiziert einen Stichprobenraum möglicher Ergebnisse und weist Wahrscheinlichkeiten zu, die mit den Axiomen (Nicht-Negativität, Gesamtwahrscheinlichkeit eins, Additivität für sich gegenseitig ausschließende Ereignisse) übereinstimmen. Zufallsvariablen bilden Ergebnisse auf Zahlen ab, und ihre Verteilungen fassen die Wahrscheinlichkeiten dieser Zahlen zusammen, charakterisiert durch Größen wie den Mittelwert (Erwartungswert) und die Varianz. Diskrete Verteilungen wie die Binomial- und Poisson-Modelle zählen Ereignisse; die kontinuierliche Normalverteilung modelliert viele gemessene Größen und approximiert über den zentralen Grenzwertsatz die Verteilung von Summen und Durchschnitten. Die Inferenzstatistik funktioniert, indem sie eine beobachtete Statistik als eine Ziehung aus ihrer Stichprobenverteilung behandelt.

Clinical relevance

Wahrscheinlichkeitsverteilungen untermauern die statistischen Methoden, die zur Zusammenfassung von Gesundheitsdaten und zur Ableitung von Schlussfolgerungen aus Studien verwendet werden. Ein Verständnis dieser Verteilungen unterstützt daher die kritische Lektüre der quantitativen Literatur. Dieser Eintrag beschreibt die methodische Grundlage solcher Analysen und ist keine Basis für individuelle diagnostische oder therapeutische Entscheidungen.

History

Die mathematische Wahrscheinlichkeit entwickelte sich aus den Analysen von Glücksspielen im siebzehnten Jahrhundert und wurde von Bernoulli, Laplace, Gauss und Poisson zu einer allgemeinen Theorie der Verteilungen ausgebaut. Kolmogorows axiomatische Formulierung in den 1930er Jahren stellte die Wahrscheinlichkeit auf eine rigorose Grundlage. Im Laufe des zwanzigsten Jahrhunderts wurden diese Werkzeuge zur Grundlage der statistischen Inferenz, und die Biostatistik übernahm sie, um Messungen und Zählungen in der medizinischen und öffentlichen Gesundheitsforschung zu modellieren.

Key figures

Pierre-Simon Laplace
Carl Friedrich Gauss
Siméon Denis Poisson
Jacob Bernoulli
Andrey Kolmogorov

Seminal works

altman-bland-1995-normal
rosner-2015
ross-2014

Frequently asked questions

Warum widmen Biostatistik-Kurse so viel Zeit den Wahrscheinlichkeitsverteilungen?: Weil die statistische Inferenz funktioniert, indem beobachtete Daten mit dem verglichen werden, was ein Wahrscheinlichkeitsmodell vorhersagt; die Verteilung ist die Brücke zwischen einer Stichprobe und einer Aussage über die Population, daher hängt die Gültigkeit von Konfidenzintervallen und Tests von der Wahl einer geeigneten Verteilung ab.
Was ist der Unterschied zwischen einer Wahrscheinlichkeit und einer Wahrscheinlichkeitsverteilung?: Eine Wahrscheinlichkeit ist eine einzelne Zahl, die beschreibt, wie wahrscheinlich ein Ereignis ist, während eine Wahrscheinlichkeitsverteilung die Wahrscheinlichkeiten über alle möglichen Werte einer Zufallsvariablen auf einmal angibt.