Was ist der Unterschied zwischen einer Punktschätzung und einer Intervallschätzung?

Eine Punktschätzung ist eine einzelne Zahl, wie der Stichprobenmittelwert, die als beste Schätzung für eine unbekannte Größe verwendet wird; eine Intervallschätzung ist ein Bereich um diese Zahl, der angibt, wie präzise die Größe gemessen wurde.

Was misst der Standardfehler?

Er misst die Variabilität einer Schätzung über hypothetisch wiederholte Stichproben hinweg – im Grunde die Präzision der Schätzung. Ein kleinerer Standardfehler bedeutet, dass die Punktschätzung durch die Daten enger bestimmt wird.

Punktschätzung und Intervallschätzung

Punkt- und Intervallschätzung sind die beiden grundlegenden Methoden, um zusammenzufassen, was eine Stichprobe über eine unbekannte Populationsgröße aussagt. Eine Punktschätzung ist eine einzelne beste Schätzung – zum Beispiel der Stichprobenmittelwert als Schätzung des wahren Mittelwerts –, während eine Intervallschätzung diese Schätzung mit einem Wertebereich umgibt, der die wahre Größe plausibel enthält. Die Angabe sowohl einer Punktschätzung als auch eines Intervalls kommuniziert nicht nur die Größe eines Effekts, sondern auch, wie präzise dieser gemessen wurde.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Eine Punktschätzung ist ein einzelner Wert, der aus Stichprobendaten berechnet wird, um einen unbekannten Populationsparameter zu approximieren; eine Intervallschätzung ist ein Wertebereich, der aus denselben Daten und einer angegebenen Methode abgeleitet wird und den Parameter mit einem bestimmten Konfidenzniveau enthalten soll.

Scope

Dieses Thema behandelt, was einen Punktschätzer gut macht (z. B. unverzerrt und effizient zu sein), wie der Standardfehler die Präzision einer Schätzung quantifiziert und wie Punktschätzungen zu Intervallschätzungen erweitert werden. Es behandelt die Schätzung als Referenzmethodik für die Gestaltung und Bewertung von Studien, nicht als klinische Regel.

Core questions

Was ist die beste Einzelschätzung der interessierenden Populationsgröße?
Wie präzise ist diese Schätzung – wie stark würde sie bei wiederholten Stichproben variieren?
Welcher Wertebereich ist plausibel mit den Daten vereinbar?
Welche Eigenschaften machen einen Schätzer einem anderen vorzuziehen?

Key concepts

Schätzer und Schätzung
Populationsparameter
Unverzerrtheit (Unbiasedness)
Effizienz und Präzision
Standardfehler
Stichprobenverteilung
Fehlerspanne (Margin of error)
Maximum-Likelihood-Schätzung

Mechanisms

Ein Punktschätzer ist eine Regel, die Stichprobendaten auf eine Zahl abbildet, die einen Parameter approximiert; der Stichprobenmittelwert, der Stichprobenanteil und Regressionskoeffizienten sind gängige Beispiele. Da eine andere Stichprobe einen anderen Wert ergeben würde, hat jede Punktschätzung eine Stichprobenverteilung, deren Streuung durch den Standardfehler zusammengefasst wird – kleinere Standardfehler bedeuten präzisere Schätzungen. Eine Intervallschätzung wird dann durch die Kombination der Punktschätzung mit einem Vielfachen ihres Standardfehlers (oder, für begrenzte Größen wie einen Anteil, mit exakten Methoden wie der Clopper-Pearson-Konstruktion) gebildet. Gute Schätzer werden typischerweise nach Verzerrung (Bias), Effizienz und Konsistenz beurteilt, so dass sich die Schätzung mit zunehmender Stichprobengröße auf den wahren Wert konzentriert.

Clinical relevance

Effektgrößen, die in der Gesundheitsforschung berichtet werden – mittlere Differenzen, relative Risiken, Prävalenzzahlen – sind Punktschätzungen, und ihre begleitenden Intervalle sagen dem Leser, wie sehr er ihnen vertrauen kann. Die Erkenntnis, dass eine Punktschätzung ohne ein Präzisionsmaß unvollständig ist, ist eine zentrale Bewertungsfähigkeit. Dieser Eintrag erklärt, wie solche Schätzungen gebildet werden, und ist keine Grundlage für individuelle klinische Entscheidungen.

Evidence & guidelines

Methodische Leitlinien in den Gesundheitswissenschaften haben Autoren seit langem dazu angehalten, Effektschätzungen mit ihrer Präzision darzustellen, anstatt sich auf Signifikanzurteile zu verlassen. Gardners und Altmans einflussreiches Argument für die Intervallberichterstattung und der spätere Leitfaden zur Fehlinterpretation von Greenland und Kollegen prägen die Konventionen, die heute in medizinischen Fachzeitschriften erwartet werden.

History

Die Punktschätzung wurde durch Fishers Arbeit zur Maximum-Likelihood-Methode in den 1920er Jahren auf eine rigorose Grundlage gestellt, während die Intervallschätzung aus derselben Zeit hervorging, einschließlich exakter Intervallkonstruktionen wie der Clopper-Pearson-Grenzen für einen Binomialanteil im Jahr 1934. Die Betonung der routinemäßigen Berichterstattung von Schätzungen mit Intervallen in der Medizin wurde später im zwanzigsten Jahrhundert gefestigt.

Key figures

Ronald A. Fisher
Jerzy Neyman
Egon Pearson
Douglas G. Altman

Seminal works

gardner-altman-1986
clopper-pearson-1934

Frequently asked questions

Was ist der Unterschied zwischen einer Punktschätzung und einer Intervallschätzung?: Eine Punktschätzung ist eine einzelne Zahl, wie der Stichprobenmittelwert, die als beste Schätzung für eine unbekannte Größe verwendet wird; eine Intervallschätzung ist ein Bereich um diese Zahl, der angibt, wie präzise die Größe gemessen wurde.
Was misst der Standardfehler?: Er misst die Variabilität einer Schätzung über hypothetisch wiederholte Stichproben hinweg – im Grunde die Präzision der Schätzung. Ein kleinerer Standardfehler bedeutet, dass die Punktschätzung durch die Daten enger bestimmt wird.