Punktschätzung und Intervallschätzung
Punkt- und Intervallschätzung sind die beiden grundlegenden Methoden, um zusammenzufassen, was eine Stichprobe über eine unbekannte Populationsgröße aussagt. Eine Punktschätzung ist eine einzelne beste Schätzung – zum Beispiel der Stichprobenmittelwert als Schätzung des wahren Mittelwerts –, während eine Intervallschätzung diese Schätzung mit einem Wertebereich umgibt, der die wahre Größe plausibel enthält. Die Angabe sowohl einer Punktschätzung als auch eines Intervalls kommuniziert nicht nur die Größe eines Effekts, sondern auch, wie präzise dieser gemessen wurde.
Definition
Eine Punktschätzung ist ein einzelner Wert, der aus Stichprobendaten berechnet wird, um einen unbekannten Populationsparameter zu approximieren; eine Intervallschätzung ist ein Wertebereich, der aus denselben Daten und einer angegebenen Methode abgeleitet wird und den Parameter mit einem bestimmten Konfidenzniveau enthalten soll.
Scope
Dieses Thema behandelt, was einen Punktschätzer gut macht (z. B. unverzerrt und effizient zu sein), wie der Standardfehler die Präzision einer Schätzung quantifiziert und wie Punktschätzungen zu Intervallschätzungen erweitert werden. Es behandelt die Schätzung als Referenzmethodik für die Gestaltung und Bewertung von Studien, nicht als klinische Regel.
Core questions
- Was ist die beste Einzelschätzung der interessierenden Populationsgröße?
- Wie präzise ist diese Schätzung – wie stark würde sie bei wiederholten Stichproben variieren?
- Welcher Wertebereich ist plausibel mit den Daten vereinbar?
- Welche Eigenschaften machen einen Schätzer einem anderen vorzuziehen?
Key concepts
- Schätzer und Schätzung
- Populationsparameter
- Unverzerrtheit (Unbiasedness)
- Effizienz und Präzision
- Standardfehler
- Stichprobenverteilung
- Fehlerspanne (Margin of error)
- Maximum-Likelihood-Schätzung
Mechanisms
Ein Punktschätzer ist eine Regel, die Stichprobendaten auf eine Zahl abbildet, die einen Parameter approximiert; der Stichprobenmittelwert, der Stichprobenanteil und Regressionskoeffizienten sind gängige Beispiele. Da eine andere Stichprobe einen anderen Wert ergeben würde, hat jede Punktschätzung eine Stichprobenverteilung, deren Streuung durch den Standardfehler zusammengefasst wird – kleinere Standardfehler bedeuten präzisere Schätzungen. Eine Intervallschätzung wird dann durch die Kombination der Punktschätzung mit einem Vielfachen ihres Standardfehlers (oder, für begrenzte Größen wie einen Anteil, mit exakten Methoden wie der Clopper-Pearson-Konstruktion) gebildet. Gute Schätzer werden typischerweise nach Verzerrung (Bias), Effizienz und Konsistenz beurteilt, so dass sich die Schätzung mit zunehmender Stichprobengröße auf den wahren Wert konzentriert.
Clinical relevance
Effektgrößen, die in der Gesundheitsforschung berichtet werden – mittlere Differenzen, relative Risiken, Prävalenzzahlen – sind Punktschätzungen, und ihre begleitenden Intervalle sagen dem Leser, wie sehr er ihnen vertrauen kann. Die Erkenntnis, dass eine Punktschätzung ohne ein Präzisionsmaß unvollständig ist, ist eine zentrale Bewertungsfähigkeit. Dieser Eintrag erklärt, wie solche Schätzungen gebildet werden, und ist keine Grundlage für individuelle klinische Entscheidungen.
Evidence & guidelines
Methodische Leitlinien in den Gesundheitswissenschaften haben Autoren seit langem dazu angehalten, Effektschätzungen mit ihrer Präzision darzustellen, anstatt sich auf Signifikanzurteile zu verlassen. Gardners und Altmans einflussreiches Argument für die Intervallberichterstattung und der spätere Leitfaden zur Fehlinterpretation von Greenland und Kollegen prägen die Konventionen, die heute in medizinischen Fachzeitschriften erwartet werden.
History
Die Punktschätzung wurde durch Fishers Arbeit zur Maximum-Likelihood-Methode in den 1920er Jahren auf eine rigorose Grundlage gestellt, während die Intervallschätzung aus derselben Zeit hervorging, einschließlich exakter Intervallkonstruktionen wie der Clopper-Pearson-Grenzen für einen Binomialanteil im Jahr 1934. Die Betonung der routinemäßigen Berichterstattung von Schätzungen mit Intervallen in der Medizin wurde später im zwanzigsten Jahrhundert gefestigt.
Key figures
- Ronald A. Fisher
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
Related topics
Seminal works
- gardner-altman-1986
- clopper-pearson-1934
Frequently asked questions
- Was ist der Unterschied zwischen einer Punktschätzung und einer Intervallschätzung?
- Eine Punktschätzung ist eine einzelne Zahl, wie der Stichprobenmittelwert, die als beste Schätzung für eine unbekannte Größe verwendet wird; eine Intervallschätzung ist ein Bereich um diese Zahl, der angibt, wie präzise die Größe gemessen wurde.
- Was misst der Standardfehler?
- Er misst die Variabilität einer Schätzung über hypothetisch wiederholte Stichproben hinweg – im Grunde die Präzision der Schätzung. Ein kleinerer Standardfehler bedeutet, dass die Punktschätzung durch die Daten enger bestimmt wird.