Jackknife-Resampling
Das Jackknife schätzt die Verzerrung (Bias) und Varianz einer Statistik, indem es diese systematisch auf Datensätzen neu berechnet, die durch das Weglassen jeweils einer Beobachtung gewonnen werden.
Definition
Das Jackknife ist eine Resampling-Methode, die eine Statistik für jede Teilstichprobe berechnet, die durch das Löschen einer Beobachtung gebildet wird, und diese „Leave-one-out“-Werte dann zu Schätzungen der Verzerrung und Varianz der Statistik kombiniert.
Scope
Dieses Thema behandelt das Leave-one-out-Jackknife, die von ihm erzeugten Pseudowerte, Jackknife-Schätzungen von Bias und Standardfehler, die Delete-d-Verallgemeinerung sowie die Beziehung zwischen dem Jackknife und dem Bootstrap als linear-approximierende und vollständige Resampling-Schätzer. Es werden Situationen aufgezeigt, in denen das Jackknife unzuverlässig ist, wie z. B. bei nicht-glatten Statistiken.
Core questions
- Wie werden „Leave-one-out“-Neuberechnungen in Schätzungen von Bias und Standardfehler umgewandelt?
- Was sind Pseudowerte und wie fassen sie den Einfluss jeder Beobachtung zusammen?
- Wie geht das Delete-d-Jackknife mit Statistiken um, bei denen das einfache Jackknife versagt?
- Wie ist das Jackknife als lineare Approximation mit dem Bootstrap verwandt?
Key concepts
- Leave-one-out-Teilstichproben
- Pseudowerte
- Jackknife-Bias-Schätzung
- Jackknife-Varianzschätzung
- Delete-d-Jackknife
Key theories
- Leave-one-out-Schätzung
- Die Neuberechnung einer Statistik, wobei jede Beobachtung entfernt wird, liefert eine Reihe von gestörten Werten, deren Streuung die Varianz schätzt und deren mittlere Verschiebung, skaliert nach der Stichprobengröße, den Bias schätzt.
- Beziehung zum Bootstrap
- Das Jackknife kann als lineare Approximation des Bootstrap angesehen werden, die für glatte Statistiken genau ist, aber bei nicht-glatten Statistiken wie dem Median versagt, was die Delete-d-Verallgemeinerung motivierte.
Clinical relevance
Das Jackknife liefert schnelle Schätzungen von Bias und Varianz, die nur so viele Neuberechnungen erfordern, wie Beobachtungen vorhanden sind. Seine Pseudowerte dienen zudem als Einflussdiagnostika zur Erkennung von Beobachtungen, die eine Schätzung unverhältnismäßig stark beeinflussen.
History
Quenouille schlug um 1949 die „Leave-one-out“-Neuberechnung zur Bias-Reduktion vor, und Tukey erweiterte sie in den 1950er Jahren zu einem allgemeinen Werkzeug zur Varianzschätzung und prägte den Namen Jackknife; Efron ordnete es später zusammen mit dem Bootstrap in den breiteren Resampling-Rahmen ein.
Key figures
- Maurice Quenouille
- John Tukey
- Rupert Miller
- Bradley Efron
Related topics
Seminal works
- efron1979
- miller1974
Frequently asked questions
- Wie unterscheidet sich das Jackknife vom Bootstrap?
- Das Jackknife verwendet den festen Satz von „Leave-one-out“-Teilstichproben, während der Bootstrap viele zufällige Stichproben mit Zurücklegen zieht. Das Jackknife ist schneller und deterministisch, aber nur eine lineare Approximation und kann bei nicht-glatten Statistiken versagen, wo der Bootstrap noch funktioniert.
- Warum kann das einfache Jackknife beim Median versagen?
- Der Median ändert sich in Sprüngen und nicht stetig, wenn einzelne Punkte entfernt werden, sodass die „Leave-one-out“-Werte seine Variabilität nicht gut erfassen. Das Löschen größerer Beobachtungsgruppen, das Delete-d-Jackknife, stellt eine brauchbare Schätzung wieder her.