잭나이프 재표본추출법
잭나이프는 한 번에 하나의 관측치를 제외하여 얻은 데이터 세트에서 통계량을 체계적으로 재계산함으로써 통계량의 편향과 분산을 추정합니다.
Definition
잭나이프는 하나의 관측치를 삭제하여 형성된 각 부분표본(subsample)에 대해 통계량을 계산한 다음, 이러한 단일 관측치 제외 값들을 결합하여 통계량의 편향 및 분산 추정치를 도출하는 재표본추출(resampling) 방법입니다.
Scope
이 주제는 단일 관측치 제외(leave-one-out) 잭나이프, 이 방법이 생성하는 유사값(pseudo-values), 편향 및 표준 오차의 잭나이프 추정치, delete-d 일반화, 그리고 선형 근사 및 완전 재표본추출 추정량으로서 잭나이프와 부트스트랩 간의 관계를 다룹니다. 비평활 통계량(non-smooth statistics)과 같이 잭나이프가 신뢰할 수 없는 설정도 언급됩니다.
Core questions
- 단일 관측치 제외 재계산은 어떻게 편향 및 표준 오차 추정치로 전환됩니까?
- 유사값(pseudo-values)이란 무엇이며, 각 관측치의 영향을 어떻게 요약합니까?
- 단순 잭나이프가 실패하는 통계량의 경우 delete-d 잭나이프는 어떻게 처리합니까?
- 잭나이프는 선형 근사로서 부트스트랩과 어떤 관계가 있습니까?
Key concepts
- 단일 관측치 제외 부분표본(Leave-one-out subsamples)
- 유사값(Pseudo-values)
- 잭나이프 편향 추정치(Jackknife bias estimate)
- 잭나이프 분산 추정치(Jackknife variance estimate)
- Delete-d 잭나이프(Delete-d jackknife)
Key theories
- 단일 관측치 제외 추정(Leave-one-out estimation)
- 각 관측치를 제거한 후 통계량을 재계산하면 일련의 교란된 값들이 생성되며, 이 값들의 확산은 분산을 추정하고, 표본 크기에 비례하여 조정된 평균 이동은 편향을 추정합니다.
- 부트스트랩과의 관계(Relation to the bootstrap)
- 잭나이프는 부트스트랩의 선형 근사로 볼 수 있으며, 평활 통계량(smooth statistics)에는 정확하지만 중앙값과 같은 비평활 통계량에는 실패합니다. 이는 delete-d 일반화의 동기가 되었습니다.
Clinical relevance
잭나이프는 관측치 수만큼의 재계산만으로 빠른 편향 및 분산 추정치를 제공하며, 그 유사값(pseudo-values)은 추정치에 불균형적으로 영향을 미치는 관측치를 탐지하기 위한 영향 진단(influence diagnostics)으로도 활용될 수 있습니다.
History
Quenouille는 1949년경 편향 감소를 위해 단일 관측치 제외 재계산(leave-one-out recomputation)을 제안했으며, Tukey는 1950년대에 이를 분산 추정을 위한 일반적인 도구로 확장하고 잭나이프라는 이름을 붙였습니다. 이후 Efron은 이를 부트스트랩과 함께 더 넓은 재표본추출 프레임워크 안에 포함시켰습니다.
Key figures
- Maurice Quenouille
- John Tukey
- Rupert Miller
- Bradley Efron
Related topics
Seminal works
- efron1979
- miller1974
Frequently asked questions
- 잭나이프는 부트스트랩과 어떻게 다릅니까?
- 잭나이프는 고정된 단일 관측치 제외 부분표본 집합을 사용하는 반면, 부트스트랩은 복원 추출을 통해 많은 무작위 표본을 추출합니다. 잭나이프는 더 빠르고 결정론적이지만 선형 근사에 불과하며, 부트스트랩이 여전히 작동하는 비평활 통계량에서는 실패할 수 있습니다.
- 단순 잭나이프가 중앙값에 대해 실패하는 이유는 무엇입니까?
- 중앙값은 단일 점이 제거될 때 부드럽게 변하는 것이 아니라 불연속적으로 변하므로, 단일 관측치 제외 값들이 그 변동성을 잘 포착하지 못합니다. 더 큰 관측치 그룹을 삭제하는 delete-d 잭나이프는 사용 가능한 추정치를 복원합니다.