リサンプリング法
リサンプリング法は、観測データから繰り返し新しいサンプルを抽出し、標準誤差と分布の解析式を計算に置き換えることで、統計量の不確実性を評価する手法である。
PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
Learn & explore
動画近日公開
Definition
リサンプリング法は、観測データから抽出されたサンプルまたはその分割に対して統計量を繰り返し再計算することにより、統計量の標本分布、バイアス、分散、または予測誤差を推定する、計算集約的な推論手法である。
Scope
この分野は、ブートストラップとその信頼区間、バイアスと分散推定のためのジャックナイフ、仮説検定のための順列検定とランダム化検定、予測誤差推定のための交差検定を網羅している。統一的な考え方は、リサンプリングを通じて再利用されるデータの経験分布が、未知の母集団分布の代わりとなるという点である。
Sub-topics
Core questions
- 観測データを繰り返しリサンプリングすることで、統計量の標本分布をどのように近似できるのか?
- ブートストラップ、ジャックナイフ、順列検定、交差検定は、目的とメカニズムにおいて何が異なるのか?
- リサンプリングによる近似はいつ成功し、いつ破綻するのか?
- パラメトリックな仮定なしに、リサンプリング法を用いて信頼区間と検定を構築するにはどうすればよいか?
Key theories
- プラグイン原理
- リサンプリングは、未知の母集団分布を標本の経験分布に置き換えるため、標準誤差やバイアスなどの量は、データ自体からの繰り返しサンプリングによって計算される。
- 推論のためのリサンプリング
- ブートストラップリサンプリングは変動性と信頼区間を推定し、順列リサンプリングは厳密または近似的な帰無分布を生成し、交差検定はデータの分割を再利用してサンプル外誤差を推定する。
Clinical relevance
リサンプリング法は、扱いやすい公式が存在しない複雑な統計量に対して標準誤差、信頼区間、検定を提供し、統計モデルや機械学習モデルの予測精度について信頼できる推定値を提供する。その最小限の仮定は、経験科学全体で広く利用される理由となっている。
History
クエヌイユとテューキーは1940年代から1950年代にかけてジャックナイフ法を開発し、エフロンは1979年にブートストラップ法を導入してジャックナイフ法と統合した。1980年代から1990年代にかけて安価なコンピューティングの普及により、リサンプリングは漸近理論に代わる主流の手法となった。
Key figures
- Bradley Efron
- Robert Tibshirani
- Anthony Davison
- Maurice Quenouille
Related topics
Seminal works
- efron1993
- efron1979
Frequently asked questions
- なぜリサンプリング法は計算集約型と呼ばれるのですか?
- 閉形式の導出を、リサンプリングされたデータに対する統計量の何千回もの繰り返し再計算に置き換えるためである。これはコンピュータがなければ実用的ではないが、その代わりに、この手法ははるかに少ないモデリング仮定しか必要としない。
- リサンプリング法は常に機能しますか?
- いいえ。極端な順序統計量に依存する統計量、非常に小さなサンプル、または強い依存関係がある場合には失敗する可能性がある。これらの失敗モードを知ることは、この手法を責任を持って使用する上で重要である。