Bootstrap và Lấy mẫu lại
Bootstrap ước tính phân phối lấy mẫu của một thống kê bằng cách lấy mẫu lại dữ liệu quan sát được, thay thế các công thức khó tính toán bằng phương pháp tính toán.
Definition
Bootstrap là một phương pháp lấy mẫu lại ước tính phân phối lấy mẫu của một thống kê bằng cách coi mẫu quan sát được là tổng thể và lặp lại việc lấy mẫu từ đó, thường là có thay thế, để ước tính sai số chuẩn, khoảng tin cậy và độ chệch.
Scope
Chủ đề này bao gồm bootstrap phi tham số bằng cách lấy mẫu lại có thay thế, bootstrap tham số, jackknife và các ước tính độ chệch và phương sai của nó, các kiểm định hoán vị, sai số chuẩn bootstrap và các khoảng tin cậy phần trăm, hiệu chỉnh độ chệch và bootstrap-t, tính nhất quán của bootstrap và độ chính xác bậc cao hơn của nó thông qua khai triển Edgeworth, và các trường hợp nổi tiếng như giá trị cực đại mẫu mà bootstrap thông thường thất bại.
Core questions
- Việc lấy mẫu lại dữ liệu ước tính phân phối lấy mẫu của một thống kê như thế nào?
- Các khoảng tin cậy bootstrap được xây dựng như thế nào, và khoảng tin cậy phần trăm và bootstrap-t khác nhau như thế nào?
- Khi nào bootstrap nhất quán, và khi nào nó thất bại?
- Một kiểm định hoán vị sử dụng lấy mẫu lại để có được một kiểm định không phân phối chính xác như thế nào?
Key theories
- Nguyên lý bootstrap
- Việc ước tính tổng thể không xác định bằng phân phối thực nghiệm và lấy mẫu lại từ đó cho phép ước tính sự biến thiên lấy mẫu của hầu hết mọi thống kê bằng mô phỏng, ngay cả khi không tồn tại phân phối dạng đóng.
- Tính nhất quán và độ chính xác của Bootstrap
- Đối với các thống kê trơn, bootstrap là nhất quán và, thông qua khai triển Edgeworth, một số khoảng bootstrap chính xác hơn xấp xỉ chuẩn; đối với các hàm không trơn như giá trị cực đại, nó có thể thất bại.
Clinical relevance
Bootstrap cung cấp sai số chuẩn và khoảng tin cậy cho các ước lượng phức tạp, chẳng hạn như trung vị, tương quan và dự đoán học máy, khi không có công thức phân tích, và các kiểm định hoán vị đưa ra các đánh giá ý nghĩa chính xác được sử dụng rộng rãi trong genomics và các thử nghiệm ngẫu nhiên.
History
Quenouille và Tukey đã phát triển jackknife vào những năm 1950. Efron đã giới thiệu bootstrap vào năm 1979, thống nhất và mở rộng các ý tưởng lấy mẫu lại này, và công trình của Hall vào những năm 1980 và 1990 đã thiết lập độ chính xác bậc cao hơn của nó thông qua khai triển Edgeworth.
Key figures
- Bradley Efron
- Robert Tibshirani
- Peter Hall
- Maurice Quenouille
Related topics
Seminal works
- efron1979
Frequently asked questions
- Bootstrap có tạo ra thông tin mới từ hư vô không?
- Không. Nó tái sử dụng thông tin đã có trong mẫu để ước tính sự biến thiên lấy mẫu; nó không thể cải thiện một mẫu kém hoặc thiên lệch, và độ chính xác của nó phụ thuộc vào việc mẫu ban đầu đại diện tốt cho tổng thể.
- Khi nào bootstrap thất bại?
- Nó có thể thất bại đối với các thống kê phụ thuộc không trơn vào phân phối, chẳng hạn như giá trị cực đại mẫu hoặc các tham số trên một biên; trong những trường hợp như vậy, các lược đồ sửa đổi như lấy mẫu con hoặc bootstrap m-trên-n được sử dụng thay thế.