ScholarGate
Trợ lý

Phân phối lấy mẫu và Định lý giới hạn trung tâm

Phân phối lấy mẫu là phân phối xác suất của một thống kê, chẳng hạn như trung bình mẫu, trên tất cả các mẫu có thể có với một kích thước nhất định. Định lý giới hạn trung tâm phát biểu rằng, đối với các mẫu đủ lớn, phân phối lấy mẫu của giá trị trung bình xấp xỉ phân phối chuẩn bất kể hình dạng của dữ liệu cơ bản. Cùng với nhau, chúng giải thích tại sao các khoảng tin cậy và kiểm định dựa trên phân phối chuẩn lại được áp dụng rộng rãi.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Phân phối lấy mẫu là phân phối các giá trị mà một thống kê sẽ có trên tất cả các mẫu có thể có với kích thước cố định từ một quần thể; định lý giới hạn trung tâm phát biểu rằng phân phối lấy mẫu của trung bình mẫu tiếp cận phân phối chuẩn khi kích thước mẫu tăng lên, bất kể hình dạng của quần thể.

Scope

Mục này bao gồm khái niệm về phân phối lấy mẫu, sai số chuẩn như độ phân tán của nó, định lý giới hạn trung tâm và vai trò của kích thước mẫu, cũng như sự khác biệt giữa độ lệch chuẩn của các cá thể và sai số chuẩn của một thống kê. Nó liên kết các ý tưởng này với khoảng tin cậy và kiểm định giả thuyết. Đây là một tài liệu tham khảo về phương pháp luận chứ không phải hướng dẫn lâm sàng.

Core questions

  • Phân phối lấy mẫu của một thống kê là gì và tại sao nó lại quan trọng?
  • Sai số chuẩn khác với độ lệch chuẩn như thế nào?
  • Định lý giới hạn trung tâm đảm bảo điều gì và trong những điều kiện nào?
  • Kích thước mẫu ảnh hưởng đến độ chính xác của một ước lượng như thế nào?

Key concepts

  • Thống kê so với tham số
  • Phân phối lấy mẫu
  • Sai số chuẩn
  • Sai số chuẩn so với độ lệch chuẩn
  • Kích thước mẫu và độ chính xác
  • Tính chuẩn hóa xấp xỉ của giá trị trung bình
  • Cơ sở của khoảng tin cậy và kiểm định

Key theories

Định lý giới hạn trung tâm
Đối với các quan sát độc lập từ một quần thể có phương sai hữu hạn, phân phối của trung bình mẫu có xu hướng tiến tới phân phối chuẩn khi kích thước mẫu tăng lên, bất kể hình dạng của quần thể; điều này biện minh cho suy luận dựa trên phân phối chuẩn đối với giá trị trung bình ngay cả khi các phép đo cá thể không theo phân phối chuẩn.

Mechanisms

Nếu các mẫu lặp lại cùng kích thước được rút ra từ một quần thể, một thống kê như giá trị trung bình sẽ thay đổi từ mẫu này sang mẫu khác; phân phối của các giá trị đó là phân phối lấy mẫu, và độ lệch chuẩn của nó là sai số chuẩn. Đối với trung bình mẫu, sai số chuẩn bằng độ lệch chuẩn của quần thể chia cho căn bậc hai của kích thước mẫu, do đó độ chính xác được cải thiện khi kích thước mẫu tăng lên nhưng chỉ theo căn bậc hai của n. Định lý giới hạn trung tâm bổ sung rằng, đối với các mẫu đủ lớn, phân phối lấy mẫu này xấp xỉ phân phối chuẩn ngay cả khi dữ liệu tự nó bị lệch, miễn là các quan sát độc lập và phương sai là hữu hạn. Đây là động lực của suy luận cổ điển: một khoảng tin cậy cho giá trị trung bình được xây dựng bằng cách đi ra một số sai số chuẩn từ ước lượng dưới sự chuẩn hóa xấp xỉ, và nhiều kiểm định giả thuyết so sánh một ước lượng với phân phối lấy mẫu của nó. Sai số chuẩn, giảm theo kích thước mẫu, phải được phân biệt với độ lệch chuẩn của các quan sát cá thể, ước tính độ phân tán của quần thể và không giảm.

Clinical relevance

Các khoảng tin cậy và giá trị p được báo cáo trong các nghiên cứu lâm sàng và y tế công cộng dựa trên phân phối lấy mẫu của ước lượng và định lý giới hạn trung tâm, do đó việc hiểu chúng giúp đánh giá độ chính xác của các hiệu ứng được báo cáo. Mục này là nền tảng phương pháp luận và không phải là cơ sở cho các quyết định lâm sàng cá nhân.

History

Các dạng ban đầu của định lý giới hạn trung tâm xuất hiện trong xấp xỉ chuẩn của de Moivre đối với phân phối nhị thức và trong công trình của Laplace khoảng năm 1810, và các điều kiện tổng quát chặt chẽ đã được Lyapunov và những người khác thiết lập khoảng năm 1900. Quan điểm phân phối lấy mẫu trở thành trung tâm của suy luận vào đầu thế kỷ XX và vẫn là cơ sở biện minh tiêu chuẩn cho các khoảng tin cậy và kiểm định dựa trên phân phối chuẩn trong thống kê sinh học.

Debates

Kích thước mẫu phải lớn đến mức nào để định lý giới hạn trung tâm được áp dụng?
Sự xấp xỉ cải thiện theo kích thước mẫu, nhưng kích thước đủ lớn là bao nhiêu phụ thuộc vào mức độ lệch của dữ liệu; đối với các phân phối lệch rõ rệt, cần các mẫu lớn hơn nhiều trước khi phân phối của giá trị trung bình là chuẩn chấp nhận được, do đó không có một quy tắc chung nào phù hợp với mọi trường hợp.

Key figures

  • Pierre-Simon Laplace
  • Abraham de Moivre
  • Aleksandr Lyapunov

Related topics

Seminal works

  • altman-bland-2005-se
  • rosner-2015

Frequently asked questions

Sự khác biệt giữa độ lệch chuẩn và sai số chuẩn là gì?
Độ lệch chuẩn đo lường độ phân tán của các quan sát cá thể, trong khi sai số chuẩn đo lường độ phân tán của một thống kê, chẳng hạn như trung bình mẫu, trên các mẫu; sai số chuẩn giảm khi kích thước mẫu tăng lên, trong khi độ lệch chuẩn ước tính một đại lượng quần thể cố định.
Tại sao chúng ta có thể sử dụng phân phối chuẩn cho giá trị trung bình ngay cả khi dữ liệu bị lệch?
Định lý giới hạn trung tâm nói rằng phân phối lấy mẫu của giá trị trung bình trở nên xấp xỉ chuẩn khi kích thước mẫu tăng lên bất kể hình dạng của dữ liệu, do đó các phương pháp dựa trên phân phối chuẩn cho giá trị trung bình thường hợp lệ với các mẫu đủ lớn ngay cả khi các giá trị cá thể không được phân phối chuẩn.

Methods for this concept

Related concepts