Khi nào nên sử dụng kiểm định chính xác Fisher thay vì kiểm định chi-bình phương?

Khi bảng nhỏ hoặc thưa thớt — thường là khi một hoặc nhiều số lượng ô dự kiến thấp — phép xấp xỉ mẫu lớn chi-bình phương có thể không đáng tin cậy, và kiểm định chính xác Fisher, tính toán xác suất chính xác, được ưu tiên hơn.

Kiểm định chi-bình phương có ý nghĩa thống kê có cho tôi biết mức độ mạnh của mối liên hệ không?

Không. Các kiểm định này chỉ ra liệu có bằng chứng về một mối liên hệ hay không; quy mô của mối liên hệ được truyền đạt bằng một thước đo hiệu ứng riêng biệt như tỷ số nguy cơ hoặc tỷ số chênh, nên được báo cáo cùng với giá trị p.

Kiểm định Chi-Bình phương và Kiểm định Chính xác Fisher

Kiểm định chi-bình phương và kiểm định chính xác Fisher là hai quy trình tiêu chuẩn để xác định liệu hai biến phân loại trong một bảng tần số có liên quan hay độc lập với nhau. Kiểm định chi-bình phương so sánh số lượng ô quan sát được với số lượng ô dự kiến dưới giả định độc lập bằng cách sử dụng phép xấp xỉ mẫu lớn, trong khi kiểm định chính xác Fisher tính toán trực tiếp xác suất của bảng quan sát được và được sử dụng khi số lượng ô nhỏ.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics

Tools & resources

Tải xuống bản trình chiếu

Learn & explore

VideoSắp ra mắt

Definition

Kiểm định chi-bình phương về mối liên hệ đo lường sự khác biệt giữa số lượng ô quan sát được và số lượng ô dự kiến dưới giả thuyết không về tính độc lập, tham chiếu thống kê thu được đến phân phối chi-bình phương; kiểm định chính xác Fisher thay vào đó tính toán, từ phân phối siêu hình học với các biên được giữ cố định, xác suất chính xác của các bảng có mức độ cực đoan bằng hoặc hơn bảng quan sát được.

Scope

Mục này bao gồm thống kê chi-bình phương của Pearson và bậc tự do của nó, điều kiện số lượng dự kiến biện minh cho phép xấp xỉ chi-bình phương, hiệu chỉnh liên tục (Yates), logic của kiểm định chính xác Fisher dựa trên phân phối siêu hình học, và câu hỏi thực tế về thời điểm nên thay thế phép xấp xỉ bằng một kiểm định chính xác. Nó trình bày các kiểm định này như các kiểm định về mối liên hệ, không phải là hướng dẫn lâm sàng, và lưu ý rằng chúng đánh giá liệu có tồn tại mối liên hệ hay không, chứ không phải mức độ lớn của mối liên hệ đó.

Core questions

Hai biến phân loại trong bảng này có độc lập không, hay có bằng chứng về mối liên hệ?
Thống kê chi-bình phương được hình thành như thế nào từ số lượng quan sát được và dự kiến, và nó có bao nhiêu bậc tự do?
Khi nào số lượng dự kiến quá nhỏ để phép xấp xỉ chi-bình phương đáng tin cậy?
Kiểm định chính xác Fisher tránh phép xấp xỉ mẫu lớn như thế nào, và “điều kiện hóa trên các biên” có nghĩa là gì?

Key concepts

Số lượng quan sát được so với số lượng dự kiến
Thống kê chi-bình phương của Pearson
Bậc tự do (r-1)(c-1)
Phép xấp xỉ mẫu lớn (tiệm cận)
Quy tắc kinh nghiệm về số lượng dự kiến
Hiệu chỉnh liên tục Yates
Phân phối siêu hình học và các biên cố định
Giá trị p chính xác so với tiệm cận

Mechanisms

Dưới giả định độc lập, số lượng dự kiến của mỗi ô bằng tổng hàng của nó nhân với tổng cột của nó chia cho tổng chung. Thống kê chi-bình phương của Pearson tổng bình phương hiệu số giữa số lượng quan sát được và số lượng dự kiến chia cho số lượng dự kiến trên tất cả các ô; đối với bảng r×c, thống kê này được so sánh với phân phối chi-bình phương với (r−1)(c−1) bậc tự do, kết quả bậc tự do mà Fisher đã làm rõ vào năm 1922. Phép xấp xỉ giảm độ chính xác khi số lượng dự kiến nhỏ, dẫn đến một hướng dẫn chung rằng số lượng dự kiến thường nên vượt quá khoảng năm; hiệu chỉnh liên tục Yates được đề xuất để cải thiện phép xấp xỉ 2×2. Kiểm định chính xác Fisher bỏ qua phép xấp xỉ bằng cách coi các biên hàng và cột là cố định và tính toán, từ phân phối siêu hình học, xác suất chính xác của bảng quan sát được và của mọi bảng cực đoan hơn, tổng hợp chúng thành một giá trị p. Vì nó chính xác, nó được ưu tiên cho các bảng thưa thớt, mặc dù các đánh giá lưu ý tính chất có điều kiện, bảo thủ của nó và khuyến nghị các lựa chọn cụ thể trong số các kiểm định có sẵn.

Clinical relevance

Việc một nghiên cứu báo cáo rằng một phơi nhiễm có hoặc không liên quan đến một kết cục thường dựa vào một trong các kiểm định này, vì vậy việc hiểu chúng làm gì — và rằng một giá trị p nhỏ báo hiệu một mối liên hệ nhưng không nói lên điều gì về quy mô của nó — là một phần của việc đánh giá nghiên cứu sức khỏe. Các kiểm định này là công cụ để đánh giá bằng chứng về mối liên hệ và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.

Epidemiology

Các kiểm định chi-bình phương và kiểm định chính xác Fisher là các kiểm định ý nghĩa mặc định cho các bảng tần số 2×2 và lớn hơn trong dịch tễ học và nghiên cứu lâm sàng, đi kèm với tỷ số nguy cơ và tỷ số chênh mà định lượng cùng các mối liên hệ đó. Kiểm định chính xác thường được sử dụng cho các mẫu nhỏ hoặc các sự kiện hiếm gặp khi phép xấp xỉ chi-bình phương không đáng tin cậy.

History

Karl Pearson đã giới thiệu thống kê chi-bình phương kiểm định sự phù hợp vào năm 1900; bài báo năm 1922 của Fisher đã hiệu chỉnh bậc tự do cho các bảng tần số, và Fisher sau đó đã phát triển kiểm định chính xác mang tên ông cho các mẫu nhỏ. Yates đã đề xuất hiệu chỉnh liên tục của mình cho các bảng 2×2 vào năm 1934. Các khuyến nghị hiện đại giữa các quy trình này và các quy trình liên quan đã được tổng hợp trong các đánh giá phương pháp luận và sách giáo khoa.

Debates

Kiểm định chính xác so với kiểm định tiệm cận cho các bảng 2×2 nhỏ: Kiểm định chính xác Fisher điều kiện hóa trên cả hai biên và là chính xác nhưng có xu hướng bảo thủ, trong khi chi-bình phương không hiệu chỉnh có thể phản bảo thủ đối với các mẫu nhỏ và hiệu chỉnh Yates hiệu chỉnh quá mức; do đó, các đánh giá đưa ra các khuyến nghị tinh tế hơn là một quy tắc duy nhất.

Key figures

Karl Pearson
Ronald A. Fisher
Frank Yates
Alan Agresti

Seminal works

pearson-1900
fisher-1922
lydersen-2009

Frequently asked questions

Khi nào nên sử dụng kiểm định chính xác Fisher thay vì kiểm định chi-bình phương?: Khi bảng nhỏ hoặc thưa thớt — thường là khi một hoặc nhiều số lượng ô dự kiến thấp — phép xấp xỉ mẫu lớn chi-bình phương có thể không đáng tin cậy, và kiểm định chính xác Fisher, tính toán xác suất chính xác, được ưu tiên hơn.
Kiểm định chi-bình phương có ý nghĩa thống kê có cho tôi biết mức độ mạnh của mối liên hệ không?: Không. Các kiểm định này chỉ ra liệu có bằng chứng về một mối liên hệ hay không; quy mô của mối liên hệ được truyền đạt bằng một thước đo hiệu ứng riêng biệt như tỷ số nguy cơ hoặc tỷ số chênh, nên được báo cáo cùng với giá trị p.