Sự khác biệt giữa lỗi loại I và lỗi loại II là gì?

Lỗi loại I là dương tính giả – kết luận có hiệu ứng khi thực tế không có – và lỗi loại II là âm tính giả – bỏ sót một hiệu ứng có thật. Xác suất của chúng lần lượt được gọi là alpha và beta.

Tại sao tôi không thể làm cho cả hai tỷ lệ lỗi càng nhỏ càng tốt?

Đối với một cỡ mẫu cố định, hai loại lỗi này có sự đánh đổi: thắt chặt kiểm định để cắt giảm dương tính giả sẽ làm tăng âm tính giả. Cách chính để giảm cả hai cùng lúc là tăng cỡ mẫu.

Lỗi loại I và loại II

Lỗi loại I và loại II là hai cách mà một kiểm định giả thuyết có thể đưa ra kết luận sai. Lỗi loại I là dương tính giả – bác bỏ một giả thuyết null đúng và khẳng định một hiệu ứng không tồn tại – trong khi lỗi loại II là âm tính giả – không phát hiện được một hiệu ứng có thật. Mức ý nghĩa kiểm soát tỷ lệ lỗi loại I, và phần bù của tỷ lệ lỗi loại II là sức mạnh thống kê, do đó hai loại lỗi này định hình cách thiết kế nghiên cứu cân bằng rủi ro của việc khẳng định quá mức và khẳng định dưới mức.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics

Tools & resources

Tải xuống bản trình chiếu

Learn & explore

VideoSắp ra mắt

Definition

Lỗi loại I là việc bác bỏ một giả thuyết null thực sự đúng (dương tính giả), xảy ra với xác suất alpha; lỗi loại II là việc không bác bỏ một giả thuyết null thực sự sai (âm tính giả), xảy ra với xác suất beta.

Scope

Chủ đề này định nghĩa hai loại lỗi, liên kết chúng với mức ý nghĩa (alpha) và tỷ lệ lỗi loại II (beta), đồng thời giải thích sự đánh đổi giữa chúng trong thiết kế nghiên cứu. Đây là một phương pháp luận tham chiếu để đánh giá và lập kế hoạch nghiên cứu, không phải là một quy tắc quyết định lâm sàng.

Core questions

Kết luận dương tính giả so với âm tính giả có nghĩa là gì?
Mức ý nghĩa và tỷ lệ lỗi loại II liên quan đến các lỗi này như thế nào?
Tại sao việc giảm một tỷ lệ lỗi có thể làm tăng tỷ lệ lỗi kia?
Cỡ mẫu ảnh hưởng đến khả năng xảy ra mỗi loại lỗi như thế nào?

Key concepts

Lỗi loại I (dương tính giả)
Lỗi loại II (âm tính giả)
Mức ý nghĩa (alpha)
Tỷ lệ lỗi loại II (beta)
Sức mạnh là 1 trừ beta
Sự đánh đổi lỗi
Kiểm định đa bội và dương tính giả tăng cao

Mechanisms

Trong sơ đồ Neyman-Pearson, một kiểm định được thiết kế bằng cách cố định trước tỷ lệ lỗi loại I có thể chấp nhận được (alpha, mức ý nghĩa), điều này xác định tần suất một giả thuyết null đúng sẽ bị bác bỏ sai. Tỷ lệ lỗi loại II (beta) là cơ hội bỏ sót một hiệu ứng thực sự có kích thước nhất định, và một trừ beta là sức mạnh của kiểm định. Đối với một cỡ mẫu cố định, hai tỷ lệ lỗi có sự đánh đổi: làm cho kiểm định chặt chẽ hơn để giảm dương tính giả sẽ làm tăng cơ hội âm tính giả, và ngược lại. Tăng cỡ mẫu là cách chính để giảm cả hai cùng một lúc. Kiểm định nhiều giả thuyết mà không điều chỉnh sẽ làm tăng tỷ lệ lỗi loại I tổng thể, đó là lý do tại sao tính đa kiểm định là một mối quan tâm lặp đi lặp lại trong thiết kế.

Clinical relevance

Các loại lỗi này là cơ sở cho việc các kết luận của các thử nghiệm và nghiên cứu quan sát có thể gây hiểu lầm như thế nào: một phát hiện dương tính giả có thể thúc đẩy một can thiệp không hiệu quả, trong khi một phát hiện âm tính giả có thể bỏ qua một can thiệp hữu ích. Việc đọc xem một nghiên cứu có kiểm soát tỷ lệ lỗi của nó hay không – và liệu một kết quả null có đơn thuần phản ánh sức mạnh thấp hay không – là cốt lõi của việc đánh giá bằng chứng. Mục này giải thích các lỗi suy luận và không phải là cơ sở cho các quyết định lâm sàng cá nhân.

Evidence & guidelines

Các bình luận về phương pháp luận nhấn mạnh rằng một kết quả không có ý nghĩa thống kê không phải là bằng chứng cho việc không có hiệu ứng, vì các nghiên cứu có sức mạnh thấp dễ mắc lỗi loại II; ghi chú của Altman và Bland rằng không có bằng chứng không phải là bằng chứng của sự vắng mặt đã nắm bắt trực tiếp điều này. Các đánh giá về nghiên cứu có sức mạnh thấp, chẳng hạn như phân tích của Button và các đồng nghiệp trong khoa học thần kinh, đã ghi lại cách sức mạnh thấp vừa làm tăng âm tính giả vừa làm giảm độ tin cậy của các phát hiện có ý nghĩa thống kê.

History

Sự phân biệt giữa lỗi loại thứ nhất và loại thứ hai được Neyman và Pearson giới thiệu trong công thức hóa kiểm định giả thuyết năm 1933 của họ, trong đó thiết kế kiểm định được coi là việc kiểm soát hai xác suất lỗi này. Các hậu quả thực tế – đặc biệt là những nguy hiểm của lỗi loại II trong các nghiên cứu nhỏ – đã trở thành một chủ đề lặp đi lặp lại trong các phê bình phương pháp luận về nghiên cứu sức khỏe và hành vi trong thế kỷ XX và XXI.

Debates

Giải thích các kết quả không có ý nghĩa thống kê: Vì các nghiên cứu có sức mạnh thấp thường mắc lỗi loại II, một phát hiện không có ý nghĩa thống kê thường bị hiểu sai là chứng minh không có hiệu ứng; các nhà phương pháp luận nhấn mạnh rằng không có bằng chứng không phải là bằng chứng của sự vắng mặt.

Key figures

Jerzy Neyman
Egon Pearson
Douglas G. Altman
J. Martin Bland
John P. A. Ioannidis

Seminal works

neyman-pearson-1933
altman-bland-1995

Frequently asked questions

Sự khác biệt giữa lỗi loại I và lỗi loại II là gì?: Lỗi loại I là dương tính giả – kết luận có hiệu ứng khi thực tế không có – và lỗi loại II là âm tính giả – bỏ sót một hiệu ứng có thật. Xác suất của chúng lần lượt được gọi là alpha và beta.
Tại sao tôi không thể làm cho cả hai tỷ lệ lỗi càng nhỏ càng tốt?: Đối với một cỡ mẫu cố định, hai loại lỗi này có sự đánh đổi: thắt chặt kiểm định để cắt giảm dương tính giả sẽ làm tăng âm tính giả. Cách chính để giảm cả hai cùng lúc là tăng cỡ mẫu.