Khoảng tin cậy
Khoảng tin cậy là một phạm vi các giá trị hợp lý cho một đại lượng quần thể chưa biết, được tính toán từ dữ liệu mẫu sao cho quy trình được sử dụng để xây dựng nó sẽ nắm bắt giá trị thực một tỷ lệ thời gian đã nêu – thông thường là 95% – trên các mẫu lặp lại. Nó thể hiện cả độ lớn của ước tính và sự không chắc chắn xung quanh nó trong một bản tóm tắt duy nhất, được báo cáo rộng rãi và đã trở thành cách ưu tiên để trình bày các ước tính hiệu quả trong khoa học sức khỏe.
Definition
Khoảng tin cậy là một khoảng, được tính toán từ dữ liệu mẫu bằng một phương pháp xác định ở một mức độ tin cậy đã nêu, sao cho phương pháp đó sẽ chứa tham số quần thể thực trong tỷ lệ đã nêu của các mẫu lặp lại giả định.
Scope
Chủ đề này giải thích khoảng tin cậy là gì, mức độ tin cậy của nó nên được diễn giải như thế nào, độ rộng khoảng phản ánh độ chính xác và kích thước mẫu ra sao, và những cách hiểu sai phổ biến về khái niệm này. Nó được trình bày như một phương pháp luận tham chiếu để đánh giá và báo cáo nghiên cứu, không phải là một quy tắc quyết định lâm sàng.
Core questions
- Phạm vi giá trị nào cho tham số là hợp lý và nhất quán với dữ liệu?
- Mức độ tin cậy thực sự đảm bảo điều gì?
- Kích thước mẫu và sự biến thiên xác định độ rộng khoảng như thế nào?
- Khoảng tin cậy liên quan đến kiểm định giả thuyết hoặc giá trị p như thế nào?
Key concepts
- Mức độ tin cậy
- Xác suất bao phủ
- Độ rộng khoảng và độ chính xác
- Giới hạn tin cậy dưới và trên
- Diễn giải theo tần suất
- Mối quan hệ với giá trị null
- Khoảng chính xác so với khoảng xấp xỉ
Mechanisms
Khoảng tin cậy thường được hình thành bằng cách lấy một ước tính điểm và mở rộng nó bằng một bội số của sai số chuẩn của nó, trong đó bội số được đặt theo mức độ tin cậy mong muốn và phân phối lấy mẫu liên quan. Thuộc tính thường xuyên xác định là độ bao phủ: nếu nghiên cứu được lặp lại nhiều lần, các khoảng được xây dựng theo cách này sẽ chứa tham số thực trong tỷ lệ lặp lại đã nêu. Khoảng thu hẹp khi mẫu tăng hoặc biến thiên giảm, do đó độ rộng là một chỉ số trực tiếp về độ chính xác. Một cách tắt phổ biến liên kết các khoảng với các thử nghiệm – nếu một khoảng 95% cho một sự khác biệt loại trừ giá trị null, thì thử nghiệm hai phía tương ứng có ý nghĩa ở mức 5% – nhưng khoảng truyền tải nhiều hơn bằng cách hiển thị toàn bộ phạm vi các giá trị tương thích. Một lỗi thường gặp là đọc mức độ như xác suất mà giá trị thực nằm bên trong một khoảng cụ thể, điều mà định nghĩa thường xuyên không hỗ trợ.
Clinical relevance
Khoảng tin cậy đi kèm với hầu hết các ước tính hiệu quả trong các báo cáo lâm sàng và dịch tễ học, cho phép người đọc đánh giá không chỉ liệu một hiệu ứng có hiện diện hay không mà còn độ lớn và độ chính xác của nó. Một khoảng rộng báo hiệu một nghiên cứu không có kết luận ngay cả khi ước tính điểm trông nổi bật. Mục này mô tả cách các khoảng được xây dựng và diễn giải và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
Evidence & guidelines
Các hướng dẫn báo cáo và quy ước biên tập trong y học hiện nay thường xuyên yêu cầu các ước tính hiệu quả được trình bày với khoảng tin cậy. Tuyên bố của Hiệp hội Thống kê Hoa Kỳ về giá trị p và hướng dẫn hiểu sai của Greenland và các đồng nghiệp đều nhấn mạnh việc diễn giải chính xác các khoảng cùng với giá trị p, dựa trên sự ủng hộ trước đó của Gardner và Altman về báo cáo dựa trên khoảng.
History
Khoảng tin cậy được Jerzy Neyman giới thiệu vào những năm 1930 như một cách tiếp cận thường xuyên để ước tính khoảng, với các cấu trúc chính xác ban đầu như giới hạn Clopper-Pearson cho một tỷ lệ nhị thức xuất hiện vào năm 1934. Việc sử dụng thường xuyên của nó trong y học được thúc đẩy sau đó vào thế kỷ XX, đáng chú ý là bởi trường hợp của Gardner và Altman năm 1986 về việc báo cáo các khoảng thay vì các giá trị p trần trụi, điều này đã định hình lại các quy ước của tạp chí.
Debates
- Hiểu sai về mức độ tin cậy
- Mức độ tin cậy mô tả hiệu suất dài hạn của quy trình xây dựng khoảng, không phải xác suất mà một khoảng được tính toán cụ thể chứa giá trị thực; sự khác biệt này thường bị hiểu sai và là một nguồn lỗi lặp đi lặp lại.
Key figures
- Jerzy Neyman
- Egon Pearson
- Martin J. Gardner
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- clopper-pearson-1934
- gardner-altman-1986
Frequently asked questions
- Khoảng tin cậy 95% có nghĩa là có 95% khả năng giá trị thực nằm trong đó không?
- Không. Theo định nghĩa thường xuyên, giá trị thực là cố định, và 95% đề cập đến tỷ lệ dài hạn của các khoảng như vậy, được xây dựng theo cùng một cách trên các mẫu lặp lại, sẽ chứa nó – không phải xác suất cho một khoảng cụ thể.
- Điều gì làm cho khoảng tin cậy hẹp hay rộng?
- Chủ yếu là kích thước mẫu và sự biến thiên: các mẫu lớn hơn và dữ liệu ít biến thiên hơn cho các khoảng hẹp hơn, chính xác hơn, trong khi các nghiên cứu nhỏ hoặc nhiễu tạo ra các khoảng rộng báo hiệu sự không chắc chắn.