Sự khác biệt giữa ước lượng và kiểm định giả thuyết là gì?

Ước lượng hỏi một đại lượng chưa biết lớn đến mức nào và chúng ta biết nó chính xác đến mức nào, tạo ra một ước lượng điểm và một khoảng; kiểm định giả thuyết hỏi liệu dữ liệu có tương thích với một tuyên bố cụ thể hay không và đưa ra một quyết định hoặc giá trị p. Chúng là những góc nhìn bổ sung cho cùng một thống kê cơ bản.

Tại sao suy luận thống kê lại cần thiết?

Bởi vì chúng ta hầu như không bao giờ quan sát toàn bộ quần thể; chúng ta làm việc với một mẫu thay đổi ngẫu nhiên, vì vậy chúng ta cần các phương pháp chính thức để tách tín hiệu khỏi sự biến thiên lấy mẫu và để gắn sự không chắc chắn trung thực vào các kết luận của chúng ta.

Ước lượng và Suy luận Thống kê

Ước lượng và suy luận thống kê là một nhánh của thống kê sinh học liên quan đến việc đưa ra kết luận về một quần thể từ một mẫu hữu hạn, có tính biến thiên. Nó cung cấp bộ máy hình thức cho hai nhiệm vụ bổ sung: ước lượng các đại lượng chưa biết (như giá trị trung bình, tỷ lệ hoặc hiệu ứng điều trị) cùng với biên độ không chắc chắn, và kiểm định xem dữ liệu quan sát được có tương thích với một giả thuyết đã nêu hay không. Cùng với nhau, những công cụ này biến dữ liệu nghiên cứu thô thành các phát biểu được định lượng, có nhận thức về sự không chắc chắn về thế giới.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics

Tools & resources

Tải xuống bản trình chiếu

Learn & explore

VideoSắp ra mắt

Definition

Suy luận thống kê là quá trình sử dụng một mẫu quan sát, cùng với một mô hình xác suất về cách các quan sát đó phát sinh, để ước lượng các tham số quần thể và để định lượng sự không chắc chắn của, hoặc kiểm định các giả thuyết về, các tham số đó.

Scope

Lĩnh vực này định hướng người đọc đến các ý tưởng cốt lõi thường xuyên xuất hiện trong nghiên cứu sức khỏe: ước lượng điểm và khoảng, khoảng tin cậy, khung kiểm định giả thuyết, hai loại lỗi quyết định mà nó có thể tạo ra, và sức mạnh thống kê cùng kích thước mẫu cần thiết để phát hiện các hiệu ứng một cách đáng tin cậy. Nó coi đây là các chủ đề tham chiếu về phương pháp luận để đánh giá và thiết kế các nghiên cứu, chứ không phải là các quy tắc quyết định lâm sàng.

Sub-topics

Core questions

Ước lượng tốt nhất của chúng ta về một đại lượng quần thể chưa biết là gì, và mức độ không chắc chắn của nó ra sao?
Phạm vi giá trị nào có thể phù hợp với dữ liệu quan sát được?
Dữ liệu có tương thích với một giả thuyết không đã được chỉ định hay không, hay chúng cung cấp bằng chứng chống lại nó?
Cần kích thước mẫu bao nhiêu để phát hiện một hiệu ứng có kích thước nhất định với tỷ lệ lỗi chấp nhận được?

Key concepts

Tham số quần thể so với thống kê mẫu
Phân phối lấy mẫu và sai số chuẩn
Ước lượng điểm
Ước lượng khoảng và khoảng tin cậy
Giả thuyết không và giả thuyết đối
Giá trị P
Lỗi loại I và loại II
Sức mạnh thống kê
Xác định kích thước mẫu

Key theories

Lý thuyết quyết định Neyman-Pearson: Định hình kiểm định giả thuyết như một quyết định giữa hai giả thuyết được điều chỉnh bởi các tỷ lệ lỗi dài hạn được kiểm soát, giới thiệu các khái niệm chính thức về lỗi loại I và loại II và kiểm định mạnh nhất cho một mức ý nghĩa cố định.
Mô hình ước lượng có tính không chắc chắn: Cho rằng việc báo cáo các ước lượng hiệu ứng với khoảng tin cậy truyền đạt nhiều hơn một phán quyết ý nghĩa đơn thuần, chuyển trọng tâm từ việc liệu một hiệu ứng có tồn tại hay không sang mức độ hợp lý của nó.

Mechanisms

Suy luận dựa trên một mô hình xác suất liên kết dữ liệu với các tham số chưa biết và dựa trên ý tưởng về phân phối lấy mẫu: sự phân tán của các ước lượng sẽ phát sinh qua các mẫu lặp lại. Ước lượng tóm tắt phân phối lấy mẫu đó dưới dạng ước lượng điểm cộng với một thước đo độ chính xác (sai số chuẩn), sau đó được chuyển thành một khoảng. Kiểm định giả thuyết định hình lại cùng một phân phối dưới dạng một vấn đề quyết định, so sánh dữ liệu quan sát với những gì giả thuyết không dự đoán và kiểm soát xác suất của các kết luận dương tính giả và âm tính giả. Giá trị p và khoảng tin cậy là hai mặt của phép tính cơ bản duy nhất này, và cả hai thường bị hiểu sai, vì vậy việc định nghĩa cẩn thận là rất quan trọng.

Clinical relevance

Hầu hết mọi phát hiện định lượng trong y văn – tỷ số rủi ro, sự khác biệt trung bình, số liệu độ chính xác chẩn đoán – đều là một phát biểu suy luận mang tính không chắc chắn. Do đó, việc hiểu ước lượng và suy luận là trọng tâm để đọc và đánh giá bằng chứng, cũng như để đánh giá xem một hiệu ứng được báo cáo có chính xác, hợp lý và có đủ sức mạnh hay không. Lĩnh vực này mô tả cách bằng chứng như vậy được tạo ra và diễn giải; nó không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.

Evidence & guidelines

Các tổ chức chuyên môn đã ban hành hướng dẫn rõ ràng để hạn chế việc lạm dụng phổ biến các thống kê suy luận. Tuyên bố năm 2016 của Hiệp hội Thống kê Hoa Kỳ về giá trị p đã đưa ra các nguyên tắc để diễn giải đúng đắn, và một hướng dẫn bổ sung của Greenland và các đồng nghiệp đã liệt kê hai mươi lăm cách hiểu sai thường gặp về giá trị p, khoảng tin cậy và sức mạnh. Lời kêu gọi trước đó của Gardner và Altman về việc ưu tiên khoảng tin cậy hơn giá trị p đơn thuần đã định hình các quy ước báo cáo trong các tạp chí y học.

History

Suy luận hiện đại phát triển từ hai truyền thống đối lập một phần vào đầu thế kỷ XX: kiểm định ý nghĩa và giá trị p của Fisher, và khung kiểm định lý thuyết quyết định mà Neyman và Pearson đã hình thức hóa vào năm 1933. Khoảng tin cậy, cũng chủ yếu do Neyman, đã cung cấp một cái nhìn bổ sung tập trung vào ước lượng. Trong suốt cuối thế kỷ XX, các nhà thống kê và dịch tễ học ngày càng chỉ trích sự phụ thuộc máy móc vào các ngưỡng ý nghĩa, đỉnh điểm là các tuyên bố cảnh báo chính thức từ cộng đồng thống kê vào những năm 2010.

Debates

Kiểm định ý nghĩa so với ước lượng: Một cuộc tranh luận kéo dài đặt câu hỏi liệu các phán quyết ý nghĩa nhị phân có gây hiểu lầm hay không, với nhiều nhà phương pháp luận cho rằng các ước lượng hiệu ứng và khoảng tin cậy nên được ưu tiên hơn các ngưỡng giá trị p.

Key figures

Jerzy Neyman
Egon Pearson
Ronald A. Fisher
Douglas G. Altman
Sander Greenland

Seminal works

neyman-pearson-1933
gardner-altman-1986
wasserstein-lazar-2016

Frequently asked questions

Sự khác biệt giữa ước lượng và kiểm định giả thuyết là gì?: Ước lượng hỏi một đại lượng chưa biết lớn đến mức nào và chúng ta biết nó chính xác đến mức nào, tạo ra một ước lượng điểm và một khoảng; kiểm định giả thuyết hỏi liệu dữ liệu có tương thích với một tuyên bố cụ thể hay không và đưa ra một quyết định hoặc giá trị p. Chúng là những góc nhìn bổ sung cho cùng một thống kê cơ bản.
Tại sao suy luận thống kê lại cần thiết?: Bởi vì chúng ta hầu như không bao giờ quan sát toàn bộ quần thể; chúng ta làm việc với một mẫu thay đổi ngẫu nhiên, vì vậy chúng ta cần các phương pháp chính thức để tách tín hiệu khỏi sự biến thiên lấy mẫu và để gắn sự không chắc chắn trung thực vào các kết luận của chúng ta.