Xác suất và các phân phối xác suất
Xác suất là ngôn ngữ toán học để định lượng sự không chắc chắn, và các phân phối xác suất mô tả cách các giá trị có thể có của một biến ngẫu nhiên được phân bố. Cùng với nhau, chúng tạo thành nền tảng lý thuyết mà trên đó suy luận thống kê trong khoa học sức khỏe được xây dựng: mọi khoảng tin cậy, giá trị p và ước tính rủi ro cuối cùng đều dựa trên một mô hình xác suất về cách dữ liệu có thể phát sinh.
Definition
Xác suất gán các số từ 0 đến 1 cho các sự kiện để biểu thị mức độ có thể xảy ra của chúng; một phân phối xác suất là một hàm xác định xác suất của các giá trị có thể có của một biến ngẫu nhiên.
Scope
Lĩnh vực này định hướng người đọc đến các ý tưởng cốt lõi về xác suất và các phân phối được sử dụng nhiều nhất trong thống kê sinh học. Nó bao gồm các quy tắc cơ bản của xác suất, xác suất có điều kiện và tính độc lập, phân phối chuẩn, phân phối nhị thức và Poisson cho các số đếm và sự kiện, và các phân phối lấy mẫu liên kết một mẫu với quần thể thông qua định lý giới hạn trung tâm. Đây là một tổng quan giáo dục-tham khảo về phương pháp luận, không phải hướng dẫn lâm sàng.
Sub-topics
Core questions
- Sự không chắc chắn được định lượng như thế nào để có thể suy luận về dữ liệu một cách chính thức?
- Phân phối nào mô tả một loại phép đo hoặc số đếm nhất định?
- Hành vi của một thống kê mẫu liên quan như thế nào đến quần thể cơ bản?
- Tại sao phân phối chuẩn lại xuất hiện thường xuyên trong các đại lượng tổng hợp?
Key concepts
- Biến ngẫu nhiên
- Không gian mẫu và các sự kiện
- Các tiên đề xác suất
- Xác suất có điều kiện và tính độc lập
- Các phân phối rời rạc và liên tục
- Kỳ vọng và phương sai
- Phân phối lấy mẫu
- Định lý giới hạn trung tâm
Mechanisms
Một mô hình xác suất xác định một không gian mẫu của các kết quả có thể và gán các xác suất phù hợp với các tiên đề (không âm, tổng xác suất bằng một, tính cộng cho các sự kiện loại trừ lẫn nhau). Các biến ngẫu nhiên ánh xạ các kết quả thành các số, và các phân phối của chúng tóm tắt xác suất của các số đó, được đặc trưng bởi các đại lượng như giá trị trung bình (kỳ vọng) và phương sai. Các phân phối rời rạc như phân phối nhị thức và Poisson mô hình hóa số lượng sự kiện; phân phối chuẩn liên tục mô hình hóa nhiều đại lượng đo lường và, thông qua định lý giới hạn trung tâm, xấp xỉ phân phối của các tổng và trung bình. Thống kê suy luận hoạt động bằng cách coi một thống kê quan sát được như một lần rút từ phân phối lấy mẫu của nó.
Clinical relevance
Các phân phối xác suất là nền tảng cho các phương pháp thống kê được sử dụng để tóm tắt dữ liệu sức khỏe và đưa ra suy luận từ các nghiên cứu, vì vậy việc hiểu chúng hỗ trợ việc đọc phê bình các tài liệu định lượng. Mục này mô tả nền tảng phương pháp luận của các phân tích đó và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
History
Xác suất toán học phát triển từ các phân tích trò chơi may rủi vào thế kỷ XVII và được Bernoulli, Laplace, Gauss và Poisson phát triển thành một lý thuyết phân phối tổng quát. Công thức tiên đề của Kolmogorov vào những năm 1930 đã đặt xác suất trên một nền tảng chặt chẽ. Trong suốt thế kỷ XX, các công cụ này trở thành cơ sở của suy luận thống kê, và thống kê sinh học đã áp dụng chúng để mô hình hóa các phép đo và số đếm trong nghiên cứu y học và y tế công cộng.
Key figures
- Pierre-Simon Laplace
- Carl Friedrich Gauss
- Siméon Denis Poisson
- Jacob Bernoulli
- Andrey Kolmogorov
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
- ross-2014
Frequently asked questions
- Tại sao các khóa học thống kê sinh học lại dành nhiều thời gian cho các phân phối xác suất?
- Bởi vì suy luận thống kê hoạt động bằng cách so sánh dữ liệu quan sát được với những gì một mô hình xác suất dự đoán; phân phối là cầu nối giữa một mẫu và một tuyên bố về quần thể, vì vậy tính hợp lệ của các khoảng tin cậy và các kiểm định phụ thuộc vào việc chọn một phân phối phù hợp.
- Sự khác biệt giữa xác suất và phân phối xác suất là gì?
- Xác suất là một số duy nhất mô tả mức độ có thể xảy ra của một sự kiện, trong khi phân phối xác suất xác định xác suất trên tất cả các giá trị có thể có của một biến ngẫu nhiên cùng một lúc.