Phân phối nhị thức và Poisson
Phân phối nhị thức và Poisson là hai phân phối rời rạc được sử dụng phổ biến nhất trong thống kê sinh học. Phân phối nhị thức mô tả số lần thành công trong một số lượng cố định các thử nghiệm độc lập có/không, trong khi phân phối Poisson mô tả số sự kiện xảy ra trong một khoảng thời gian hoặc không gian cố định khi các sự kiện xảy ra với tốc độ trung bình không đổi. Cả hai đều mô hình hóa các số đếm, vốn phổ biến trong dữ liệu y tế.
Definition
Phân phối nhị thức cho xác suất thu được một số lần thành công nhất định trong một số lượng cố định n các thử nghiệm độc lập, mỗi thử nghiệm có xác suất thành công p; phân phối Poisson cho xác suất của một số sự kiện nhất định trong một khoảng cố định khi các sự kiện xảy ra độc lập với tốc độ trung bình không đổi.
Scope
Mục này bao gồm các giả định, tham số, giá trị trung bình và phương sai của phân phối nhị thức và Poisson, các thiết lập mà mỗi phân phối mô tả, mối quan hệ giữa chúng và các xấp xỉ chuẩn của chúng. Nó minh họa việc sử dụng chúng cho các tỷ lệ và tỷ lệ sự kiện trong nghiên cứu sức khỏe. Đây là một tài liệu tham khảo về phương pháp luận chứ không phải hướng dẫn lâm sàng.
Core questions
- Những giả định nào định nghĩa một tình huống nhị thức so với một tình huống Poisson?
- Giá trị trung bình và phương sai của mỗi phân phối được xác định như thế nào?
- Khi nào phân phối Poisson xấp xỉ phân phối nhị thức?
- Khi nào mỗi phân phối có thể được xấp xỉ bằng phân phối chuẩn?
Key concepts
- Thử nghiệm Bernoulli
- Số lần thử n và xác suất thành công p
- Giá trị trung bình và phương sai nhị thức
- Tham số tốc độ Poisson
- Sự bằng nhau của giá trị trung bình và phương sai Poisson
- Xấp xỉ Poisson cho phân phối nhị thức
- Xấp xỉ chuẩn
- Số đếm, tỷ lệ và tỷ lệ sự kiện
Mechanisms
Phân phối nhị thức phát sinh từ một số lượng cố định n các thử nghiệm độc lập, mỗi thử nghiệm là một thử nghiệm Bernoulli với cùng xác suất thành công p; số lần thành công có giá trị trung bình np và phương sai np(1-p). Phân phối Poisson phát sinh như giới hạn của phân phối nhị thức khi n lớn và p nhỏ trong khi tích của chúng (số đếm kỳ vọng) vẫn ở mức vừa phải, do đó nó mô hình hóa các sự kiện hiếm gặp qua nhiều cơ hội; nó có một tham số duy nhất bằng cả giá trị trung bình và phương sai của nó, phản ánh các sự kiện xảy ra với tốc độ không đổi. Khi n lớn, hoặc khi giá trị trung bình của Poisson lớn, cả hai phân phối đều có thể được xấp xỉ bằng phân phối chuẩn, đó là lý do tại sao các phương pháp cho tỷ lệ và tốc độ thường mượn các khoảng tin cậy và kiểm định dựa trên phân phối chuẩn. Trong nghiên cứu sức khỏe, phân phối nhị thức là cơ sở cho việc phân tích các tỷ lệ, chẳng hạn như số bệnh nhân đáp ứng với điều trị, trong khi phân phối Poisson là cơ sở cho các số đếm và tỷ lệ mắc bệnh, chẳng hạn như số ca mắc mới trong một quần thể trong một khoảng thời gian.
Clinical relevance
Các mô hình nhị thức và Poisson là nền tảng cho việc phân tích các tỷ lệ và tỷ lệ sự kiện được báo cáo trong toàn bộ tài liệu y tế, vì vậy việc nhận biết mô hình nào áp dụng sẽ hỗ trợ việc đọc hiểu các kết quả về tỷ lệ đáp ứng và tỷ lệ mắc bệnh. Mục này mang tính phương pháp luận và không hướng dẫn chăm sóc cá nhân.
Epidemiology
Phân phối Poisson là mô hình tự nhiên cho các số đếm các sự kiện tương đối hiếm tích lũy theo thời gian người, và do đó nó là cơ sở cho việc phân tích tỷ lệ mắc bệnh trong dịch tễ học; phân phối nhị thức là cơ sở cho việc phân tích rủi ro và tỷ lệ, chẳng hạn như tỷ lệ mắc tích lũy trong một nhóm kín.
History
Phân phối nhị thức đã được Jacob Bernoulli nghiên cứu trong phân tích các thử nghiệm lặp lại của ông được xuất bản vào năm 1713, và de Moivre sau đó đã suy ra xấp xỉ chuẩn của nó. Siméon Denis Poisson đã giới thiệu phân phối mang tên ông vào năm 1837 như một giới hạn của phân phối nhị thức cho các sự kiện hiếm gặp. Cả hai đều trở thành công cụ tiêu chuẩn để mô hình hóa các số đếm khi thống kê được áp dụng vào y học và y tế công cộng.
Key figures
- Jacob Bernoulli
- Siméon Denis Poisson
- Abraham de Moivre
Related topics
Seminal works
- rosner-2015
- armitage-2002
- ross-2014
Frequently asked questions
- Làm thế nào để tôi biết nên sử dụng mô hình nhị thức hay Poisson?
- Sử dụng phân phối nhị thức khi có một số lượng cố định các thử nghiệm độc lập có/không và bạn đếm số lần thành công; sử dụng phân phối Poisson khi bạn đếm các sự kiện xảy ra trong một khoảng thời gian hoặc không gian liên tục với tốc độ gần như không đổi, không có số lượng thử nghiệm cố định.
- Tại sao giá trị trung bình của phân phối Poisson lại bằng phương sai của nó?
- Điều này xuất phát từ cấu trúc của phân phối như một giới hạn của phân phối nhị thức cho các sự kiện hiếm gặp; sự bằng nhau này cũng là một kiểm tra thực tế, vì dữ liệu đếm có phương sai lớn hơn nhiều so với giá trị trung bình của nó (phân tán quá mức) có thể không phù hợp với mô hình Poisson đơn giản.