이항 분포 및 포아송 분포
이항 분포와 포아송 분포는 생물통계학에서 가장 많이 사용되는 두 가지 이산 분포입니다. 이항 분포는 고정된 수의 독립적인 예/아니오 시행에서 성공 횟수를 설명하는 반면, 포아송 분포는 사건이 일정한 평균 비율로 발생할 때 고정된 시간 또는 공간 간격에서 발생하는 사건의 횟수를 설명합니다. 두 분포 모두 건강 데이터에서 흔히 나타나는 횟수를 모델링합니다.
Definition
이항 분포는 각각 성공 확률 p를 갖는 고정된 n개의 독립 시행에서 주어진 성공 횟수를 얻을 확률을 제공합니다. 포아송 분포는 사건이 일정한 평균 비율로 독립적으로 발생할 때 고정된 간격에서 주어진 사건 횟수의 확률을 제공합니다.
Scope
이 항목은 이항 분포와 포아송 분포의 가정, 매개변수, 평균 및 분산, 각 분포가 설명하는 설정, 두 분포 간의 관계, 그리고 정규 근사를 다룹니다. 또한 건강 연구에서 비율 및 사건 발생률에 대한 이들 분포의 활용을 설명합니다. 이는 방법론적 참고 자료이며 임상 지침이 아닙니다.
Core questions
- 이항 상황과 포아송 상황을 정의하는 가정은 무엇입니까?
- 각 분포의 평균과 분산은 어떻게 결정됩니까?
- 포아송 분포는 언제 이항 분포를 근사합니까?
- 각 분포는 언제 정규 분포로 근사될 수 있습니까?
Key concepts
- 베르누이 시행
- 시행 횟수 n 및 성공 확률 p
- 이항 분포의 평균 및 분산
- 포아송 분포의 비율 매개변수
- 포아송 분포의 평균과 분산의 동일성
- 이항 분포에 대한 포아송 근사
- 정규 근사
- 횟수, 비율 및 사건 발생률
Mechanisms
이항 분포는 고정된 n개의 독립 시행에서 발생하며, 각 시행은 동일한 성공 확률 p를 갖는 베르누이 시행입니다. 성공 횟수의 평균은 np이고 분산은 np(1-p)입니다. 포아송 분포는 n이 크고 p가 작으면서 그 곱(예상 횟수)이 중간 정도를 유지할 때 이항 분포의 극한으로 발생하므로, 많은 기회에 걸쳐 발생하는 희귀 사건을 모델링합니다. 포아송 분포는 평균과 분산이 모두 같은 단일 매개변수를 가지며, 이는 사건이 일정한 비율로 발생함을 반영합니다. n이 크거나 포아송 평균이 클 때, 두 분포 모두 정규 분포로 근사될 수 있습니다. 이 때문에 비율 및 발생률에 대한 방법론은 종종 정규 분포 기반의 신뢰 구간과 검정을 차용합니다. 건강 연구에서 이항 분포는 치료에 반응하는 환자 수와 같은 비율 분석의 기초가 되며, 포아송 분포는 특정 기간 동안 인구 내 새로운 사례 수와 같은 횟수 및 발생률의 기초가 됩니다.
Clinical relevance
이항 및 포아송 모델은 건강 문헌 전반에 걸쳐 보고되는 비율 및 사건 발생률 분석의 기반이 되므로, 어떤 모델이 적용되는지 인식하는 것은 반응률 및 질병 발생률에 대한 결과를 비판적으로 읽는 데 도움이 됩니다. 이 항목은 방법론적인 내용이며 개별적인 치료를 지시하지 않습니다.
Epidemiology
포아송 분포는 인시던트 타임(person-time)에 걸쳐 축적되는 비교적 희귀한 사건의 횟수에 대한 자연스러운 모델이므로, 역학에서 발생률 분석에 필수적입니다. 이항 분포는 폐쇄된 집단에서의 누적 발생률과 같은 위험 및 비율 분석의 기초가 됩니다.
History
이항 분포는 야코프 베르누이가 1713년에 발표한 반복 시행 분석에서 연구되었으며, 드 무아브르는 나중에 그 정규 근사를 도출했습니다. 시메옹 드니 푸아송은 1837년에 희귀 사건에 대한 이항 분포의 극한으로 자신의 이름을 딴 분포를 소개했습니다. 통계학이 의학과 공중 보건에 적용되면서 두 분포 모두 횟수를 모델링하는 표준 도구가 되었습니다.
Key figures
- Jacob Bernoulli
- Siméon Denis Poisson
- Abraham de Moivre
Related topics
Seminal works
- rosner-2015
- armitage-2002
- ross-2014
Frequently asked questions
- 이항 모델과 포아송 모델 중 어떤 것을 사용해야 하는지 어떻게 알 수 있습니까?
- 고정된 수의 독립적인 예/아니오 시행이 있고 성공 횟수를 셀 때는 이항 분포를 사용하십시오. 고정된 시행 횟수 없이 시간 또는 공간의 연속적인 간격에 걸쳐 거의 일정한 비율로 발생하는 사건을 셀 때는 포아송 분포를 사용하십시오.
- 포아송 분포의 평균이 분산과 같은 이유는 무엇입니까?
- 이는 희귀 사건에 대한 이항 분포의 극한으로서 분포의 구조에서 비롯됩니다. 이 동일성은 또한 실용적인 확인이기도 합니다. 분산이 평균을 크게 초과하는 횟수 데이터(과분산)는 단순한 포아송 모델에 적합하지 않을 수 있기 때문입니다.