Биномиальное и распределение Пуассона
Биномиальное распределение и распределение Пуассона являются двумя наиболее часто используемыми дискретными распределениями в биостатистике. Биномиальное распределение описывает количество успехов в фиксированном числе независимых испытаний типа «да/нет», тогда как распределение Пуассона описывает количество событий, происходящих в фиксированном интервале времени или пространства, когда события происходят с постоянной средней частотой. Оба распределения моделируют счетные данные, которые широко распространены в данных о здоровье.
Definition
Биномиальное распределение дает вероятность получения заданного числа успехов в фиксированном числе n независимых испытаний, каждое из которых имеет вероятность успеха p; распределение Пуассона дает вероятность заданного числа событий в фиксированном интервале, когда события происходят независимо с постоянной средней частотой.
Scope
Статья охватывает допущения, параметры, среднее значение и дисперсию биномиального распределения и распределения Пуассона, условия, которые описывает каждое из них, взаимосвязь между ними и их нормальные аппроксимации. Она иллюстрирует их использование для пропорций и частоты событий в исследованиях в области здравоохранения. Это методологический справочник, а не клиническое руководство.
Core questions
- Какие допущения определяют биномиальную ситуацию в отличие от ситуации Пуассона?
- Как определяются среднее значение и дисперсия каждого распределения?
- Когда распределение Пуассона аппроксимирует биномиальное?
- Когда каждое из них может быть аппроксимировано нормальным распределением?
Key concepts
- Испытание Бернулли
- Число испытаний n и вероятность успеха p
- Среднее значение и дисперсия биномиального распределения
- Параметр частоты Пуассона
- Равенство среднего значения и дисперсии Пуассона
- Аппроксимация Пуассона биномиальным распределением
- Нормальная аппроксимация
- Подсчеты, пропорции и частота событий
Mechanisms
Биномиальное распределение возникает из фиксированного числа n независимых испытаний, каждое из которых является испытанием Бернулли с одинаковой вероятностью успеха p; количество успехов имеет среднее значение np и дисперсию np(1-p). Распределение Пуассона возникает как предел биномиального распределения, когда n велико, а p мало, в то время как их произведение (ожидаемое количество) остается умеренным, поэтому оно моделирует редкие события при многих возможностях; оно имеет один параметр, равный как его среднему значению, так и его дисперсии, что отражает события, происходящие с постоянной частотой. Когда n велико или когда среднее значение Пуассона велико, оба распределения могут быть аппроксимированы нормальным распределением, поэтому методы для пропорций и частот часто заимствуют доверительные интервалы и тесты, основанные на нормальном распределении. В исследованиях в области здравоохранения биномиальное распределение лежит в основе анализа пропорций, таких как количество пациентов, отвечающих на лечение, в то время как распределение Пуассона лежит в основе подсчетов и показателей заболеваемости, таких как количество новых случаев в популяции за период.
Clinical relevance
Биномиальные модели и модели Пуассона лежат в основе анализа пропорций и частоты событий, о которых сообщается в медицинской литературе, поэтому распознавание того, какая модель применима, помогает критически читать результаты по показателям ответа и заболеваемости. Эта статья является методологической и не содержит указаний по индивидуальному уходу.
Epidemiology
Распределение Пуассона является естественной моделью для подсчета относительно редких событий, накапливающихся за человеко-время, и поэтому оно является фундаментальным для анализа показателей заболеваемости в эпидемиологии; биномиальное распределение лежит в основе анализа рисков и пропорций, таких как кумулятивная заболеваемость в закрытой группе.
History
Биномиальное распределение было изучено Якобом Бернулли в его анализе повторяющихся испытаний, опубликованном в 1713 году, а де Муавр позднее вывел его нормальную аппроксимацию. Симеон Дени Пуассон ввел распределение, носящее его имя, в 1837 году как предел биномиального распределения для редких событий. Оба стали стандартными инструментами для моделирования подсчетов, когда статистика стала применяться в медицине и общественном здравоохранении.
Key figures
- Jacob Bernoulli
- Siméon Denis Poisson
- Abraham de Moivre
Related topics
Seminal works
- rosner-2015
- armitage-2002
- ross-2014
Frequently asked questions
- Как определить, следует ли использовать биномиальную модель или модель Пуассона?
- Используйте биномиальную модель, когда имеется фиксированное число независимых испытаний типа «да/нет» и вы подсчитываете успехи; используйте модель Пуассона, когда вы подсчитываете события, происходящие в течение непрерывного интервала времени или пространства с примерно постоянной частотой, без фиксированного числа испытаний.
- Почему среднее значение распределения Пуассона равно его дисперсии?
- Это следует из структуры распределения как предела биномиального распределения для редких событий; это равенство также является практической проверкой, поскольку данные подсчета, дисперсия которых значительно превышает их среднее значение (сверхдисперсия), могут не соответствовать простой модели Пуассона.