Как определить, следует ли использовать биномиальную модель или модель Пуассона?

Используйте биномиальную модель, когда имеется фиксированное число независимых испытаний типа «да/нет» и вы подсчитываете успехи; используйте модель Пуассона, когда вы подсчитываете события, происходящие в течение непрерывного интервала времени или пространства с примерно постоянной частотой, без фиксированного числа испытаний.

Почему среднее значение распределения Пуассона равно его дисперсии?

Это следует из структуры распределения как предела биномиального распределения для редких событий; это равенство также является практической проверкой, поскольку данные подсчета, дисперсия которых значительно превышает их среднее значение (сверхдисперсия), могут не соответствовать простой модели Пуассона.

Биномиальное и распределение Пуассона

Биномиальное распределение и распределение Пуассона являются двумя наиболее часто используемыми дискретными распределениями в биостатистике. Биномиальное распределение описывает количество успехов в фиксированном числе независимых испытаний типа «да/нет», тогда как распределение Пуассона описывает количество событий, происходящих в фиксированном интервале времени или пространства, когда события происходят с постоянной средней частотой. Оба распределения моделируют счетные данные, которые широко распространены в данных о здоровье.

Найти тему в PaperMindСкороFind papers & topics

Tools & resources

Скачать слайды

Learn & explore

ВидеоСкоро

Definition

Биномиальное распределение дает вероятность получения заданного числа успехов в фиксированном числе n независимых испытаний, каждое из которых имеет вероятность успеха p; распределение Пуассона дает вероятность заданного числа событий в фиксированном интервале, когда события происходят независимо с постоянной средней частотой.

Scope

Статья охватывает допущения, параметры, среднее значение и дисперсию биномиального распределения и распределения Пуассона, условия, которые описывает каждое из них, взаимосвязь между ними и их нормальные аппроксимации. Она иллюстрирует их использование для пропорций и частоты событий в исследованиях в области здравоохранения. Это методологический справочник, а не клиническое руководство.

Core questions

Какие допущения определяют биномиальную ситуацию в отличие от ситуации Пуассона?
Как определяются среднее значение и дисперсия каждого распределения?
Когда распределение Пуассона аппроксимирует биномиальное?
Когда каждое из них может быть аппроксимировано нормальным распределением?

Key concepts

Испытание Бернулли
Число испытаний n и вероятность успеха p
Среднее значение и дисперсия биномиального распределения
Параметр частоты Пуассона
Равенство среднего значения и дисперсии Пуассона
Аппроксимация Пуассона биномиальным распределением
Нормальная аппроксимация
Подсчеты, пропорции и частота событий

Mechanisms

Биномиальное распределение возникает из фиксированного числа n независимых испытаний, каждое из которых является испытанием Бернулли с одинаковой вероятностью успеха p; количество успехов имеет среднее значение np и дисперсию np(1-p). Распределение Пуассона возникает как предел биномиального распределения, когда n велико, а p мало, в то время как их произведение (ожидаемое количество) остается умеренным, поэтому оно моделирует редкие события при многих возможностях; оно имеет один параметр, равный как его среднему значению, так и его дисперсии, что отражает события, происходящие с постоянной частотой. Когда n велико или когда среднее значение Пуассона велико, оба распределения могут быть аппроксимированы нормальным распределением, поэтому методы для пропорций и частот часто заимствуют доверительные интервалы и тесты, основанные на нормальном распределении. В исследованиях в области здравоохранения биномиальное распределение лежит в основе анализа пропорций, таких как количество пациентов, отвечающих на лечение, в то время как распределение Пуассона лежит в основе подсчетов и показателей заболеваемости, таких как количество новых случаев в популяции за период.

Clinical relevance

Биномиальные модели и модели Пуассона лежат в основе анализа пропорций и частоты событий, о которых сообщается в медицинской литературе, поэтому распознавание того, какая модель применима, помогает критически читать результаты по показателям ответа и заболеваемости. Эта статья является методологической и не содержит указаний по индивидуальному уходу.

Epidemiology

Распределение Пуассона является естественной моделью для подсчета относительно редких событий, накапливающихся за человеко-время, и поэтому оно является фундаментальным для анализа показателей заболеваемости в эпидемиологии; биномиальное распределение лежит в основе анализа рисков и пропорций, таких как кумулятивная заболеваемость в закрытой группе.

History

Биномиальное распределение было изучено Якобом Бернулли в его анализе повторяющихся испытаний, опубликованном в 1713 году, а де Муавр позднее вывел его нормальную аппроксимацию. Симеон Дени Пуассон ввел распределение, носящее его имя, в 1837 году как предел биномиального распределения для редких событий. Оба стали стандартными инструментами для моделирования подсчетов, когда статистика стала применяться в медицине и общественном здравоохранении.

Key figures

Jacob Bernoulli
Siméon Denis Poisson
Abraham de Moivre

Seminal works

rosner-2015
armitage-2002
ross-2014

Frequently asked questions

Как определить, следует ли использовать биномиальную модель или модель Пуассона?: Используйте биномиальную модель, когда имеется фиксированное число независимых испытаний типа «да/нет» и вы подсчитываете успехи; используйте модель Пуассона, когда вы подсчитываете события, происходящие в течение непрерывного интервала времени или пространства с примерно постоянной частотой, без фиксированного числа испытаний.
Почему среднее значение распределения Пуассона равно его дисперсии?: Это следует из структуры распределения как предела биномиального распределения для редких событий; это равенство также является практической проверкой, поскольку данные подсчета, дисперсия которых значительно превышает их среднее значение (сверхдисперсия), могут не соответствовать простой модели Пуассона.