توزیعهای دوجملهای و پواسون
توزیعهای دوجملهای (binomial) و پواسون (Poisson) دو مورد از پرکاربردترین توزیعهای گسسته در آمار زیستی هستند. توزیع دوجملهای تعداد موفقیتها را در تعداد ثابتی از آزمایشهای مستقل بله/خیر توصیف میکند، در حالی که توزیع پواسون تعداد رویدادهای رخداده در یک بازه زمانی یا مکانی ثابت را توصیف میکند، زمانی که رویدادها با نرخ متوسط ثابتی اتفاق میافتند. هر دو مدل، شمارشها را مدلسازی میکنند که در دادههای سلامت بسیار رایج هستند.
Definition
توزیع دوجملهای احتمال به دست آوردن تعداد معینی از موفقیتها را در تعداد ثابت n از آزمایشهای مستقل که هر یک دارای احتمال موفقیت p هستند، ارائه میدهد؛ توزیع پواسون احتمال تعداد معینی از رویدادها را در یک بازه ثابت ارائه میدهد، زمانی که رویدادها به طور مستقل با نرخ میانگین ثابتی رخ میدهند.
Scope
این مدخل به مفروضات، پارامترها، میانگین و واریانس توزیعهای دوجملهای و پواسون، محیطهایی که هر یک توصیف میکنند، رابطه بین آنها و تقریبهای نرمال آنها میپردازد. همچنین کاربرد آنها را برای نسبتها و نرخهای رویداد در تحقیقات سلامت نشان میدهد. این یک مرجع روششناختی است و نه راهنمای بالینی.
Core questions
- چه مفروضاتی یک وضعیت دوجملهای را در مقابل یک وضعیت پواسون تعریف میکنند؟
- میانگین و واریانس هر توزیع چگونه تعیین میشوند؟
- چه زمانی توزیع پواسون، توزیع دوجملهای را تقریب میزند؟
- چه زمانی هر یک را میتوان با توزیع نرمال تقریب زد؟
Key concepts
- آزمایش برنولی
- تعداد آزمایشها n و احتمال موفقیت p
- میانگین و واریانس دوجملهای
- پارامتر نرخ پواسون
- برابری میانگین و واریانس پواسون
- تقریب پواسون به دوجملهای
- تقریب نرمال
- شمارشها، نسبتها و نرخهای رویداد
Mechanisms
توزیع دوجملهای از تعداد ثابت n از آزمایشهای مستقل ناشی میشود که هر یک یک آزمایش برنولی (Bernoulli trial) با احتمال موفقیت p یکسان هستند؛ شمارش موفقیتها دارای میانگین np و واریانس np(1-p) است. توزیع پواسون به عنوان حد توزیع دوجملهای زمانی که n بزرگ و p کوچک است، در حالی که حاصلضرب آنها (شمارش مورد انتظار) متوسط باقی میماند، پدید میآید، بنابراین رویدادهای نادر را در فرصتهای زیاد مدلسازی میکند؛ این توزیع دارای یک پارامتر واحد است که برابر با میانگین و واریانس آن است و نشاندهنده رویدادهایی است که با نرخ ثابتی رخ میدهند. هنگامی که n بزرگ است، یا زمانی که میانگین پواسون بزرگ است، هر دو توزیع را میتوان با یک توزیع نرمال تقریب زد، به همین دلیل است که روشهای مربوط به نسبتها و نرخها اغلب از فواصل اطمینان و آزمونهای مبتنی بر نرمال استفاده میکنند. در تحقیقات سلامت، توزیع دوجملهای زیربنای تحلیل نسبتها است، مانند تعداد بیمارانی که به یک درمان پاسخ میدهند، در حالی که توزیع پواسون زیربنای شمارشها و نرخهای بروز است، مانند تعداد موارد جدید در یک جمعیت در یک دوره زمانی.
Clinical relevance
مدلهای دوجملهای و پواسون زیربنای تحلیل نسبتها و نرخهای رویداد گزارششده در سراسر ادبیات سلامت هستند، بنابراین تشخیص اینکه کدام یک کاربرد دارد، به خوانش انتقادی نتایج مربوط به نرخهای پاسخ و بروز بیماری کمک میکند. این مدخل روششناختی است و مراقبت فردی را هدایت نمیکند.
Epidemiology
توزیع پواسون مدل طبیعی برای شمارش رویدادهای نسبتاً نادر است که در طول زمان-فرد (person-time) انباشته میشوند، و بنابراین برای تحلیل نرخهای بروز در اپیدمیولوژی اساسی است؛ توزیع دوجملهای زیربنای تحلیل خطرات و نسبتها است، مانند بروز تجمعی در یک گروه بسته.
History
توزیع دوجملهای توسط جاکوب برنولی در تحلیل او از آزمایشهای مکرر که در سال ۱۷۱۳ منتشر شد، مورد مطالعه قرار گرفت و دموآور (de Moivre) بعدها تقریب نرمال آن را استخراج کرد. سیمئون دنی پواسون (Siméon Denis Poisson) توزیعی را که نام او را یدک میکشد در سال ۱۸۳۷ به عنوان حدی از توزیع دوجملهای برای رویدادهای نادر معرفی کرد. هر دو به ابزارهای استانداردی برای مدلسازی شمارشها تبدیل شدند، زمانی که آمار در پزشکی و بهداشت عمومی به کار گرفته شد.
Key figures
- Jacob Bernoulli
- Siméon Denis Poisson
- Abraham de Moivre
Related topics
Seminal works
- rosner-2015
- armitage-2002
- ross-2014
Frequently asked questions
- چگونه بفهمم که باید از مدل دوجملهای استفاده کنم یا پواسون؟
- زمانی از توزیع دوجملهای استفاده کنید که تعداد ثابتی از آزمایشهای مستقل بله/خیر وجود دارد و شما موفقیتها را میشمارید؛ زمانی از توزیع پواسون استفاده کنید که رویدادهایی را میشمارید که در یک بازه زمانی یا مکانی پیوسته با نرخ تقریباً ثابت رخ میدهند و تعداد آزمایشهای ثابتی وجود ندارد.
- چرا میانگین توزیع پواسون برابر با واریانس آن است؟
- این از ساختار توزیع به عنوان حدی از توزیع دوجملهای برای رویدادهای نادر ناشی میشود؛ این برابری همچنین یک بررسی عملی است، زیرا دادههای شمارشی که واریانس آنها به طور قابل توجهی از میانگین آنها بیشتر است (فراپراکندگی)، ممکن است با یک مدل پواسون ساده مطابقت نداشته باشند.