ScholarGate
دستیار

توزیع‌های دوجمله‌ای و پواسون

توزیع‌های دوجمله‌ای (binomial) و پواسون (Poisson) دو مورد از پرکاربردترین توزیع‌های گسسته در آمار زیستی هستند. توزیع دوجمله‌ای تعداد موفقیت‌ها را در تعداد ثابتی از آزمایش‌های مستقل بله/خیر توصیف می‌کند، در حالی که توزیع پواسون تعداد رویدادهای رخ‌داده در یک بازه زمانی یا مکانی ثابت را توصیف می‌کند، زمانی که رویدادها با نرخ متوسط ثابتی اتفاق می‌افتند. هر دو مدل، شمارش‌ها را مدل‌سازی می‌کنند که در داده‌های سلامت بسیار رایج هستند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

توزیع دوجمله‌ای احتمال به دست آوردن تعداد معینی از موفقیت‌ها را در تعداد ثابت n از آزمایش‌های مستقل که هر یک دارای احتمال موفقیت p هستند، ارائه می‌دهد؛ توزیع پواسون احتمال تعداد معینی از رویدادها را در یک بازه ثابت ارائه می‌دهد، زمانی که رویدادها به طور مستقل با نرخ میانگین ثابتی رخ می‌دهند.

Scope

این مدخل به مفروضات، پارامترها، میانگین و واریانس توزیع‌های دوجمله‌ای و پواسون، محیط‌هایی که هر یک توصیف می‌کنند، رابطه بین آن‌ها و تقریب‌های نرمال آن‌ها می‌پردازد. همچنین کاربرد آن‌ها را برای نسبت‌ها و نرخ‌های رویداد در تحقیقات سلامت نشان می‌دهد. این یک مرجع روش‌شناختی است و نه راهنمای بالینی.

Core questions

  • چه مفروضاتی یک وضعیت دوجمله‌ای را در مقابل یک وضعیت پواسون تعریف می‌کنند؟
  • میانگین و واریانس هر توزیع چگونه تعیین می‌شوند؟
  • چه زمانی توزیع پواسون، توزیع دوجمله‌ای را تقریب می‌زند؟
  • چه زمانی هر یک را می‌توان با توزیع نرمال تقریب زد؟

Key concepts

  • آزمایش برنولی
  • تعداد آزمایش‌ها n و احتمال موفقیت p
  • میانگین و واریانس دوجمله‌ای
  • پارامتر نرخ پواسون
  • برابری میانگین و واریانس پواسون
  • تقریب پواسون به دوجمله‌ای
  • تقریب نرمال
  • شمارش‌ها، نسبت‌ها و نرخ‌های رویداد

Mechanisms

توزیع دوجمله‌ای از تعداد ثابت n از آزمایش‌های مستقل ناشی می‌شود که هر یک یک آزمایش برنولی (Bernoulli trial) با احتمال موفقیت p یکسان هستند؛ شمارش موفقیت‌ها دارای میانگین np و واریانس np(1-p) است. توزیع پواسون به عنوان حد توزیع دوجمله‌ای زمانی که n بزرگ و p کوچک است، در حالی که حاصل‌ضرب آن‌ها (شمارش مورد انتظار) متوسط باقی می‌ماند، پدید می‌آید، بنابراین رویدادهای نادر را در فرصت‌های زیاد مدل‌سازی می‌کند؛ این توزیع دارای یک پارامتر واحد است که برابر با میانگین و واریانس آن است و نشان‌دهنده رویدادهایی است که با نرخ ثابتی رخ می‌دهند. هنگامی که n بزرگ است، یا زمانی که میانگین پواسون بزرگ است، هر دو توزیع را می‌توان با یک توزیع نرمال تقریب زد، به همین دلیل است که روش‌های مربوط به نسبت‌ها و نرخ‌ها اغلب از فواصل اطمینان و آزمون‌های مبتنی بر نرمال استفاده می‌کنند. در تحقیقات سلامت، توزیع دوجمله‌ای زیربنای تحلیل نسبت‌ها است، مانند تعداد بیمارانی که به یک درمان پاسخ می‌دهند، در حالی که توزیع پواسون زیربنای شمارش‌ها و نرخ‌های بروز است، مانند تعداد موارد جدید در یک جمعیت در یک دوره زمانی.

Clinical relevance

مدل‌های دوجمله‌ای و پواسون زیربنای تحلیل نسبت‌ها و نرخ‌های رویداد گزارش‌شده در سراسر ادبیات سلامت هستند، بنابراین تشخیص اینکه کدام یک کاربرد دارد، به خوانش انتقادی نتایج مربوط به نرخ‌های پاسخ و بروز بیماری کمک می‌کند. این مدخل روش‌شناختی است و مراقبت فردی را هدایت نمی‌کند.

Epidemiology

توزیع پواسون مدل طبیعی برای شمارش رویدادهای نسبتاً نادر است که در طول زمان-فرد (person-time) انباشته می‌شوند، و بنابراین برای تحلیل نرخ‌های بروز در اپیدمیولوژی اساسی است؛ توزیع دوجمله‌ای زیربنای تحلیل خطرات و نسبت‌ها است، مانند بروز تجمعی در یک گروه بسته.

History

توزیع دوجمله‌ای توسط جاکوب برنولی در تحلیل او از آزمایش‌های مکرر که در سال ۱۷۱۳ منتشر شد، مورد مطالعه قرار گرفت و دموآور (de Moivre) بعدها تقریب نرمال آن را استخراج کرد. سیمئون دنی پواسون (Siméon Denis Poisson) توزیعی را که نام او را یدک می‌کشد در سال ۱۸۳۷ به عنوان حدی از توزیع دوجمله‌ای برای رویدادهای نادر معرفی کرد. هر دو به ابزارهای استانداردی برای مدل‌سازی شمارش‌ها تبدیل شدند، زمانی که آمار در پزشکی و بهداشت عمومی به کار گرفته شد.

Key figures

  • Jacob Bernoulli
  • Siméon Denis Poisson
  • Abraham de Moivre

Related topics

Seminal works

  • rosner-2015
  • armitage-2002
  • ross-2014

Frequently asked questions

چگونه بفهمم که باید از مدل دوجمله‌ای استفاده کنم یا پواسون؟
زمانی از توزیع دوجمله‌ای استفاده کنید که تعداد ثابتی از آزمایش‌های مستقل بله/خیر وجود دارد و شما موفقیت‌ها را می‌شمارید؛ زمانی از توزیع پواسون استفاده کنید که رویدادهایی را می‌شمارید که در یک بازه زمانی یا مکانی پیوسته با نرخ تقریباً ثابت رخ می‌دهند و تعداد آزمایش‌های ثابتی وجود ندارد.
چرا میانگین توزیع پواسون برابر با واریانس آن است؟
این از ساختار توزیع به عنوان حدی از توزیع دوجمله‌ای برای رویدادهای نادر ناشی می‌شود؛ این برابری همچنین یک بررسی عملی است، زیرا داده‌های شمارشی که واریانس آن‌ها به طور قابل توجهی از میانگین آن‌ها بیشتر است (فراپراکندگی)، ممکن است با یک مدل پواسون ساده مطابقت نداشته باشند.

Methods for this concept

Related concepts