การแจกแจงแบบทวินามและการแจกแจงแบบปัวซง
การแจกแจงแบบทวินามและการแจกแจงแบบปัวซงเป็นการแจกแจงแบบไม่ต่อเนื่องสองแบบที่ใช้บ่อยที่สุดในชีวสถิติ การแจกแจงแบบทวินามอธิบายจำนวนความสำเร็จในการทดลองแบบใช่/ไม่ใช่ที่เป็นอิสระต่อกันจำนวนหนึ่ง ในขณะที่การแจกแจงแบบปัวซงอธิบายจำนวนเหตุการณ์ที่เกิดขึ้นในช่วงเวลาหรือพื้นที่ที่กำหนด เมื่อเหตุการณ์เกิดขึ้นด้วยอัตราเฉลี่ยคงที่ ทั้งสองแบบจำลองจำนวนนับ ซึ่งพบได้ทั่วไปในข้อมูลสุขภาพ
Definition
การแจกแจงแบบทวินามให้ความน่าจะเป็นของการได้จำนวนความสำเร็จที่กำหนดในการทดลองอิสระ n ครั้ง โดยแต่ละครั้งมีความน่าจะเป็นของความสำเร็จ p; การแจกแจงแบบปัวซงให้ความน่าจะเป็นของจำนวนเหตุการณ์ที่กำหนดในช่วงเวลาที่กำหนด เมื่อเหตุการณ์เกิดขึ้นอย่างอิสระด้วยอัตราเฉลี่ยคงที่
Scope
เนื้อหานี้ครอบคลุมสมมติฐาน พารามิเตอร์ ค่าเฉลี่ย และความแปรปรวนของการแจกแจงแบบทวินามและปัวซง สถานการณ์ที่แต่ละแบบอธิบาย ความสัมพันธ์ระหว่างกัน และการประมาณค่าด้วยการแจกแจงปกติ เนื้อหาจะแสดงให้เห็นถึงการใช้งานสำหรับการวิเคราะห์สัดส่วนและอัตราการเกิดเหตุการณ์ในการวิจัยด้านสุขภาพ เป็นการอ้างอิงเชิงระเบียบวิธีวิจัย ไม่ใช่คำแนะนำทางคลินิก
Core questions
- สมมติฐานใดที่กำหนดสถานการณ์แบบทวินามเทียบกับสถานการณ์แบบปัวซง?
- ค่าเฉลี่ยและความแปรปรวนของการแจกแจงแต่ละแบบถูกกำหนดอย่างไร?
- เมื่อใดที่การแจกแจงแบบปัวซงประมาณการแจกแจงแบบทวินามได้?
- เมื่อใดที่แต่ละแบบสามารถประมาณได้ด้วยการแจกแจงปกติ?
Key concepts
- การทดลองแบร์นูลลี
- จำนวนครั้งที่ทดลอง n และความน่าจะเป็นของความสำเร็จ p
- ค่าเฉลี่ยและความแปรปรวนแบบทวินาม
- พารามิเตอร์อัตราแบบปัวซง
- ความเท่ากันของค่าเฉลี่ยและความแปรปรวนแบบปัวซง
- การประมาณค่าแบบปัวซงสำหรับทวินาม
- การประมาณค่าด้วยการแจกแจงปกติ
- จำนวนนับ สัดส่วน และอัตราการเกิดเหตุการณ์
Mechanisms
การแจกแจงแบบทวินามเกิดขึ้นจากการทดลองอิสระ n ครั้ง โดยแต่ละครั้งเป็นการทดลองแบบแบร์นูลลีที่มีความน่าจะเป็นของความสำเร็จ p เท่ากัน จำนวนความสำเร็จมีค่าเฉลี่ย np และความแปรปรวน np(1-p) การแจกแจงแบบปัวซงเกิดขึ้นเป็นลิมิตของการแจกแจงแบบทวินามเมื่อ n มีค่ามากและ p มีค่าน้อย ในขณะที่ผลคูณของทั้งสอง (จำนวนที่คาดหวัง) ยังคงอยู่ในระดับปานกลาง ดังนั้นจึงเป็นแบบจำลองสำหรับเหตุการณ์ที่หายากเมื่อมีโอกาสจำนวนมาก มีพารามิเตอร์เดียวที่เท่ากับทั้งค่าเฉลี่ยและความแปรปรวน ซึ่งสะท้อนถึงเหตุการณ์ที่เกิดขึ้นในอัตราคงที่ เมื่อ n มีค่ามาก หรือเมื่อค่าเฉลี่ยของปัวซงมีค่ามาก การแจกแจงทั้งสองสามารถประมาณได้ด้วยการแจกแจงปกติ ซึ่งเป็นเหตุผลว่าทำไมวิธีการสำหรับสัดส่วนและอัตราจึงมักใช้ช่วงความเชื่อมั่นและการทดสอบที่อิงกับการแจกแจงปกติ ในการวิจัยด้านสุขภาพ การแจกแจงแบบทวินามเป็นพื้นฐานของการวิเคราะห์สัดส่วน เช่น จำนวนผู้ป่วยที่ตอบสนองต่อการรักษา ในขณะที่การแจกแจงแบบปัวซงเป็นพื้นฐานของจำนวนนับและอัตราอุบัติการณ์ เช่น จำนวนผู้ป่วยรายใหม่ในประชากรในช่วงเวลาหนึ่ง
Clinical relevance
แบบจำลองทวินามและปัวซงเป็นพื้นฐานของการวิเคราะห์สัดส่วนและอัตราการเกิดเหตุการณ์ที่รายงานตลอดเอกสารทางการแพทย์ ดังนั้นการตระหนักว่าแบบจำลองใดเหมาะสมจะช่วยในการอ่านผลลัพธ์เกี่ยวกับอัตราการตอบสนองและอุบัติการณ์ของโรคได้อย่างมีวิจารณญาณ เนื้อหานี้เป็นเชิงระเบียบวิธีวิจัยและไม่ได้ให้คำแนะนำในการดูแลผู้ป่วยแต่ละราย
Epidemiology
การแจกแจงแบบปัวซงเป็นแบบจำลองธรรมชาติสำหรับจำนวนเหตุการณ์ที่ค่อนข้างหายากที่สะสมในช่วงเวลาบุคคล-เวลา (person-time) ดังนั้นจึงเป็นพื้นฐานสำคัญสำหรับการวิเคราะห์อัตราอุบัติการณ์ในระบาดวิทยา การแจกแจงแบบทวินามเป็นพื้นฐานของการวิเคราะห์ความเสี่ยงและสัดส่วน เช่น อุบัติการณ์สะสมในกลุ่มปิด
History
การแจกแจงแบบทวินามได้รับการศึกษาโดย Jacob Bernoulli ในการวิเคราะห์การทดลองซ้ำๆ ของเขาที่ตีพิมพ์ในปี 1713 และ de Moivre ได้พัฒนาการประมาณค่าด้วยการแจกแจงปกติในภายหลัง Siméon Denis Poisson ได้นำเสนอการแจกแจงที่ใช้ชื่อของเขาในปี 1837 ในฐานะลิมิตของการแจกแจงแบบทวินามสำหรับเหตุการณ์ที่หายาก ทั้งสองกลายเป็นเครื่องมือมาตรฐานสำหรับการสร้างแบบจำลองจำนวนนับเมื่อมีการนำสถิติมาประยุกต์ใช้กับการแพทย์และสาธารณสุข
Key figures
- Jacob Bernoulli
- Siméon Denis Poisson
- Abraham de Moivre
Related topics
Seminal works
- rosner-2015
- armitage-2002
- ross-2014
Frequently asked questions
- ฉันจะรู้ได้อย่างไรว่าจะใช้แบบจำลองทวินามหรือแบบจำลองปัวซง?
- ใช้แบบจำลองทวินามเมื่อมีจำนวนการทดลองแบบใช่/ไม่ใช่ที่เป็นอิสระต่อกันที่แน่นอน และคุณนับความสำเร็จ; ใช้แบบจำลองปัวซงเมื่อคุณนับเหตุการณ์ที่เกิดขึ้นในช่วงเวลาหรือพื้นที่ต่อเนื่องด้วยอัตราที่ค่อนข้างคงที่ โดยไม่มีจำนวนการทดลองที่แน่นอน
- ทำไมค่าเฉลี่ยของการแจกแจงแบบปัวซงจึงเท่ากับความแปรปรวน?
- เป็นผลมาจากโครงสร้างของการแจกแจงในฐานะลิมิตของทวินามสำหรับเหตุการณ์ที่หายาก ความเท่ากันนี้ยังเป็นการตรวจสอบในทางปฏิบัติด้วย เนื่องจากข้อมูลจำนวนนับที่มีความแปรปรวนเกินค่าเฉลี่ยอย่างมาก (overdispersion) อาจไม่เหมาะสมกับแบบจำลองปัวซงแบบง่าย