ความน่าจะเป็นและการแจกแจงความน่าจะเป็น
ความน่าจะเป็นคือภาษาสถิติสำหรับการหาปริมาณความไม่แน่นอน และการแจกแจงความน่าจะเป็นจะอธิบายว่าค่าที่เป็นไปได้ของตัวแปรสุ่มมีการกระจายตัวอย่างไร ทั้งสองสิ่งนี้รวมกันเป็นรากฐานทางทฤษฎีที่ใช้ในการอนุมานทางสถิติในสาขาวิทยาศาสตร์สุขภาพ: ช่วงความเชื่อมั่น, ค่า p-value, และการประมาณความเสี่ยง ล้วนแล้วแต่อยู่บนพื้นฐานของแบบจำลองความน่าจะเป็นที่อธิบายว่าข้อมูลเกิดขึ้นได้อย่างไร
Definition
ความน่าจะเป็นกำหนดตัวเลขระหว่าง 0 ถึง 1 ให้กับเหตุการณ์เพื่อแสดงความเป็นไปได้ของการเกิดเหตุการณ์นั้นๆ; การแจกแจงความน่าจะเป็นคือฟังก์ชันที่ระบุความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม
Scope
ส่วนนี้จะแนะนำผู้อ่านให้รู้จักกับแนวคิดหลักของความน่าจะเป็นและการแจกแจงที่ใช้บ่อยที่สุดในชีวสถิติ ครอบคลุมกฎพื้นฐานของความน่าจะเป็น, ความน่าจะเป็นแบบมีเงื่อนไขและความเป็นอิสระ, การแจกแจงปกติ, การแจกแจงทวินามและการแจกแจงปัวซงสำหรับการนับและเหตุการณ์, และการแจกแจงจากการสุ่มตัวอย่างที่เชื่อมโยงตัวอย่างกับประชากรผ่านทฤษฎีขีดจำกัดกลาง นี่คือภาพรวมเชิงการศึกษาอ้างอิงเกี่ยวกับระเบียบวิธี ไม่ใช่คำแนะนำทางคลินิก
Sub-topics
Core questions
- ความไม่แน่นอนถูกหาปริมาณอย่างไรเพื่อให้สามารถให้เหตุผลเกี่ยวกับข้อมูลได้อย่างเป็นทางการ?
- การแจกแจงแบบใดที่อธิบายการวัดหรือการนับประเภทที่กำหนด?
- พฤติกรรมของสถิติจากตัวอย่างมีความสัมพันธ์กับประชากรพื้นฐานอย่างไร?
- เหตุใดการแจกแจงปกติจึงเกิดขึ้นบ่อยครั้งในปริมาณรวม?
Key concepts
- ตัวแปรสุ่ม
- ปริภูมิของตัวอย่างและเหตุการณ์
- สัจพจน์ความน่าจะเป็น
- ความน่าจะเป็นแบบมีเงื่อนไขและความเป็นอิสระ
- การแจกแจงแบบไม่ต่อเนื่องและแบบต่อเนื่อง
- ค่าคาดหวังและความแปรปรวน
- การแจกแจงจากการสุ่มตัวอย่าง
- ทฤษฎีขีดจำกัดกลาง
Mechanisms
แบบจำลองความน่าจะเป็นจะระบุปริภูมิของตัวอย่าง (sample space) ของผลลัพธ์ที่เป็นไปได้ และกำหนดความน่าจะเป็นที่สอดคล้องกับสัจพจน์ (ไม่เป็นลบ, ความน่าจะเป็นรวมเป็นหนึ่ง, การบวกสำหรับเหตุการณ์ที่ไม่เกิดร่วมกัน) ตัวแปรสุ่มจะจับคู่ผลลัพธ์กับตัวเลข และการแจกแจงของตัวแปรสุ่มจะสรุปความน่าจะเป็นของตัวเลขเหล่านั้น ซึ่งมีลักษณะเฉพาะด้วยปริมาณต่างๆ เช่น ค่าเฉลี่ย (ค่าคาดหวัง) และความแปรปรวน การแจกแจงแบบไม่ต่อเนื่อง เช่น การแจกแจงทวินามและปัวซง ใช้จำลองการนับเหตุการณ์; การแจกแจงปกติแบบต่อเนื่องใช้จำลองปริมาณที่วัดได้หลายอย่าง และผ่านทฤษฎีขีดจำกัดกลาง จะประมาณการแจกแจงของผลรวมและค่าเฉลี่ย สถิติเชิงอนุมานทำงานโดยการพิจารณาสถิติที่สังเกตได้ว่าเป็นค่าที่สุ่มมาจาก การแจกแจงจากการสุ่มตัวอย่าง (sampling distribution) ของมัน
Clinical relevance
การแจกแจงความน่าจะเป็นเป็นรากฐานของวิธีการทางสถิติที่ใช้ในการสรุปข้อมูลสุขภาพและในการอนุมานจากการศึกษา ดังนั้นการทำความเข้าใจสิ่งเหล่านี้จึงช่วยสนับสนุนการอ่านวรรณกรรมเชิงปริมาณอย่างมีวิจารณญาณ บทความนี้อธิบายถึงรากฐานทางระเบียบวิธีของการวิเคราะห์ดังกล่าว และไม่ใช่พื้นฐานสำหรับการตัดสินใจในการวินิจฉัยหรือการรักษาเฉพาะบุคคล
History
ความน่าจะเป็นทางคณิตศาสตร์พัฒนามาจากการวิเคราะห์เกมแห่งโอกาสในศตวรรษที่สิบเจ็ด และได้รับการพัฒนาโดย Bernoulli, Laplace, Gauss และ Poisson ให้เป็นทฤษฎีทั่วไปของการแจกแจง การกำหนดสัจพจน์ของ Kolmogorov ในทศวรรษ 1930 ทำให้ความน่าจะเป็นมีรากฐานที่เข้มงวด ตลอดศตวรรษที่ยี่สิบ เครื่องมือเหล่านี้ได้กลายเป็นพื้นฐานของการอนุมานทางสถิติ และชีวสถิติได้นำมาใช้เพื่อจำลองการวัดและการนับในการวิจัยทางการแพทย์และสาธารณสุข
Key figures
- Pierre-Simon Laplace
- Carl Friedrich Gauss
- Siméon Denis Poisson
- Jacob Bernoulli
- Andrey Kolmogorov
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
- ross-2014
Frequently asked questions
- เหตุใดหลักสูตรชีวสถิติจึงใช้เวลามากกับการแจกแจงความน่าจะเป็น?
- เนื่องจากการอนุมานทางสถิติทำงานโดยการเปรียบเทียบข้อมูลที่สังเกตได้กับสิ่งที่แบบจำลองความน่าจะเป็นคาดการณ์ไว้; การแจกแจงเป็นสะพานเชื่อมระหว่างตัวอย่างกับข้อความเกี่ยวกับประชากร ดังนั้นความถูกต้องของช่วงความเชื่อมั่นและการทดสอบจึงขึ้นอยู่กับการเลือกการแจกแจงที่เหมาะสม
- ความแตกต่างระหว่างความน่าจะเป็นและการแจกแจงความน่าจะเป็นคืออะไร?
- ความน่าจะเป็นคือตัวเลขเดียวที่อธิบายความเป็นไปได้ของการเกิดเหตุการณ์หนึ่งๆ ในขณะที่การแจกแจงความน่าจะเป็นจะระบุความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มในคราวเดียว