เหตุใดหลักสูตรชีวสถิติจึงใช้เวลามากกับการแจกแจงความน่าจะเป็น?

เนื่องจากการอนุมานทางสถิติทำงานโดยการเปรียบเทียบข้อมูลที่สังเกตได้กับสิ่งที่แบบจำลองความน่าจะเป็นคาดการณ์ไว้; การแจกแจงเป็นสะพานเชื่อมระหว่างตัวอย่างกับข้อความเกี่ยวกับประชากร ดังนั้นความถูกต้องของช่วงความเชื่อมั่นและการทดสอบจึงขึ้นอยู่กับการเลือกการแจกแจงที่เหมาะสม

ความแตกต่างระหว่างความน่าจะเป็นและการแจกแจงความน่าจะเป็นคืออะไร?

ความน่าจะเป็นคือตัวเลขเดียวที่อธิบายความเป็นไปได้ของการเกิดเหตุการณ์หนึ่งๆ ในขณะที่การแจกแจงความน่าจะเป็นจะระบุความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มในคราวเดียว

ความน่าจะเป็นและการแจกแจงความน่าจะเป็น

ความน่าจะเป็นคือภาษาสถิติสำหรับการหาปริมาณความไม่แน่นอน และการแจกแจงความน่าจะเป็นจะอธิบายว่าค่าที่เป็นไปได้ของตัวแปรสุ่มมีการกระจายตัวอย่างไร ทั้งสองสิ่งนี้รวมกันเป็นรากฐานทางทฤษฎีที่ใช้ในการอนุมานทางสถิติในสาขาวิทยาศาสตร์สุขภาพ: ช่วงความเชื่อมั่น, ค่า p-value, และการประมาณความเสี่ยง ล้วนแล้วแต่อยู่บนพื้นฐานของแบบจำลองความน่าจะเป็นที่อธิบายว่าข้อมูลเกิดขึ้นได้อย่างไร

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

ความน่าจะเป็นกำหนดตัวเลขระหว่าง 0 ถึง 1 ให้กับเหตุการณ์เพื่อแสดงความเป็นไปได้ของการเกิดเหตุการณ์นั้นๆ; การแจกแจงความน่าจะเป็นคือฟังก์ชันที่ระบุความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่ม

Scope

ส่วนนี้จะแนะนำผู้อ่านให้รู้จักกับแนวคิดหลักของความน่าจะเป็นและการแจกแจงที่ใช้บ่อยที่สุดในชีวสถิติ ครอบคลุมกฎพื้นฐานของความน่าจะเป็น, ความน่าจะเป็นแบบมีเงื่อนไขและความเป็นอิสระ, การแจกแจงปกติ, การแจกแจงทวินามและการแจกแจงปัวซงสำหรับการนับและเหตุการณ์, และการแจกแจงจากการสุ่มตัวอย่างที่เชื่อมโยงตัวอย่างกับประชากรผ่านทฤษฎีขีดจำกัดกลาง นี่คือภาพรวมเชิงการศึกษาอ้างอิงเกี่ยวกับระเบียบวิธี ไม่ใช่คำแนะนำทางคลินิก

Sub-topics

Core questions

ความไม่แน่นอนถูกหาปริมาณอย่างไรเพื่อให้สามารถให้เหตุผลเกี่ยวกับข้อมูลได้อย่างเป็นทางการ?
การแจกแจงแบบใดที่อธิบายการวัดหรือการนับประเภทที่กำหนด?
พฤติกรรมของสถิติจากตัวอย่างมีความสัมพันธ์กับประชากรพื้นฐานอย่างไร?
เหตุใดการแจกแจงปกติจึงเกิดขึ้นบ่อยครั้งในปริมาณรวม?

Key concepts

ตัวแปรสุ่ม
ปริภูมิของตัวอย่างและเหตุการณ์
สัจพจน์ความน่าจะเป็น
ความน่าจะเป็นแบบมีเงื่อนไขและความเป็นอิสระ
การแจกแจงแบบไม่ต่อเนื่องและแบบต่อเนื่อง
ค่าคาดหวังและความแปรปรวน
การแจกแจงจากการสุ่มตัวอย่าง
ทฤษฎีขีดจำกัดกลาง

Mechanisms

แบบจำลองความน่าจะเป็นจะระบุปริภูมิของตัวอย่าง (sample space) ของผลลัพธ์ที่เป็นไปได้ และกำหนดความน่าจะเป็นที่สอดคล้องกับสัจพจน์ (ไม่เป็นลบ, ความน่าจะเป็นรวมเป็นหนึ่ง, การบวกสำหรับเหตุการณ์ที่ไม่เกิดร่วมกัน) ตัวแปรสุ่มจะจับคู่ผลลัพธ์กับตัวเลข และการแจกแจงของตัวแปรสุ่มจะสรุปความน่าจะเป็นของตัวเลขเหล่านั้น ซึ่งมีลักษณะเฉพาะด้วยปริมาณต่างๆ เช่น ค่าเฉลี่ย (ค่าคาดหวัง) และความแปรปรวน การแจกแจงแบบไม่ต่อเนื่อง เช่น การแจกแจงทวินามและปัวซง ใช้จำลองการนับเหตุการณ์; การแจกแจงปกติแบบต่อเนื่องใช้จำลองปริมาณที่วัดได้หลายอย่าง และผ่านทฤษฎีขีดจำกัดกลาง จะประมาณการแจกแจงของผลรวมและค่าเฉลี่ย สถิติเชิงอนุมานทำงานโดยการพิจารณาสถิติที่สังเกตได้ว่าเป็นค่าที่สุ่มมาจาก การแจกแจงจากการสุ่มตัวอย่าง (sampling distribution) ของมัน

Clinical relevance

การแจกแจงความน่าจะเป็นเป็นรากฐานของวิธีการทางสถิติที่ใช้ในการสรุปข้อมูลสุขภาพและในการอนุมานจากการศึกษา ดังนั้นการทำความเข้าใจสิ่งเหล่านี้จึงช่วยสนับสนุนการอ่านวรรณกรรมเชิงปริมาณอย่างมีวิจารณญาณ บทความนี้อธิบายถึงรากฐานทางระเบียบวิธีของการวิเคราะห์ดังกล่าว และไม่ใช่พื้นฐานสำหรับการตัดสินใจในการวินิจฉัยหรือการรักษาเฉพาะบุคคล

History

ความน่าจะเป็นทางคณิตศาสตร์พัฒนามาจากการวิเคราะห์เกมแห่งโอกาสในศตวรรษที่สิบเจ็ด และได้รับการพัฒนาโดย Bernoulli, Laplace, Gauss และ Poisson ให้เป็นทฤษฎีทั่วไปของการแจกแจง การกำหนดสัจพจน์ของ Kolmogorov ในทศวรรษ 1930 ทำให้ความน่าจะเป็นมีรากฐานที่เข้มงวด ตลอดศตวรรษที่ยี่สิบ เครื่องมือเหล่านี้ได้กลายเป็นพื้นฐานของการอนุมานทางสถิติ และชีวสถิติได้นำมาใช้เพื่อจำลองการวัดและการนับในการวิจัยทางการแพทย์และสาธารณสุข

Key figures

Pierre-Simon Laplace
Carl Friedrich Gauss
Siméon Denis Poisson
Jacob Bernoulli
Andrey Kolmogorov

Seminal works

altman-bland-1995-normal
rosner-2015
ross-2014

Frequently asked questions

เหตุใดหลักสูตรชีวสถิติจึงใช้เวลามากกับการแจกแจงความน่าจะเป็น?: เนื่องจากการอนุมานทางสถิติทำงานโดยการเปรียบเทียบข้อมูลที่สังเกตได้กับสิ่งที่แบบจำลองความน่าจะเป็นคาดการณ์ไว้; การแจกแจงเป็นสะพานเชื่อมระหว่างตัวอย่างกับข้อความเกี่ยวกับประชากร ดังนั้นความถูกต้องของช่วงความเชื่อมั่นและการทดสอบจึงขึ้นอยู่กับการเลือกการแจกแจงที่เหมาะสม
ความแตกต่างระหว่างความน่าจะเป็นและการแจกแจงความน่าจะเป็นคืออะไร?: ความน่าจะเป็นคือตัวเลขเดียวที่อธิบายความเป็นไปได้ของการเกิดเหตุการณ์หนึ่งๆ ในขณะที่การแจกแจงความน่าจะเป็นจะระบุความน่าจะเป็นของค่าที่เป็นไปได้ทั้งหมดของตัวแปรสุ่มในคราวเดียว