การแจกแจงปกติ
การแจกแจงปกติ หรือที่เรียกว่าการแจกแจงแบบเกาส์เซียน (Gaussian distribution) หรือโค้งระฆังคว่ำ (bell curve) เป็นการแจกแจงต่อเนื่องที่มีความสมมาตรเกี่ยวกับค่าเฉลี่ย และสามารถอธิบายได้อย่างสมบูรณ์ด้วยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน เป็นการแจกแจงที่สำคัญที่สุดในชีวสถิติ เนื่องจากค่าการวัดจำนวนมากมีลักษณะใกล้เคียงกับการแจกแจงนี้ และเนื่องจากค่าเฉลี่ยของตัวอย่างมีแนวโน้มที่จะเข้าใกล้การแจกแจงนี้ ทำให้เป็นพื้นฐานของการอนุมานมาตรฐานส่วนใหญ่
Definition
การแจกแจงปกติเป็นการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่มีความหนาแน่นแบบสมมาตร รูปทรงระฆังคว่ำ ซึ่งกำหนดโดยพารามิเตอร์สองตัว ได้แก่ ค่าเฉลี่ย (จุดศูนย์กลาง) และส่วนเบี่ยงเบนมาตรฐาน (การกระจาย)
Scope
เนื้อหานี้ครอบคลุมถึงรูปร่างและพารามิเตอร์ของการแจกแจงปกติ กฎเชิงประจักษ์ที่เชื่อมโยงส่วนเบี่ยงเบนมาตรฐานกับการครอบคลุม การแจกแจงปกติมาตรฐานและค่า z-score ช่วงอ้างอิง และความแตกต่างระหว่างการแจกแจงปกติของแต่ละบุคคลกับการแจกแจงปกติของค่าเฉลี่ยตัวอย่าง เป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัยและไม่ได้ให้เกณฑ์ทางคลินิกสำหรับผู้ป่วยแต่ละราย
Core questions
- การแจกแจงปกติมีรูปร่างอย่างไรและอะไรเป็นตัวกำหนด?
- การแจกแจงส่วนใหญ่อยู่ภายในจำนวนส่วนเบี่ยงเบนมาตรฐานที่กำหนดเท่าใด?
- z-score คืออะไร และการทำให้เป็นมาตรฐานทำงานอย่างไร?
- เมื่อใดที่เหมาะสมที่จะสมมติภาวะปกติ?
Key concepts
- ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
- ความสมมาตรและรูปร่างระฆังคว่ำ
- กฎเชิงประจักษ์ (68-95-99.7)
- การแจกแจงปกติมาตรฐาน
- z-score และการทำให้เป็นมาตรฐาน
- ช่วงอ้างอิง
- ความเบ้และการเบี่ยงเบนจากภาวะปกติ
Mechanisms
การแจกแจงปกติถูกกำหนดโดยตัวเลขสองตัว: ค่าเฉลี่ย ซึ่งระบุตำแหน่งศูนย์กลาง และส่วนเบี่ยงเบนมาตรฐาน ซึ่งกำหนดความกว้าง โดยทั่วไปแล้ว ประมาณ 68% ของค่าจะอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ประมาณ 95% อยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน และประมาณ 99.7% อยู่ภายในสามส่วนเบี่ยงเบนมาตรฐาน ซึ่งเป็นกฎเชิงประจักษ์ที่ทำให้การแจกแจงนี้มีประโยชน์ในทางปฏิบัติ ตัวแปรปกติใดๆ สามารถทำให้เป็นมาตรฐานได้โดยการลบค่าเฉลี่ยและหารด้วยส่วนเบี่ยงเบนมาตรฐาน เพื่อให้ได้ค่า z-score ที่ตามการแจกแจงปกติมาตรฐาน (ค่าเฉลี่ย 0, ส่วนเบี่ยงเบนมาตรฐาน 1) ซึ่งช่วยให้ชุดตารางหรือสูตรเดียวสามารถใช้ได้กับการแจกแจงปกติทั้งหมด ในการวิจัยทางการแพทย์ ช่วงอ้างอิงสำหรับการวัดค่าต่างๆ เช่น ค่าเลือด มักจะสร้างขึ้นจาก 95% ตรงกลางของการแจกแจงปกติที่สมมติขึ้น และการทดสอบทางสถิติหลายอย่างสมมติว่าข้อมูลหรือการแจกแจงการสุ่มตัวอย่างของสถิติมีลักษณะใกล้เคียงปกติ
Clinical relevance
การวัดทางชีวภาพหลายอย่างถูกสรุปและเปรียบเทียบภายใต้สมมติฐานของภาวะปกติโดยประมาณ และช่วงอ้างอิงมักจะสร้างขึ้นจากสิ่งนี้ ดังนั้นการทำความเข้าใจการแจกแจงจึงช่วยในการตีความผลการทดลองและผลการศึกษา เนื้อหานี้อธิบายการแจกแจงในฐานะระเบียบวิธีวิจัยและไม่ได้กำหนดจุดตัดการวินิจฉัยสำหรับแต่ละบุคคล
History
เส้นโค้งระฆังคว่ำปรากฏขึ้นในศตวรรษที่สิบแปดจากการประมาณค่าของเดอ มัวฟวร์ (de Moivre) สำหรับการแจกแจงทวินาม และได้รับการพัฒนาโดยลาปลาซ (Laplace) และเกาส์ (Gauss) โดยเกาส์ใช้ในการวิเคราะห์ข้อผิดพลาดในการวัด ซึ่งเป็นเหตุผลที่มักเรียกว่าการแจกแจงแบบเกาส์เซียน ตลอดศตวรรษที่สิบเก้าและยี่สิบ มันได้กลายเป็นแบบจำลองเริ่มต้นสำหรับปริมาณทางชีวภาพที่วัดได้และเป็นรากฐานของการอนุมานทางสถิติแบบคลาสสิก
Debates
- การสมมติภาวะปกติทำให้เข้าใจผิดเมื่อใด?
- ตัวแปรทางชีวภาพหลายอย่างมีความเบ้มากกว่าสมมาตร และการถือว่าตัวแปรเหล่านั้นเป็นปกติอาจบิดเบือนช่วงอ้างอิงและการทดสอบ การตัดสินใจว่าจะแปลงข้อมูล ใช้วิธีการที่ไม่ขึ้นกับการแจกแจง หรืออาศัยทฤษฎีขีดจำกัดกลางสำหรับค่าเฉลี่ย เป็นการตัดสินใจทางระเบียบวิธีวิจัยที่เกิดขึ้นซ้ำๆ
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- กฎ 68-95-99.7 คืออะไร?
- สำหรับการแจกแจงปกติ ประมาณ 68% ของค่าจะอยู่ภายในหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ประมาณ 95% อยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน และประมาณ 99.7% อยู่ภายในสามส่วนเบี่ยงเบนมาตรฐาน กฎเชิงประจักษ์นี้เชื่อมโยงส่วนเบี่ยงเบนมาตรฐานโดยตรงกับสัดส่วนของค่าที่ครอบคลุม
- ข้อมูลจำเป็นต้องมีการแจกแจงปกติเพื่อใช้การแจกแจงปกติในการอนุมานหรือไม่?
- ไม่เสมอไป วิธีการหลายอย่างอาศัยการแจกแจงการสุ่มตัวอย่างของค่าเฉลี่ยที่มีลักษณะใกล้เคียงปกติโดยทฤษฎีขีดจำกัดกลาง ซึ่งสามารถใช้ได้แม้ว่าการวัดแต่ละรายการจะไม่มีการแจกแจงปกติก็ตาม หากขนาดตัวอย่างมีขนาดใหญ่พอ