การแจกแจงจากการสุ่มตัวอย่างและทฤษฎีขีดจำกัดกลาง
การแจกแจงจากการสุ่มตัวอย่าง (sampling distribution) คือการแจกแจงความน่าจะเป็นของค่าสถิติ เช่น ค่าเฉลี่ยของตัวอย่าง จากตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาดที่กำหนด ทฤษฎีขีดจำกัดกลาง (central limit theorem) ระบุว่า สำหรับตัวอย่างที่มีขนาดใหญ่พอ การแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยจะมีการแจกแจงแบบปกติโดยประมาณ โดยไม่คำนึงถึงรูปร่างของข้อมูลพื้นฐาน แนวคิดทั้งสองนี้ร่วมกันอธิบายว่าเหตุใดช่วงความเชื่อมั่นและการทดสอบที่อิงตามการแจกแจงแบบปกติจึงใช้งานได้อย่างกว้างขวาง
Definition
การแจกแจงจากการสุ่มตัวอย่างคือการแจกแจงของค่าที่ค่าสถิติจะได้รับจากตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาดคงที่จากประชากร ทฤษฎีขีดจำกัดกลางระบุว่าการแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยตัวอย่างจะเข้าใกล้การแจกแจงแบบปกติเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของประชากร
Scope
บทความนี้ครอบคลุมแนวคิดของการแจกแจงจากการสุ่มตัวอย่าง ค่าความคลาดเคลื่อนมาตรฐาน (standard error) ซึ่งเป็นค่าการกระจายของมัน ทฤษฎีขีดจำกัดกลางและบทบาทของขนาดตัวอย่าง และความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานของแต่ละบุคคลกับค่าความคลาดเคลื่อนมาตรฐานของค่าสถิติ บทความนี้เชื่อมโยงแนวคิดเหล่านี้เข้ากับช่วงความเชื่อมั่นและการทดสอบสมมติฐาน เป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัย ไม่ใช่คำแนะนำทางคลินิก
Core questions
- การแจกแจงจากการสุ่มตัวอย่างของค่าสถิติคืออะไร และเหตุใดจึงมีความสำคัญ?
- ค่าความคลาดเคลื่อนมาตรฐานแตกต่างจากส่วนเบี่ยงเบนมาตรฐานอย่างไร?
- ทฤษฎีขีดจำกัดกลางรับประกันอะไร และภายใต้เงื่อนไขใดบ้าง?
- ขนาดตัวอย่างส่งผลต่อความแม่นยำของค่าประมาณอย่างไร?
Key concepts
- ค่าสถิติเทียบกับพารามิเตอร์
- การแจกแจงจากการสุ่มตัวอย่าง
- ค่าความคลาดเคลื่อนมาตรฐาน
- ค่าความคลาดเคลื่อนมาตรฐานเทียบกับส่วนเบี่ยงเบนมาตรฐาน
- ขนาดตัวอย่างและความแม่นยำ
- การแจกแจงแบบปกติโดยประมาณของค่าเฉลี่ย
- พื้นฐานของช่วงความเชื่อมั่นและการทดสอบ
Key theories
- ทฤษฎีขีดจำกัดกลาง
- สำหรับการสังเกตการณ์ที่เป็นอิสระจากประชากรที่มีความแปรปรวนจำกัด การแจกแจงของค่าเฉลี่ยตัวอย่างมีแนวโน้มที่จะเข้าสู่การแจกแจงแบบปกติเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของประชากร สิ่งนี้เป็นเหตุผลสำหรับการอนุมานที่อิงตามการแจกแจงแบบปกติสำหรับค่าเฉลี่ย แม้ว่าการวัดแต่ละรายการจะไม่ได้มีการแจกแจงแบบปกติก็ตาม
Mechanisms
หากมีการสุ่มตัวอย่างซ้ำๆ ที่มีขนาดเท่ากันจากประชากร ค่าสถิติ เช่น ค่าเฉลี่ย จะแตกต่างกันไปในแต่ละตัวอย่าง การแจกแจงของค่าเหล่านั้นคือการแจกแจงจากการสุ่มตัวอย่าง และส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้คือค่าความคลาดเคลื่อนมาตรฐาน สำหรับค่าเฉลี่ยตัวอย่าง ค่าความคลาดเคลื่อนมาตรฐานจะเท่ากับส่วนเบี่ยงเบนมาตรฐานของประชากรหารด้วยรากที่สองของขนาดตัวอย่าง ดังนั้นความแม่นยำจึงเพิ่มขึ้นเมื่อขนาดตัวอย่างใหญ่ขึ้น แต่เพิ่มขึ้นเพียงแค่รากที่สองของ n ทฤษฎีขีดจำกัดกลางเพิ่มเติมว่า สำหรับตัวอย่างที่มีขนาดใหญ่พอ การแจกแจงจากการสุ่มตัวอย่างนี้จะมีการแจกแจงแบบปกติโดยประมาณ แม้ว่าข้อมูลเองจะมีการเบ้ก็ตาม โดยมีเงื่อนไขว่าการสังเกตการณ์เป็นอิสระต่อกันและความแปรปรวนมีค่าจำกัด นี่คือกลไกของการอนุมานแบบคลาสสิก: ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยถูกสร้างขึ้นโดยการขยายออกไปตามจำนวนค่าความคลาดเคลื่อนมาตรฐานจากค่าประมาณภายใต้การแจกแจงแบบปกติโดยประมาณ และการทดสอบสมมติฐานหลายอย่างเปรียบเทียบค่าประมาณกับค่าการแจกแจงจากการสุ่มตัวอย่างของมัน ค่าความคลาดเคลื่อนมาตรฐานซึ่งลดลงตามขนาดตัวอย่าง จะต้องแยกความแตกต่างจากส่วนเบี่ยงเบนมาตรฐานของการสังเกตการณ์แต่ละรายการ ซึ่งประมาณค่าการกระจายของประชากรและไม่ลดลง
Clinical relevance
ช่วงความเชื่อมั่นและค่า p ที่รายงานในการศึกษาทางคลินิกและสาธารณสุขขึ้นอยู่กับการแจกแจงจากการสุ่มตัวอย่างของค่าประมาณและทฤษฎีขีดจำกัดกลาง ดังนั้นการทำความเข้าใจสิ่งเหล่านี้จึงช่วยในการตัดสินความแม่นยำของผลกระทบที่รายงาน บทความนี้เป็นพื้นฐานทางระเบียบวิธีวิจัยและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกของแต่ละบุคคล
History
รูปแบบแรกของทฤษฎีขีดจำกัดกลางปรากฏในการประมาณค่าปกติของเดอมัวฟวร์สำหรับทวินาม และในงานของลาปลาซประมาณปี 1810 และเงื่อนไขทั่วไปที่เข้มงวดได้รับการจัดตั้งขึ้นโดยลยาปูนอฟและคนอื่นๆ ประมาณปี 1900 มุมมองของการแจกแจงจากการสุ่มตัวอย่างกลายเป็นหัวใจสำคัญของการอนุมานในช่วงต้นศตวรรษที่ยี่สิบ และยังคงเป็นเหตุผลมาตรฐานสำหรับช่วงความเชื่อมั่นและการทดสอบที่อิงตามการแจกแจงแบบปกติในชีวสถิติ
Debates
- ตัวอย่างต้องมีขนาดใหญ่เพียงใดจึงจะสามารถใช้ทฤษฎีขีดจำกัดกลางได้?
- การประมาณค่าจะดีขึ้นตามขนาดตัวอย่าง แต่ขนาดที่ใหญ่พอขึ้นอยู่กับว่าข้อมูลมีการเบ้มากน้อยเพียงใด สำหรับการแจกแจงที่มีการเบ้อย่างชัดเจน จำเป็นต้องมีตัวอย่างที่ใหญ่ขึ้นมากก่อนที่การแจกแจงของค่าเฉลี่ยจะมีการแจกแจงแบบปกติที่ยอมรับได้ ดังนั้นจึงไม่มีกฎเกณฑ์ทั่วไปที่ใช้ได้กับทุกกรณี
Key figures
- Pierre-Simon Laplace
- Abraham de Moivre
- Aleksandr Lyapunov
Related topics
Seminal works
- altman-bland-2005-se
- rosner-2015
Frequently asked questions
- ความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานและค่าความคลาดเคลื่อนมาตรฐานคืออะไร?
- ส่วนเบี่ยงเบนมาตรฐานวัดการกระจายของการสังเกตการณ์แต่ละรายการ ในขณะที่ค่าความคลาดเคลื่อนมาตรฐานวัดการกระจายของค่าสถิติ เช่น ค่าเฉลี่ยตัวอย่าง ในตัวอย่างต่างๆ ค่าความคลาดเคลื่อนมาตรฐานจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น ในขณะที่ส่วนเบี่ยงเบนมาตรฐานประมาณค่าปริมาณประชากรที่คงที่
- เหตุใดเราจึงสามารถใช้การแจกแจงแบบปกติสำหรับค่าเฉลี่ยได้ แม้ว่าข้อมูลจะมีการเบ้ก็ตาม?
- ทฤษฎีขีดจำกัดกลางระบุว่าการแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยจะมีการแจกแจงแบบปกติโดยประมาณเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของข้อมูล ดังนั้นวิธีการที่อิงตามการแจกแจงแบบปกติสำหรับค่าเฉลี่ยจึงมักจะใช้ได้กับตัวอย่างที่มีขนาดใหญ่พอ แม้ว่าค่าแต่ละรายการจะไม่ได้มีการแจกแจงแบบปกติก็ตาม