ความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานและค่าความคลาดเคลื่อนมาตรฐานคืออะไร?

ส่วนเบี่ยงเบนมาตรฐานวัดการกระจายของการสังเกตการณ์แต่ละรายการ ในขณะที่ค่าความคลาดเคลื่อนมาตรฐานวัดการกระจายของค่าสถิติ เช่น ค่าเฉลี่ยตัวอย่าง ในตัวอย่างต่างๆ ค่าความคลาดเคลื่อนมาตรฐานจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น ในขณะที่ส่วนเบี่ยงเบนมาตรฐานประมาณค่าปริมาณประชากรที่คงที่

เหตุใดเราจึงสามารถใช้การแจกแจงแบบปกติสำหรับค่าเฉลี่ยได้ แม้ว่าข้อมูลจะมีการเบ้ก็ตาม?

ทฤษฎีขีดจำกัดกลางระบุว่าการแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยจะมีการแจกแจงแบบปกติโดยประมาณเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของข้อมูล ดังนั้นวิธีการที่อิงตามการแจกแจงแบบปกติสำหรับค่าเฉลี่ยจึงมักจะใช้ได้กับตัวอย่างที่มีขนาดใหญ่พอ แม้ว่าค่าแต่ละรายการจะไม่ได้มีการแจกแจงแบบปกติก็ตาม

การแจกแจงจากการสุ่มตัวอย่างและทฤษฎีขีดจำกัดกลาง

การแจกแจงจากการสุ่มตัวอย่าง (sampling distribution) คือการแจกแจงความน่าจะเป็นของค่าสถิติ เช่น ค่าเฉลี่ยของตัวอย่าง จากตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาดที่กำหนด ทฤษฎีขีดจำกัดกลาง (central limit theorem) ระบุว่า สำหรับตัวอย่างที่มีขนาดใหญ่พอ การแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยจะมีการแจกแจงแบบปกติโดยประมาณ โดยไม่คำนึงถึงรูปร่างของข้อมูลพื้นฐาน แนวคิดทั้งสองนี้ร่วมกันอธิบายว่าเหตุใดช่วงความเชื่อมั่นและการทดสอบที่อิงตามการแจกแจงแบบปกติจึงใช้งานได้อย่างกว้างขวาง

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การแจกแจงจากการสุ่มตัวอย่างคือการแจกแจงของค่าที่ค่าสถิติจะได้รับจากตัวอย่างที่เป็นไปได้ทั้งหมดที่มีขนาดคงที่จากประชากร ทฤษฎีขีดจำกัดกลางระบุว่าการแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยตัวอย่างจะเข้าใกล้การแจกแจงแบบปกติเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของประชากร

Scope

บทความนี้ครอบคลุมแนวคิดของการแจกแจงจากการสุ่มตัวอย่าง ค่าความคลาดเคลื่อนมาตรฐาน (standard error) ซึ่งเป็นค่าการกระจายของมัน ทฤษฎีขีดจำกัดกลางและบทบาทของขนาดตัวอย่าง และความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานของแต่ละบุคคลกับค่าความคลาดเคลื่อนมาตรฐานของค่าสถิติ บทความนี้เชื่อมโยงแนวคิดเหล่านี้เข้ากับช่วงความเชื่อมั่นและการทดสอบสมมติฐาน เป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัย ไม่ใช่คำแนะนำทางคลินิก

Core questions

การแจกแจงจากการสุ่มตัวอย่างของค่าสถิติคืออะไร และเหตุใดจึงมีความสำคัญ?
ค่าความคลาดเคลื่อนมาตรฐานแตกต่างจากส่วนเบี่ยงเบนมาตรฐานอย่างไร?
ทฤษฎีขีดจำกัดกลางรับประกันอะไร และภายใต้เงื่อนไขใดบ้าง?
ขนาดตัวอย่างส่งผลต่อความแม่นยำของค่าประมาณอย่างไร?

Key concepts

ค่าสถิติเทียบกับพารามิเตอร์
การแจกแจงจากการสุ่มตัวอย่าง
ค่าความคลาดเคลื่อนมาตรฐาน
ค่าความคลาดเคลื่อนมาตรฐานเทียบกับส่วนเบี่ยงเบนมาตรฐาน
ขนาดตัวอย่างและความแม่นยำ
การแจกแจงแบบปกติโดยประมาณของค่าเฉลี่ย
พื้นฐานของช่วงความเชื่อมั่นและการทดสอบ

Key theories

ทฤษฎีขีดจำกัดกลาง: สำหรับการสังเกตการณ์ที่เป็นอิสระจากประชากรที่มีความแปรปรวนจำกัด การแจกแจงของค่าเฉลี่ยตัวอย่างมีแนวโน้มที่จะเข้าสู่การแจกแจงแบบปกติเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของประชากร สิ่งนี้เป็นเหตุผลสำหรับการอนุมานที่อิงตามการแจกแจงแบบปกติสำหรับค่าเฉลี่ย แม้ว่าการวัดแต่ละรายการจะไม่ได้มีการแจกแจงแบบปกติก็ตาม

Mechanisms

หากมีการสุ่มตัวอย่างซ้ำๆ ที่มีขนาดเท่ากันจากประชากร ค่าสถิติ เช่น ค่าเฉลี่ย จะแตกต่างกันไปในแต่ละตัวอย่าง การแจกแจงของค่าเหล่านั้นคือการแจกแจงจากการสุ่มตัวอย่าง และส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้คือค่าความคลาดเคลื่อนมาตรฐาน สำหรับค่าเฉลี่ยตัวอย่าง ค่าความคลาดเคลื่อนมาตรฐานจะเท่ากับส่วนเบี่ยงเบนมาตรฐานของประชากรหารด้วยรากที่สองของขนาดตัวอย่าง ดังนั้นความแม่นยำจึงเพิ่มขึ้นเมื่อขนาดตัวอย่างใหญ่ขึ้น แต่เพิ่มขึ้นเพียงแค่รากที่สองของ n ทฤษฎีขีดจำกัดกลางเพิ่มเติมว่า สำหรับตัวอย่างที่มีขนาดใหญ่พอ การแจกแจงจากการสุ่มตัวอย่างนี้จะมีการแจกแจงแบบปกติโดยประมาณ แม้ว่าข้อมูลเองจะมีการเบ้ก็ตาม โดยมีเงื่อนไขว่าการสังเกตการณ์เป็นอิสระต่อกันและความแปรปรวนมีค่าจำกัด นี่คือกลไกของการอนุมานแบบคลาสสิก: ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยถูกสร้างขึ้นโดยการขยายออกไปตามจำนวนค่าความคลาดเคลื่อนมาตรฐานจากค่าประมาณภายใต้การแจกแจงแบบปกติโดยประมาณ และการทดสอบสมมติฐานหลายอย่างเปรียบเทียบค่าประมาณกับค่าการแจกแจงจากการสุ่มตัวอย่างของมัน ค่าความคลาดเคลื่อนมาตรฐานซึ่งลดลงตามขนาดตัวอย่าง จะต้องแยกความแตกต่างจากส่วนเบี่ยงเบนมาตรฐานของการสังเกตการณ์แต่ละรายการ ซึ่งประมาณค่าการกระจายของประชากรและไม่ลดลง

Clinical relevance

ช่วงความเชื่อมั่นและค่า p ที่รายงานในการศึกษาทางคลินิกและสาธารณสุขขึ้นอยู่กับการแจกแจงจากการสุ่มตัวอย่างของค่าประมาณและทฤษฎีขีดจำกัดกลาง ดังนั้นการทำความเข้าใจสิ่งเหล่านี้จึงช่วยในการตัดสินความแม่นยำของผลกระทบที่รายงาน บทความนี้เป็นพื้นฐานทางระเบียบวิธีวิจัยและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกของแต่ละบุคคล

History

รูปแบบแรกของทฤษฎีขีดจำกัดกลางปรากฏในการประมาณค่าปกติของเดอมัวฟวร์สำหรับทวินาม และในงานของลาปลาซประมาณปี 1810 และเงื่อนไขทั่วไปที่เข้มงวดได้รับการจัดตั้งขึ้นโดยลยาปูนอฟและคนอื่นๆ ประมาณปี 1900 มุมมองของการแจกแจงจากการสุ่มตัวอย่างกลายเป็นหัวใจสำคัญของการอนุมานในช่วงต้นศตวรรษที่ยี่สิบ และยังคงเป็นเหตุผลมาตรฐานสำหรับช่วงความเชื่อมั่นและการทดสอบที่อิงตามการแจกแจงแบบปกติในชีวสถิติ

Debates

ตัวอย่างต้องมีขนาดใหญ่เพียงใดจึงจะสามารถใช้ทฤษฎีขีดจำกัดกลางได้?: การประมาณค่าจะดีขึ้นตามขนาดตัวอย่าง แต่ขนาดที่ใหญ่พอขึ้นอยู่กับว่าข้อมูลมีการเบ้มากน้อยเพียงใด สำหรับการแจกแจงที่มีการเบ้อย่างชัดเจน จำเป็นต้องมีตัวอย่างที่ใหญ่ขึ้นมากก่อนที่การแจกแจงของค่าเฉลี่ยจะมีการแจกแจงแบบปกติที่ยอมรับได้ ดังนั้นจึงไม่มีกฎเกณฑ์ทั่วไปที่ใช้ได้กับทุกกรณี

Key figures

Pierre-Simon Laplace
Abraham de Moivre
Aleksandr Lyapunov

Seminal works

altman-bland-2005-se
rosner-2015

Frequently asked questions

ความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานและค่าความคลาดเคลื่อนมาตรฐานคืออะไร?: ส่วนเบี่ยงเบนมาตรฐานวัดการกระจายของการสังเกตการณ์แต่ละรายการ ในขณะที่ค่าความคลาดเคลื่อนมาตรฐานวัดการกระจายของค่าสถิติ เช่น ค่าเฉลี่ยตัวอย่าง ในตัวอย่างต่างๆ ค่าความคลาดเคลื่อนมาตรฐานจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น ในขณะที่ส่วนเบี่ยงเบนมาตรฐานประมาณค่าปริมาณประชากรที่คงที่
เหตุใดเราจึงสามารถใช้การแจกแจงแบบปกติสำหรับค่าเฉลี่ยได้ แม้ว่าข้อมูลจะมีการเบ้ก็ตาม?: ทฤษฎีขีดจำกัดกลางระบุว่าการแจกแจงจากการสุ่มตัวอย่างของค่าเฉลี่ยจะมีการแจกแจงแบบปกติโดยประมาณเมื่อขนาดตัวอย่างเพิ่มขึ้น โดยไม่คำนึงถึงรูปร่างของข้อมูล ดังนั้นวิธีการที่อิงตามการแจกแจงแบบปกติสำหรับค่าเฉลี่ยจึงมักจะใช้ได้กับตัวอย่างที่มีขนาดใหญ่พอ แม้ว่าค่าแต่ละรายการจะไม่ได้มีการแจกแจงแบบปกติก็ตาม