ช่วงความเชื่อมั่น 95% หมายความว่ามีโอกาส 95% ที่ค่าจริงจะอยู่ภายในช่วงนั้นหรือไม่?

ไม่ ภายใต้คำจำกัดความแบบ Frequentist ค่าจริงนั้นคงที่ และ 95% หมายถึงสัดส่วนระยะยาวของช่วงดังกล่าวที่สร้างขึ้นในลักษณะเดียวกันจากการสุ่มตัวอย่างซ้ำๆ ซึ่งจะครอบคลุมค่าจริงนั้น — ไม่ใช่ความน่าจะเป็นสำหรับช่วงใดช่วงหนึ่งโดยเฉพาะ

อะไรทำให้ช่วงความเชื่อมั่นแคบหรือกว้าง?

ส่วนใหญ่คือขนาดตัวอย่างและความแปรปรวน: ตัวอย่างที่ใหญ่ขึ้นและข้อมูลที่มีความแปรปรวนน้อยลงจะให้ช่วงที่แคบและแม่นยำกว่า ในขณะที่การศึกษาขนาดเล็กหรือมีข้อมูลรบกวนจะสร้างช่วงที่กว้างซึ่งบ่งบอกถึงความไม่แน่นอน

ช่วงความเชื่อมั่น

ช่วงความเชื่อมั่นคือช่วงของค่าที่เป็นไปได้สำหรับปริมาณประชากรที่ไม่ทราบค่า ซึ่งคำนวณจากข้อมูลตัวอย่างเพื่อให้กระบวนการที่ใช้ในการสร้างช่วงนั้นสามารถครอบคลุมค่าจริงได้ตามสัดส่วนที่กำหนดไว้ — โดยทั่วไปคือ 95% — ในการสุ่มตัวอย่างซ้ำๆ ช่วงความเชื่อมั่นแสดงทั้งขนาดของการประมาณค่าและความไม่แน่นอนรอบๆ ค่าประมาณนั้นในรูปแบบสรุปเดียวที่ได้รับการรายงานอย่างแพร่หลาย และได้กลายเป็นวิธีที่นิยมในการนำเสนอค่าประมาณผลกระทบในสาขาวิทยาศาสตร์สุขภาพ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

ช่วงความเชื่อมั่นคือช่วงที่คำนวณจากข้อมูลตัวอย่างโดยวิธีที่กำหนด ณ ระดับความเชื่อมั่นที่ระบุ โดยที่วิธีดังกล่าวจะครอบคลุมพารามิเตอร์ประชากรที่แท้จริงในสัดส่วนที่ระบุของการสุ่มตัวอย่างซ้ำๆ ในเชิงสมมติฐาน

Scope

หัวข้อนี้อธิบายว่าช่วงความเชื่อมั่นคืออะไร ควรตีความระดับความเชื่อมั่นอย่างไร ความกว้างของช่วงสะท้อนความแม่นยำและขนาดตัวอย่างอย่างไร และความเข้าใจผิดที่พบบ่อยเกี่ยวกับแนวคิดนี้อย่างไร โดยนำเสนอเป็นระเบียบวิธีอ้างอิงสำหรับการประเมินและรายงานผลการวิจัย ไม่ใช่กฎสำหรับการตัดสินใจทางคลินิก

Core questions

ช่วงของค่าพารามิเตอร์ใดที่สอดคล้องกับข้อมูลอย่างสมเหตุสมผล?
ระดับความเชื่อมั่นรับประกันอะไรกันแน่?
ขนาดตัวอย่างและความแปรปรวนกำหนดความกว้างของช่วงอย่างไร?
ช่วงความเชื่อมั่นเกี่ยวข้องกับการทดสอบสมมติฐานหรือค่า p อย่างไร?

Key concepts

ระดับความเชื่อมั่น
ความน่าจะเป็นของการครอบคลุม
ความกว้างของช่วงและความแม่นยำ
ขีดจำกัดความเชื่อมั่นล่างและบน
การตีความแบบ Frequentist
ความสัมพันธ์กับค่าว่าง
ช่วงที่แม่นยำเทียบกับช่วงโดยประมาณ

Mechanisms

ช่วงความเชื่อมั่นโดยทั่วไปจะถูกสร้างขึ้นโดยการนำค่าประมาณจุด (point estimate) และขยายออกไปโดยการคูณด้วยค่าความคลาดเคลื่อนมาตรฐาน (standard error) โดยที่ตัวคูณถูกกำหนดโดยระดับความเชื่อมั่นที่ต้องการและการแจกแจงการสุ่มตัวอย่างที่เกี่ยวข้อง คุณสมบัติแบบ Frequentist ที่สำคัญคือการครอบคลุม (coverage): หากการศึกษาถูกทำซ้ำหลายครั้ง ช่วงที่สร้างขึ้นด้วยวิธีนี้จะครอบคลุมพารามิเตอร์ที่แท้จริงในสัดส่วนที่ระบุของการทำซ้ำ ช่วงจะแคบลงเมื่อขนาดตัวอย่างเพิ่มขึ้นหรือความแปรปรวนลดลง ดังนั้นความกว้างจึงเป็นตัวบ่งชี้โดยตรงของความแม่นยำ ทางลัดที่พบบ่อยคือการเชื่อมโยงช่วงเข้ากับการทดสอบ — หากช่วง 95% สำหรับความแตกต่างไม่รวมค่าว่าง (null value) การทดสอบแบบสองทางที่สอดคล้องกันจะมีนัยสำคัญที่ระดับ 5% — แต่ช่วงจะให้ข้อมูลมากกว่าโดยการแสดงช่วงทั้งหมดของค่าที่เข้ากันได้ ข้อผิดพลาดที่พบบ่อยคือการตีความระดับว่าเป็นความน่าจะเป็นที่ค่าจริงอยู่ภายในช่วงใดช่วงหนึ่ง ซึ่งคำจำกัดความแบบ Frequentist ไม่ได้สนับสนุน

Clinical relevance

ช่วงความเชื่อมั่นมักจะมาพร้อมกับค่าประมาณผลกระทบส่วนใหญ่ในรายงานทางคลินิกและระบาดวิทยา ทำให้ผู้อ่านสามารถตัดสินได้ไม่เพียงแค่ว่ามีผลกระทบหรือไม่ แต่ยังรวมถึงขนาดของผลกระทบและความแม่นยำในการประมาณค่าด้วย ช่วงที่กว้างบ่งชี้ว่าการศึกษายังไม่สรุปผลได้ แม้ว่าค่าประมาณจุดจะดูโดดเด่นก็ตาม บทความนี้อธิบายวิธีการสร้างและตีความช่วง และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาเฉพาะบุคคล

Evidence & guidelines

แนวทางการรายงานและธรรมเนียมการบรรณาธิการในทางการแพทย์ในปัจจุบันมักจะคาดหวังให้มีการนำเสนอค่าประมาณผลกระทบพร้อมกับช่วงความเชื่อมั่น แถลงการณ์ของ American Statistical Association เกี่ยวกับค่า p และคู่มือการตีความผิดโดย Greenland และคณะ ต่างเน้นย้ำถึงการตีความช่วงที่ถูกต้องควบคู่ไปกับค่า p โดยอ้างอิงจากการสนับสนุนก่อนหน้านี้ของ Gardner และ Altman ในการรายงานโดยใช้ช่วง

History

ช่วงความเชื่อมั่นถูกนำเสนอโดย Jerzy Neyman ในทศวรรษ 1930 ในฐานะแนวทางแบบ Frequentist ในการประมาณค่าแบบช่วง โดยมีการสร้างช่วงที่แม่นยำในยุคแรกๆ เช่น ขีดจำกัด Clopper-Pearson สำหรับสัดส่วนทวินามที่ปรากฏในปี 1934 การใช้งานอย่างแพร่หลายในทางการแพทย์เกิดขึ้นในภายหลังในศตวรรษที่ยี่สิบ โดยเฉพาะอย่างยิ่งจากการสนับสนุนของ Gardner และ Altman ในปี 1986 ให้รายงานช่วงแทนที่จะเป็นเพียงค่า p ซึ่งได้ปรับเปลี่ยนธรรมเนียมของวารสาร

Debates

การตีความระดับความเชื่อมั่นที่ผิดพลาด: ระดับความเชื่อมั่นอธิบายประสิทธิภาพระยะยาวของกระบวนการสร้างช่วง ไม่ใช่ความน่าจะเป็นที่ช่วงที่คำนวณได้เฉพาะเจาะจงหนึ่งๆ จะมีค่าจริงอยู่ภายใน; ความแตกต่างนี้มักถูกเข้าใจผิดอย่างกว้างขวางและเป็นแหล่งที่มาของข้อผิดพลาดซ้ำๆ

Key figures

Jerzy Neyman
Egon Pearson
Martin J. Gardner
Douglas G. Altman
Sander Greenland

Seminal works

clopper-pearson-1934
gardner-altman-1986

Frequently asked questions

ช่วงความเชื่อมั่น 95% หมายความว่ามีโอกาส 95% ที่ค่าจริงจะอยู่ภายในช่วงนั้นหรือไม่?: ไม่ ภายใต้คำจำกัดความแบบ Frequentist ค่าจริงนั้นคงที่ และ 95% หมายถึงสัดส่วนระยะยาวของช่วงดังกล่าวที่สร้างขึ้นในลักษณะเดียวกันจากการสุ่มตัวอย่างซ้ำๆ ซึ่งจะครอบคลุมค่าจริงนั้น — ไม่ใช่ความน่าจะเป็นสำหรับช่วงใดช่วงหนึ่งโดยเฉพาะ
อะไรทำให้ช่วงความเชื่อมั่นแคบหรือกว้าง?: ส่วนใหญ่คือขนาดตัวอย่างและความแปรปรวน: ตัวอย่างที่ใหญ่ขึ้นและข้อมูลที่มีความแปรปรวนน้อยลงจะให้ช่วงที่แคบและแม่นยำกว่า ในขณะที่การศึกษาขนาดเล็กหรือมีข้อมูลรบกวนจะสร้างช่วงที่กว้างซึ่งบ่งบอกถึงความไม่แน่นอน