ช่วงความเชื่อมั่น
ช่วงความเชื่อมั่นคือช่วงของค่าที่เป็นไปได้สำหรับปริมาณประชากรที่ไม่ทราบค่า ซึ่งคำนวณจากข้อมูลตัวอย่างเพื่อให้กระบวนการที่ใช้ในการสร้างช่วงนั้นสามารถครอบคลุมค่าจริงได้ตามสัดส่วนที่กำหนดไว้ — โดยทั่วไปคือ 95% — ในการสุ่มตัวอย่างซ้ำๆ ช่วงความเชื่อมั่นแสดงทั้งขนาดของการประมาณค่าและความไม่แน่นอนรอบๆ ค่าประมาณนั้นในรูปแบบสรุปเดียวที่ได้รับการรายงานอย่างแพร่หลาย และได้กลายเป็นวิธีที่นิยมในการนำเสนอค่าประมาณผลกระทบในสาขาวิทยาศาสตร์สุขภาพ
Definition
ช่วงความเชื่อมั่นคือช่วงที่คำนวณจากข้อมูลตัวอย่างโดยวิธีที่กำหนด ณ ระดับความเชื่อมั่นที่ระบุ โดยที่วิธีดังกล่าวจะครอบคลุมพารามิเตอร์ประชากรที่แท้จริงในสัดส่วนที่ระบุของการสุ่มตัวอย่างซ้ำๆ ในเชิงสมมติฐาน
Scope
หัวข้อนี้อธิบายว่าช่วงความเชื่อมั่นคืออะไร ควรตีความระดับความเชื่อมั่นอย่างไร ความกว้างของช่วงสะท้อนความแม่นยำและขนาดตัวอย่างอย่างไร และความเข้าใจผิดที่พบบ่อยเกี่ยวกับแนวคิดนี้อย่างไร โดยนำเสนอเป็นระเบียบวิธีอ้างอิงสำหรับการประเมินและรายงานผลการวิจัย ไม่ใช่กฎสำหรับการตัดสินใจทางคลินิก
Core questions
- ช่วงของค่าพารามิเตอร์ใดที่สอดคล้องกับข้อมูลอย่างสมเหตุสมผล?
- ระดับความเชื่อมั่นรับประกันอะไรกันแน่?
- ขนาดตัวอย่างและความแปรปรวนกำหนดความกว้างของช่วงอย่างไร?
- ช่วงความเชื่อมั่นเกี่ยวข้องกับการทดสอบสมมติฐานหรือค่า p อย่างไร?
Key concepts
- ระดับความเชื่อมั่น
- ความน่าจะเป็นของการครอบคลุม
- ความกว้างของช่วงและความแม่นยำ
- ขีดจำกัดความเชื่อมั่นล่างและบน
- การตีความแบบ Frequentist
- ความสัมพันธ์กับค่าว่าง
- ช่วงที่แม่นยำเทียบกับช่วงโดยประมาณ
Mechanisms
ช่วงความเชื่อมั่นโดยทั่วไปจะถูกสร้างขึ้นโดยการนำค่าประมาณจุด (point estimate) และขยายออกไปโดยการคูณด้วยค่าความคลาดเคลื่อนมาตรฐาน (standard error) โดยที่ตัวคูณถูกกำหนดโดยระดับความเชื่อมั่นที่ต้องการและการแจกแจงการสุ่มตัวอย่างที่เกี่ยวข้อง คุณสมบัติแบบ Frequentist ที่สำคัญคือการครอบคลุม (coverage): หากการศึกษาถูกทำซ้ำหลายครั้ง ช่วงที่สร้างขึ้นด้วยวิธีนี้จะครอบคลุมพารามิเตอร์ที่แท้จริงในสัดส่วนที่ระบุของการทำซ้ำ ช่วงจะแคบลงเมื่อขนาดตัวอย่างเพิ่มขึ้นหรือความแปรปรวนลดลง ดังนั้นความกว้างจึงเป็นตัวบ่งชี้โดยตรงของความแม่นยำ ทางลัดที่พบบ่อยคือการเชื่อมโยงช่วงเข้ากับการทดสอบ — หากช่วง 95% สำหรับความแตกต่างไม่รวมค่าว่าง (null value) การทดสอบแบบสองทางที่สอดคล้องกันจะมีนัยสำคัญที่ระดับ 5% — แต่ช่วงจะให้ข้อมูลมากกว่าโดยการแสดงช่วงทั้งหมดของค่าที่เข้ากันได้ ข้อผิดพลาดที่พบบ่อยคือการตีความระดับว่าเป็นความน่าจะเป็นที่ค่าจริงอยู่ภายในช่วงใดช่วงหนึ่ง ซึ่งคำจำกัดความแบบ Frequentist ไม่ได้สนับสนุน
Clinical relevance
ช่วงความเชื่อมั่นมักจะมาพร้อมกับค่าประมาณผลกระทบส่วนใหญ่ในรายงานทางคลินิกและระบาดวิทยา ทำให้ผู้อ่านสามารถตัดสินได้ไม่เพียงแค่ว่ามีผลกระทบหรือไม่ แต่ยังรวมถึงขนาดของผลกระทบและความแม่นยำในการประมาณค่าด้วย ช่วงที่กว้างบ่งชี้ว่าการศึกษายังไม่สรุปผลได้ แม้ว่าค่าประมาณจุดจะดูโดดเด่นก็ตาม บทความนี้อธิบายวิธีการสร้างและตีความช่วง และไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาเฉพาะบุคคล
Evidence & guidelines
แนวทางการรายงานและธรรมเนียมการบรรณาธิการในทางการแพทย์ในปัจจุบันมักจะคาดหวังให้มีการนำเสนอค่าประมาณผลกระทบพร้อมกับช่วงความเชื่อมั่น แถลงการณ์ของ American Statistical Association เกี่ยวกับค่า p และคู่มือการตีความผิดโดย Greenland และคณะ ต่างเน้นย้ำถึงการตีความช่วงที่ถูกต้องควบคู่ไปกับค่า p โดยอ้างอิงจากการสนับสนุนก่อนหน้านี้ของ Gardner และ Altman ในการรายงานโดยใช้ช่วง
History
ช่วงความเชื่อมั่นถูกนำเสนอโดย Jerzy Neyman ในทศวรรษ 1930 ในฐานะแนวทางแบบ Frequentist ในการประมาณค่าแบบช่วง โดยมีการสร้างช่วงที่แม่นยำในยุคแรกๆ เช่น ขีดจำกัด Clopper-Pearson สำหรับสัดส่วนทวินามที่ปรากฏในปี 1934 การใช้งานอย่างแพร่หลายในทางการแพทย์เกิดขึ้นในภายหลังในศตวรรษที่ยี่สิบ โดยเฉพาะอย่างยิ่งจากการสนับสนุนของ Gardner และ Altman ในปี 1986 ให้รายงานช่วงแทนที่จะเป็นเพียงค่า p ซึ่งได้ปรับเปลี่ยนธรรมเนียมของวารสาร
Debates
- การตีความระดับความเชื่อมั่นที่ผิดพลาด
- ระดับความเชื่อมั่นอธิบายประสิทธิภาพระยะยาวของกระบวนการสร้างช่วง ไม่ใช่ความน่าจะเป็นที่ช่วงที่คำนวณได้เฉพาะเจาะจงหนึ่งๆ จะมีค่าจริงอยู่ภายใน; ความแตกต่างนี้มักถูกเข้าใจผิดอย่างกว้างขวางและเป็นแหล่งที่มาของข้อผิดพลาดซ้ำๆ
Key figures
- Jerzy Neyman
- Egon Pearson
- Martin J. Gardner
- Douglas G. Altman
- Sander Greenland
Related topics
Seminal works
- clopper-pearson-1934
- gardner-altman-1986
Frequently asked questions
- ช่วงความเชื่อมั่น 95% หมายความว่ามีโอกาส 95% ที่ค่าจริงจะอยู่ภายในช่วงนั้นหรือไม่?
- ไม่ ภายใต้คำจำกัดความแบบ Frequentist ค่าจริงนั้นคงที่ และ 95% หมายถึงสัดส่วนระยะยาวของช่วงดังกล่าวที่สร้างขึ้นในลักษณะเดียวกันจากการสุ่มตัวอย่างซ้ำๆ ซึ่งจะครอบคลุมค่าจริงนั้น — ไม่ใช่ความน่าจะเป็นสำหรับช่วงใดช่วงหนึ่งโดยเฉพาะ
- อะไรทำให้ช่วงความเชื่อมั่นแคบหรือกว้าง?
- ส่วนใหญ่คือขนาดตัวอย่างและความแปรปรวน: ตัวอย่างที่ใหญ่ขึ้นและข้อมูลที่มีความแปรปรวนน้อยลงจะให้ช่วงที่แคบและแม่นยำกว่า ในขณะที่การศึกษาขนาดเล็กหรือมีข้อมูลรบกวนจะสร้างช่วงที่กว้างซึ่งบ่งบอกถึงความไม่แน่นอน