ระเบียบวิธีทางสถิติในการสังเคราะห์หลักฐานเชิงประจักษ์
ระเบียบวิธีทางสถิติในการสังเคราะห์หลักฐานเชิงประจักษ์คือเทคนิคเชิงปริมาณที่ใช้ในการรวมผลลัพธ์จากการศึกษาหลายชิ้นเข้าเป็นค่าประมาณผลโดยรวม เพื่อหาปริมาณและอธิบายความแตกต่างระหว่างการศึกษา และเพื่อทดสอบว่าข้อสรุปที่รวมกันนั้นมีความน่าเชื่อถือเพียงใด ระเบียบวิธีเหล่านี้เป็นกลไกการวิเคราะห์หลักของการทบทวนวรรณกรรมอย่างเป็นระบบ และเป็นรากฐานของการปฏิบัติที่อิงหลักฐานเชิงประจักษ์และการประเมินเทคโนโลยีด้านสุขภาพ
Definition
ระเบียบวิธีทางสถิติในการสังเคราะห์หลักฐานเชิงประจักษ์ประกอบด้วยขั้นตอนสำหรับการประมาณค่าผลรวมที่รวบรวมจากการศึกษาต่างๆ (โดยทั่วไปภายใต้แบบจำลองผลคงที่หรือผลสุ่ม) สำหรับการวัดและตรวจสอบความแตกต่างระหว่างการศึกษา และสำหรับการตรวจสอบความน่าเชื่อถือของค่าประมาณที่สังเคราะห์ขึ้นต่อทางเลือกในการวิเคราะห์และการศึกษาแต่ละชิ้น
Scope
ส่วนนี้จะแนะนำผู้อ่านให้รู้จักกับกลุ่มของระเบียบวิธีที่เปลี่ยนชุดของการศึกษาแต่ละชิ้นให้เป็นคำตอบเชิงปริมาณที่สังเคราะห์ขึ้น: การวิเคราะห์อภิมาน (ขั้นตอนการรวมข้อมูล), การประเมินความแตกต่าง (ความแตกต่างของการศึกษา), การวิเคราะห์อภิมานแบบถดถอย (การอธิบายความแตกต่างนั้นด้วยตัวแปรอธิบายระดับการศึกษา) และการวิเคราะห์ความไว (การทดสอบว่าข้อสรุปยังคงอยู่ภายใต้สมมติฐานที่แตกต่างกันหรือไม่) โดยจัดให้เป็นหัวข้ออ้างอิงทางระเบียบวิธี ไม่ใช่คำแนะนำทางคลินิก
Sub-topics
Core questions
- ผลลัพธ์จากการศึกษาที่แยกกันควรให้น้ำหนักและรวมเข้าเป็นค่าประมาณเดียวได้อย่างไร?
- แบบจำลองผลคงที่เหมาะสมเมื่อใด และจำเป็นต้องใช้แบบจำลองผลสุ่มเมื่อใด?
- การศึกษาแตกต่างกันมากน้อยเพียงใดนอกเหนือจากโอกาส และความแตกต่างนั้นเปลี่ยนแปลงสิ่งที่เราสามารถสรุปได้หรือไม่?
- ลักษณะเฉพาะระดับการศึกษาสามารถอธิบายความแปรปรวนของผลที่สังเกตได้หรือไม่?
- ข้อสรุปที่รวมกันมีความไวต่อการศึกษาแต่ละชิ้น ต่อสมมติฐานการสร้างแบบจำลอง และต่อความเสี่ยงของอคติมากน้อยเพียงใด?
Key concepts
- ค่าประมาณผลรวม (สรุป)
- การให้น้ำหนักการศึกษา (การให้น้ำหนักส่วนกลับของความแปรปรวน)
- แบบจำลองผลคงที่เทียบกับแบบจำลองผลสุ่ม
- ความแตกต่างระหว่างการศึกษา
- การวิเคราะห์อภิมานแบบถดถอยและการวิเคราะห์กลุ่มย่อย
- การวิเคราะห์ความไวและความน่าเชื่อถือ
- ช่วงความเชื่อมั่นและช่วงการพยากรณ์
Mechanisms
ตรรกะร่วมกันคือการถือว่าค่าประมาณผลของการศึกษาแต่ละชิ้นเป็นจุดข้อมูลที่มีความไม่แน่นอนที่ทราบ จากนั้นจึงรวมจุดเหล่านั้นเข้าด้วยกันโดยให้น้ำหนักที่สะท้อนถึงความแม่นยำ การวิเคราะห์ผลคงที่สมมติว่าการศึกษาทั้งหมดประมาณผลจริงร่วมกันเพียงหนึ่งเดียวและให้น้ำหนักตามส่วนกลับของความแปรปรวนเท่านั้น; การวิเคราะห์ผลสุ่มสมมติว่าผลจริงแตกต่างกันไปในการศึกษาต่างๆ และเพิ่มองค์ประกอบความแปรปรวนระหว่างการศึกษา ดังนั้นวิธี DerSimonian-Laird และวิธีที่ตามมาจึงขยายน้ำหนักและช่วงความเชื่อมั่นตามไปด้วย สถิติความแตกต่างสรุปว่าความแปรปรวนที่สังเกตได้เกินข้อผิดพลาดจากการสุ่มตัวอย่างไปมากน้อยเพียงใด; การวิเคราะห์อภิมานแบบถดถอยและการวิเคราะห์กลุ่มย่อยพยายามอธิบายความแปรปรวนนั้นด้วยตัวแปรอธิบายระดับการศึกษา; และการวิเคราะห์ความไวจะทำการสังเคราะห์ซ้ำภายใต้สมมติฐานทางเลือกเพื่อตรวจสอบว่าผลลัพธ์หลักไม่ใช่สิ่งประดิษฐ์ของการศึกษาชิ้นเดียวหรือทางเลือกในการสร้างแบบจำลองเพียงอย่างเดียว
Clinical relevance
ระเบียบวิธีเหล่านี้สร้างหลักฐานระดับสูงจำนวนมากที่แนวปฏิบัติและการประเมินเทคโนโลยีด้านสุขภาพนำไปใช้ ดังนั้นการทำความเข้าใจว่าค่าประมาณรวม ความแตกต่าง และการวิเคราะห์ความไวถูกสร้างขึ้นมาอย่างไรจึงเป็นสิ่งสำคัญในการประเมินการทบทวนวรรณกรรมอย่างเป็นระบบ ส่วนนี้อธิบายวิธีการสร้างและตีความหลักฐานที่สังเคราะห์ขึ้น ไม่ใช่แหล่งข้อมูลคำแนะนำในการวินิจฉัยหรือการรักษาเฉพาะบุคคล
Evidence & guidelines
มาตรฐานการรายงานสำหรับการดำเนินการทางสถิติของการสังเคราะห์หลักฐานเชิงประจักษ์ได้ระบุไว้ในแถลงการณ์ PRISMA (Moher et al., 2009) และในคู่มือ Cochrane (Higgins & Green, 2008) ซึ่งอธิบายแนวปฏิบัติที่คาดหวังสำหรับการเลือกแบบจำลอง การประเมินความแตกต่าง และการวิเคราะห์ความไวในการทบทวนวรรณกรรมอย่างเป็นระบบ
History
การรวมผลการศึกษาเชิงปริมาณเติบโตมาจากการเกษตรและสถิติสังคมศาสตร์ในช่วงต้นศตวรรษที่ 20 และได้รับการตั้งชื่อว่าการวิเคราะห์อภิมานโดย Gene Glass ในปี 1976 การปรับใช้กับการทดลองทางคลินิกได้รับการสรุปโดยวิธีผลสุ่มของ DerSimonian และ Laird ในปี 1986 และการพัฒนาสถิติความแตกต่าง การวิเคราะห์อภิมานแบบถดถอย และการรายงานที่เป็นมาตรฐาน (PRISMA, คู่มือ Cochrane) ในเวลาต่อมาได้เปลี่ยนการสังเคราะห์หลักฐานเชิงประจักษ์ให้เป็นสาขาวิชาสถิติที่มีโครงสร้างซึ่งสนับสนุนการปฏิบัติที่อิงหลักฐานเชิงประจักษ์และการประเมินเทคโนโลยีด้านสุขภาพ
Debates
- แบบจำลองผลคงที่เทียบกับแบบจำลองผลสุ่มเป็นแบบจำลองเริ่มต้น
- การสังเคราะห์ควรสมมติผลร่วมกันเพียงหนึ่งเดียวหรืออนุญาตให้ผลจริงแตกต่างกันไปนั้นเปลี่ยนแปลงทั้งค่าประมาณและความไม่แน่นอน; ผู้แสดงความคิดเห็นโต้แย้งว่าการเลือกควรสะท้อนถึงความหลากหลายทางคลินิกและระเบียบวิธีของการศึกษาที่รวมอยู่มากกว่าการยึดตามธรรมเนียมปฏิบัติที่ตายตัว
Key figures
- Rebecca DerSimonian
- Nan Laird
- Julian Higgins
- Simon Thompson
- Michael Borenstein
- Larry Hedges
Related topics
Seminal works
- dersimonian-laird-1986
- higgins-thompson-2002
- higgins-handbook-2008
Frequently asked questions
- การทบทวนวรรณกรรมอย่างเป็นระบบกับระเบียบวิธีทางสถิติที่ใช้ในการทบทวนนั้นแตกต่างกันอย่างไร?
- การทบทวนวรรณกรรมอย่างเป็นระบบคือกระบวนการทั้งหมดของการระบุ การประเมิน และการสรุปการศึกษา; ระเบียบวิธีทางสถิติในการสังเคราะห์หลักฐานเชิงประจักษ์คือขั้นตอนเชิงปริมาณภายในกระบวนการนั้นที่รวบรวมผลลัพธ์ วัดความแตกต่าง และทดสอบความน่าเชื่อถือ
- การทบทวนวรรณกรรมอย่างเป็นระบบทุกครั้งมีการวิเคราะห์อภิมานหรือไม่?
- ไม่ เมื่อการศึกษามีความหลากหลายทางคลินิกหรือระเบียบวิธีมากเกินไปที่จะรวมกันได้อย่างมีความหมาย การทบทวนอาจสังเคราะห์ผลลัพธ์ในเชิงบรรยาย และระเบียบวิธีทางสถิติเหล่านี้จะถูกนำมาใช้เมื่อการรวมข้อมูลได้รับการพิจารณาว่าเหมาะสมเท่านั้น