การวิเคราะห์อภิมาน
การวิเคราะห์อภิมาน (meta-analysis) เป็นวิธีการทางสถิติที่รวมผลเชิงปริมาณของการศึกษาอิสระหลายชิ้นที่ตอบคำถามเดียวกันเข้าไว้ด้วยกันเป็นค่าประมาณสรุปค่าเดียว ด้วยการรวมขนาดผลกระทบและการถ่วงน้ำหนักแต่ละการศึกษาตามความแม่นยำ การวิเคราะห์อภิมานสามารถสร้างค่าประมาณโดยรวมที่แม่นยำกว่าการศึกษาชิ้นเดียว และสามารถตรวจสอบได้ว่าผลกระทบมีความแตกต่างกันมากน้อยเพียงใดในการศึกษาต่างๆ
Definition
การวิเคราะห์อภิมานเป็นกระบวนการทางสถิติสำหรับการรวมค่าประมาณผลกระทบของการศึกษาอิสระหลายชิ้นในคำถามเดียวกันเข้าเป็นค่าประมาณสรุปแบบถ่วงน้ำหนัก โดยที่แต่ละการศึกษาจะถูกถ่วงน้ำหนักตามความแม่นยำของผลลัพธ์
Scope
เนื้อหานี้ครอบคลุมแกนหลักทางสถิติของการสังเคราะห์หลักฐานเชิงปริมาณ: ขนาดผลกระทบและการถ่วงน้ำหนัก, แบบจำลองผลกระทบคงที่เทียบกับแบบจำลองผลกระทบสุ่ม, ค่าประมาณสรุปและช่วงความเชื่อมั่น, และคำถามที่เกี่ยวข้องอย่างใกล้ชิดเกี่ยวกับความแตกต่างกัน (heterogeneity) เนื้อหานี้ถือว่าการวิเคราะห์อภิมานเป็นหัวข้อทางระเบียบวิธีที่ดำเนินการภายในการทบทวนอย่างเป็นระบบ ไม่ใช่แนวทางปฏิบัติทางคลินิก
Core questions
- ค่าประมาณที่ดีที่สุดเพียงค่าเดียวของผลกระทบเมื่อพิจารณาจากการศึกษาอิสระหลายชิ้นคืออะไร?
- ควรพิจารณาว่าการศึกษาต่างๆ ประมาณค่าผลกระทบร่วมกันเพียงค่าเดียว หรือประมาณค่าการกระจายของผลกระทบ?
- การศึกษาต่างๆ มีความสอดคล้องกันเพียงใด และผลลัพธ์รวมมีความแม่นยำเพียงใด?
Key concepts
- ขนาดผลกระทบ (เช่น อัตราส่วนความน่าจะเป็น, อัตราส่วนความเสี่ยง, ความแตกต่างของค่าเฉลี่ย)
- การถ่วงน้ำหนักแบบส่วนกลับของความแปรปรวน
- แบบจำลองผลกระทบคงที่
- แบบจำลองผลกระทบสุ่ม
- ค่าประมาณสรุปและช่วงความเชื่อมั่น
- แผนภาพป่า
- ความแตกต่างกัน
Mechanisms
แต่ละการศึกษามีส่วนช่วยในการประมาณค่าผลกระทบ (เช่น อัตราส่วนความน่าจะเป็น หรือความแตกต่างของค่าเฉลี่ยมาตรฐาน) และการวัดความแม่นยำ การวิเคราะห์อภิมานจะรวมสิ่งเหล่านี้โดยการถ่วงน้ำหนักแต่ละค่าประมาณ โดยทั่วไปจะใช้ส่วนกลับของความแปรปรวน เพื่อให้การศึกษาที่มีขนาดใหญ่และแม่นยำกว่ามีน้ำหนักมากขึ้น แบบจำลองผลกระทบคงที่ (fixed-effect model) สันนิษฐานว่าทุกการศึกษาประมาณค่าผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียว และความแตกต่างเกิดจากข้อผิดพลาดในการสุ่มตัวอย่างเท่านั้น แบบจำลองผลกระทบสุ่ม (random-effects model) ซึ่งโดยทั่วไปคือวิธีของ DerSimonian และ Laird สันนิษฐานว่าผลกระทบที่แท้จริงแตกต่างกันไปในแต่ละการศึกษา และเพิ่มองค์ประกอบความแปรปรวนระหว่างการศึกษา ทำให้เกิดช่วงที่กว้างขึ้นและให้น้ำหนักกับการศึกษาขนาดเล็กมากขึ้นโดยเปรียบเทียบ ค่าประมาณรวมและช่วงความเชื่อมั่นมักจะแสดงในแผนภาพป่า (forest plot) เนื่องจากการรวมกันสันนิษฐานว่าการศึกษาต่างๆ มีความคล้ายคลึงกันเพียงพอที่จะรวมเข้าด้วยกัน ระดับของความแตกต่างกันจึงได้รับการประเมินควบคู่ไปกับค่าสรุป
Clinical relevance
การวิเคราะห์อภิมานให้ค่าประมาณผลกระทบสรุปจำนวนมากที่อ้างอิงในแนวทางปฏิบัติทางคลินิกและการประเมินเทคโนโลยีด้านสุขภาพ และผลลัพธ์ของมันอาจมีความเสถียรมากกว่าการทดลองแต่ละครั้ง การตีความผลลัพธ์เหล่านี้จำเป็นต้องเข้าใจแบบจำลองที่ใช้และความแตกต่างกันที่มีอยู่ เนื้อหานี้อธิบายวิธีการคำนวณและอ่านค่าประมาณสรุป เป็นข้อมูลอ้างอิงสำหรับการประเมินหลักฐาน ไม่ใช่คำแนะนำสำหรับการรักษาผู้ป่วยแต่ละราย
Epidemiology
การวิเคราะห์อภิมานถูกนำไปใช้กับการทดลองทางคลินิก, ระบาดวิทยาเชิงสังเกต, การวิจัยความแม่นยำในการวินิจฉัย, และสังคมศาสตร์ ในทางการแพทย์มักดำเนินการภายในการทบทวนอย่างเป็นระบบของ Cochrane และอื่นๆ และซอฟต์แวร์สำหรับการวิเคราะห์อภิมานมีให้ใช้งานอย่างแพร่หลาย แบบจำลองผลกระทบสุ่มของ DerSimonian และ Laird เป็นหนึ่งในวิธีการรวมข้อมูลที่ใช้บ่อยที่สุดในวรรณกรรมชีวการแพทย์
Evidence & guidelines
การวิเคราะห์อภิมานที่รายงานภายในการทบทวนอย่างเป็นระบบเป็นไปตามมาตรฐานการรายงาน PRISMA 2020 (Page et al., 2021) ซึ่งรวมถึงรายการเกี่ยวกับวิธีการสังเคราะห์, ความแตกต่างกัน, และความแน่นอนของหลักฐาน สิ่งเหล่านี้เป็นมาตรฐานการรายงาน ไม่ใช่คำแนะนำในการรักษา
History
การรวมข้อมูลทางสถิติของการศึกษาต่างๆ ย้อนกลับไปถึงผลงานในช่วงต้นศตวรรษที่ 20 โดย Pearson และ Fisher และ Gene Glass ได้นำเสนอคำว่า meta-analysis ในปี 1976 ในงานวิจัยด้านการศึกษา ในทางการแพทย์ แบบจำลองผลกระทบสุ่มของ DerSimonian และ Laird (1986) ได้กลายเป็นแนวทางมาตรฐานในการรวมข้อมูล และวิธีการนี้แพร่หลายอย่างรวดเร็วพร้อมกับการเติบโตของ Cochrane Collaboration และซอฟต์แวร์เฉพาะทาง Borenstein และคณะ (2010) ได้ชี้แจงความแตกต่างเชิงแนวคิดระหว่างแบบจำลองผลกระทบคงที่และแบบจำลองผลกระทบสุ่มในภายหลัง
Debates
- แบบจำลองผลกระทบคงที่หรือแบบจำลองผลกระทบสุ่ม?
- แบบจำลองทั้งสองมีข้อสมมติฐานที่แตกต่างกันว่าการศึกษาต่างๆ มีผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียว หรือประมาณค่าการกระจายของผลกระทบ การเลือกแบบจำลองส่งผลต่อการถ่วงน้ำหนักและความกว้างของช่วงความเชื่อมั่น และแบบจำลองผลกระทบสุ่มอาจไม่เสถียรเมื่อมีการศึกษาน้อย
- การรวมข้อมูลเหมาะสมเมื่อใด?
- การรวมการศึกษาที่แตกต่างกันอย่างมากในประชากร, การแทรกแซง, หรือการออกแบบ อาจให้ค่าสรุปที่แม่นยำแต่ทำให้เข้าใจผิดได้ ดังนั้นระดับของความแตกต่างกันจึงส่งผลโดยตรงต่อความหมายของค่าประมาณรวม
Key figures
- Gene Glass
- Rebecca DerSimonian
- Nan Laird
- Larry Hedges
- Julian Higgins
- Michael Borenstein
Related topics
Seminal works
- dersimonian-laird-1986
- borenstein-2010
- higgins-2003-i2
Frequently asked questions
- ความแตกต่างระหว่างการวิเคราะห์อภิมานแบบผลกระทบคงที่และแบบผลกระทบสุ่มคืออะไร?
- แบบจำลองผลกระทบคงที่สันนิษฐานว่าการศึกษาทั้งหมดประมาณค่าผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียวและถ่วงน้ำหนักตามความแม่นยำเท่านั้น แบบจำลองผลกระทบสุ่มสันนิษฐานว่าผลกระทบที่แท้จริงแตกต่างกันไปในแต่ละการศึกษา เพิ่มพจน์ความแปรปรวนระหว่างการศึกษา และดังนั้นจึงให้ช่วงความเชื่อมั่นที่กว้างขึ้นและให้น้ำหนักกับการศึกษาขนาดเล็กมากขึ้นโดยเปรียบเทียบ
- ชุดการศึกษาใดๆ สามารถนำมาวิเคราะห์อภิมานได้หรือไม่?
- ไม่ การรวมข้อมูลสันนิษฐานว่าการศึกษาต่างๆ มีความคล้ายคลึงกันเพียงพอในด้านคำถาม, ประชากร, และการออกแบบ เพื่อให้มีค่าสรุปที่มีความหมาย เมื่อมีความแตกต่างกันมากเกินไป ค่าประมาณรวมเพียงค่าเดียวอาจแม่นยำแต่ทำให้เข้าใจผิดได้ และการสังเคราะห์เชิงคุณภาพอาจเหมาะสมกว่า