ความแตกต่างระหว่างการวิเคราะห์อภิมานแบบผลกระทบคงที่และแบบผลกระทบสุ่มคืออะไร?

แบบจำลองผลกระทบคงที่สันนิษฐานว่าการศึกษาทั้งหมดประมาณค่าผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียวและถ่วงน้ำหนักตามความแม่นยำเท่านั้น แบบจำลองผลกระทบสุ่มสันนิษฐานว่าผลกระทบที่แท้จริงแตกต่างกันไปในแต่ละการศึกษา เพิ่มพจน์ความแปรปรวนระหว่างการศึกษา และดังนั้นจึงให้ช่วงความเชื่อมั่นที่กว้างขึ้นและให้น้ำหนักกับการศึกษาขนาดเล็กมากขึ้นโดยเปรียบเทียบ

ชุดการศึกษาใดๆ สามารถนำมาวิเคราะห์อภิมานได้หรือไม่?

ไม่ การรวมข้อมูลสันนิษฐานว่าการศึกษาต่างๆ มีความคล้ายคลึงกันเพียงพอในด้านคำถาม, ประชากร, และการออกแบบ เพื่อให้มีค่าสรุปที่มีความหมาย เมื่อมีความแตกต่างกันมากเกินไป ค่าประมาณรวมเพียงค่าเดียวอาจแม่นยำแต่ทำให้เข้าใจผิดได้ และการสังเคราะห์เชิงคุณภาพอาจเหมาะสมกว่า

การวิเคราะห์อภิมาน

การวิเคราะห์อภิมาน (meta-analysis) เป็นวิธีการทางสถิติที่รวมผลเชิงปริมาณของการศึกษาอิสระหลายชิ้นที่ตอบคำถามเดียวกันเข้าไว้ด้วยกันเป็นค่าประมาณสรุปค่าเดียว ด้วยการรวมขนาดผลกระทบและการถ่วงน้ำหนักแต่ละการศึกษาตามความแม่นยำ การวิเคราะห์อภิมานสามารถสร้างค่าประมาณโดยรวมที่แม่นยำกว่าการศึกษาชิ้นเดียว และสามารถตรวจสอบได้ว่าผลกระทบมีความแตกต่างกันมากน้อยเพียงใดในการศึกษาต่างๆ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การวิเคราะห์อภิมานเป็นกระบวนการทางสถิติสำหรับการรวมค่าประมาณผลกระทบของการศึกษาอิสระหลายชิ้นในคำถามเดียวกันเข้าเป็นค่าประมาณสรุปแบบถ่วงน้ำหนัก โดยที่แต่ละการศึกษาจะถูกถ่วงน้ำหนักตามความแม่นยำของผลลัพธ์

Scope

เนื้อหานี้ครอบคลุมแกนหลักทางสถิติของการสังเคราะห์หลักฐานเชิงปริมาณ: ขนาดผลกระทบและการถ่วงน้ำหนัก, แบบจำลองผลกระทบคงที่เทียบกับแบบจำลองผลกระทบสุ่ม, ค่าประมาณสรุปและช่วงความเชื่อมั่น, และคำถามที่เกี่ยวข้องอย่างใกล้ชิดเกี่ยวกับความแตกต่างกัน (heterogeneity) เนื้อหานี้ถือว่าการวิเคราะห์อภิมานเป็นหัวข้อทางระเบียบวิธีที่ดำเนินการภายในการทบทวนอย่างเป็นระบบ ไม่ใช่แนวทางปฏิบัติทางคลินิก

Core questions

ค่าประมาณที่ดีที่สุดเพียงค่าเดียวของผลกระทบเมื่อพิจารณาจากการศึกษาอิสระหลายชิ้นคืออะไร?
ควรพิจารณาว่าการศึกษาต่างๆ ประมาณค่าผลกระทบร่วมกันเพียงค่าเดียว หรือประมาณค่าการกระจายของผลกระทบ?
การศึกษาต่างๆ มีความสอดคล้องกันเพียงใด และผลลัพธ์รวมมีความแม่นยำเพียงใด?

Key concepts

ขนาดผลกระทบ (เช่น อัตราส่วนความน่าจะเป็น, อัตราส่วนความเสี่ยง, ความแตกต่างของค่าเฉลี่ย)
การถ่วงน้ำหนักแบบส่วนกลับของความแปรปรวน
แบบจำลองผลกระทบคงที่
แบบจำลองผลกระทบสุ่ม
ค่าประมาณสรุปและช่วงความเชื่อมั่น
แผนภาพป่า
ความแตกต่างกัน

Mechanisms

แต่ละการศึกษามีส่วนช่วยในการประมาณค่าผลกระทบ (เช่น อัตราส่วนความน่าจะเป็น หรือความแตกต่างของค่าเฉลี่ยมาตรฐาน) และการวัดความแม่นยำ การวิเคราะห์อภิมานจะรวมสิ่งเหล่านี้โดยการถ่วงน้ำหนักแต่ละค่าประมาณ โดยทั่วไปจะใช้ส่วนกลับของความแปรปรวน เพื่อให้การศึกษาที่มีขนาดใหญ่และแม่นยำกว่ามีน้ำหนักมากขึ้น แบบจำลองผลกระทบคงที่ (fixed-effect model) สันนิษฐานว่าทุกการศึกษาประมาณค่าผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียว และความแตกต่างเกิดจากข้อผิดพลาดในการสุ่มตัวอย่างเท่านั้น แบบจำลองผลกระทบสุ่ม (random-effects model) ซึ่งโดยทั่วไปคือวิธีของ DerSimonian และ Laird สันนิษฐานว่าผลกระทบที่แท้จริงแตกต่างกันไปในแต่ละการศึกษา และเพิ่มองค์ประกอบความแปรปรวนระหว่างการศึกษา ทำให้เกิดช่วงที่กว้างขึ้นและให้น้ำหนักกับการศึกษาขนาดเล็กมากขึ้นโดยเปรียบเทียบ ค่าประมาณรวมและช่วงความเชื่อมั่นมักจะแสดงในแผนภาพป่า (forest plot) เนื่องจากการรวมกันสันนิษฐานว่าการศึกษาต่างๆ มีความคล้ายคลึงกันเพียงพอที่จะรวมเข้าด้วยกัน ระดับของความแตกต่างกันจึงได้รับการประเมินควบคู่ไปกับค่าสรุป

Clinical relevance

การวิเคราะห์อภิมานให้ค่าประมาณผลกระทบสรุปจำนวนมากที่อ้างอิงในแนวทางปฏิบัติทางคลินิกและการประเมินเทคโนโลยีด้านสุขภาพ และผลลัพธ์ของมันอาจมีความเสถียรมากกว่าการทดลองแต่ละครั้ง การตีความผลลัพธ์เหล่านี้จำเป็นต้องเข้าใจแบบจำลองที่ใช้และความแตกต่างกันที่มีอยู่ เนื้อหานี้อธิบายวิธีการคำนวณและอ่านค่าประมาณสรุป เป็นข้อมูลอ้างอิงสำหรับการประเมินหลักฐาน ไม่ใช่คำแนะนำสำหรับการรักษาผู้ป่วยแต่ละราย

Epidemiology

การวิเคราะห์อภิมานถูกนำไปใช้กับการทดลองทางคลินิก, ระบาดวิทยาเชิงสังเกต, การวิจัยความแม่นยำในการวินิจฉัย, และสังคมศาสตร์ ในทางการแพทย์มักดำเนินการภายในการทบทวนอย่างเป็นระบบของ Cochrane และอื่นๆ และซอฟต์แวร์สำหรับการวิเคราะห์อภิมานมีให้ใช้งานอย่างแพร่หลาย แบบจำลองผลกระทบสุ่มของ DerSimonian และ Laird เป็นหนึ่งในวิธีการรวมข้อมูลที่ใช้บ่อยที่สุดในวรรณกรรมชีวการแพทย์

Evidence & guidelines

การวิเคราะห์อภิมานที่รายงานภายในการทบทวนอย่างเป็นระบบเป็นไปตามมาตรฐานการรายงาน PRISMA 2020 (Page et al., 2021) ซึ่งรวมถึงรายการเกี่ยวกับวิธีการสังเคราะห์, ความแตกต่างกัน, และความแน่นอนของหลักฐาน สิ่งเหล่านี้เป็นมาตรฐานการรายงาน ไม่ใช่คำแนะนำในการรักษา

History

การรวมข้อมูลทางสถิติของการศึกษาต่างๆ ย้อนกลับไปถึงผลงานในช่วงต้นศตวรรษที่ 20 โดย Pearson และ Fisher และ Gene Glass ได้นำเสนอคำว่า meta-analysis ในปี 1976 ในงานวิจัยด้านการศึกษา ในทางการแพทย์ แบบจำลองผลกระทบสุ่มของ DerSimonian และ Laird (1986) ได้กลายเป็นแนวทางมาตรฐานในการรวมข้อมูล และวิธีการนี้แพร่หลายอย่างรวดเร็วพร้อมกับการเติบโตของ Cochrane Collaboration และซอฟต์แวร์เฉพาะทาง Borenstein และคณะ (2010) ได้ชี้แจงความแตกต่างเชิงแนวคิดระหว่างแบบจำลองผลกระทบคงที่และแบบจำลองผลกระทบสุ่มในภายหลัง

Debates

แบบจำลองผลกระทบคงที่หรือแบบจำลองผลกระทบสุ่ม?: แบบจำลองทั้งสองมีข้อสมมติฐานที่แตกต่างกันว่าการศึกษาต่างๆ มีผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียว หรือประมาณค่าการกระจายของผลกระทบ การเลือกแบบจำลองส่งผลต่อการถ่วงน้ำหนักและความกว้างของช่วงความเชื่อมั่น และแบบจำลองผลกระทบสุ่มอาจไม่เสถียรเมื่อมีการศึกษาน้อย
การรวมข้อมูลเหมาะสมเมื่อใด?: การรวมการศึกษาที่แตกต่างกันอย่างมากในประชากร, การแทรกแซง, หรือการออกแบบ อาจให้ค่าสรุปที่แม่นยำแต่ทำให้เข้าใจผิดได้ ดังนั้นระดับของความแตกต่างกันจึงส่งผลโดยตรงต่อความหมายของค่าประมาณรวม

Key figures

Gene Glass
Rebecca DerSimonian
Nan Laird
Larry Hedges
Julian Higgins
Michael Borenstein

Seminal works

dersimonian-laird-1986
borenstein-2010
higgins-2003-i2

Frequently asked questions

ความแตกต่างระหว่างการวิเคราะห์อภิมานแบบผลกระทบคงที่และแบบผลกระทบสุ่มคืออะไร?: แบบจำลองผลกระทบคงที่สันนิษฐานว่าการศึกษาทั้งหมดประมาณค่าผลกระทบที่แท้จริงร่วมกันเพียงค่าเดียวและถ่วงน้ำหนักตามความแม่นยำเท่านั้น แบบจำลองผลกระทบสุ่มสันนิษฐานว่าผลกระทบที่แท้จริงแตกต่างกันไปในแต่ละการศึกษา เพิ่มพจน์ความแปรปรวนระหว่างการศึกษา และดังนั้นจึงให้ช่วงความเชื่อมั่นที่กว้างขึ้นและให้น้ำหนักกับการศึกษาขนาดเล็กมากขึ้นโดยเปรียบเทียบ
ชุดการศึกษาใดๆ สามารถนำมาวิเคราะห์อภิมานได้หรือไม่?: ไม่ การรวมข้อมูลสันนิษฐานว่าการศึกษาต่างๆ มีความคล้ายคลึงกันเพียงพอในด้านคำถาม, ประชากร, และการออกแบบ เพื่อให้มีค่าสรุปที่มีความหมาย เมื่อมีความแตกต่างกันมากเกินไป ค่าประมาณรวมเพียงค่าเดียวอาจแม่นยำแต่ทำให้เข้าใจผิดได้ และการสังเคราะห์เชิงคุณภาพอาจเหมาะสมกว่า