I-squared 75% หมายความว่าอย่างไร?

บ่งชี้ว่าประมาณสามในสี่ของความแปรปรวนทั้งหมดในค่าประมาณของงานวิจัยสะท้อนถึงความแตกต่างระหว่างงานวิจัยที่แท้จริงมากกว่าความคลาดเคลื่อนจากการสุ่มตัวอย่าง อย่างไรก็ตาม เนื่องจาก I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัย จึงควรตีความควบคู่ไปกับการกระจายผลกระทบที่แท้จริง ไม่ใช่เทียบกับป้ายกำกับคงที่

ความแตกต่างหลากหลายสูงเป็นเหตุผลที่ไม่ควรรวมงานวิจัยหรือไม่?

ไม่จำเป็นเสมอไป ความแตกต่างหลากหลายสูงบ่งชี้ว่างานวิจัยมีความแตกต่างกันและกระตุ้นให้มีการตรวจสอบสาเหตุ แต่การจะรวมงานวิจัย ใช้แบบจำลองสุ่มผลกระทบ หรือละเว้นนั้นขึ้นอยู่กับว่าความแตกต่างนั้นสามารถอธิบายได้หรือไม่ และงานวิจัยนั้นเปรียบเทียบกันได้ทางคลินิกหรือไม่

ความแตกต่างหลากหลายในการวิเคราะห์อภิมาน

ความแตกต่างหลากหลายในการวิเคราะห์อภิมานคือความแปรปรวนของผลกระทบที่แท้จริงในงานวิจัยที่นำมารวมกัน ซึ่งเกินกว่าที่ความคลาดเคลื่อนจากการสุ่มตัวอย่างเพียงอย่างเดียวจะก่อให้เกิดได้ การวัดและตีความสิ่งนี้จะบอกนักวิเคราะห์ว่างานวิจัยเหล่านั้นกำลังประเมินสิ่งเดียวกันโดยพื้นฐาน หรือเป็นสิ่งต่างกันอย่างแท้จริง ซึ่งจะส่งผลต่อทั้งแบบจำลองที่ใช้และความเชื่อมั่นในผลสรุป

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

ความแตกต่างหลากหลายคือระดับที่ผลกระทบที่แท้จริงซึ่งประเมินโดยงานวิจัยแต่ละชิ้นในการวิเคราะห์อภิมานแตกต่างกัน โดยวัดปริมาณด้วยสถิติ เช่น Cochran's Q, I-squared (สัดส่วนของความแปรปรวนทั้งหมดที่เกิดจากความแตกต่างระหว่างงานวิจัยมากกว่าความบังเอิญ) และ tau-squared (ความแปรปรวนระหว่างงานวิจัยที่ประมาณค่าได้)

Scope

บทความนี้ครอบคลุมการประเมินทางสถิติของความแตกต่างหลากหลายระหว่างงานวิจัย: การทดสอบ Cochran Q, สถิติ I-squared, ความแปรปรวนระหว่างงานวิจัย tau-squared และข้อจำกัดที่เป็นที่ทราบกันดีของมาตรการเหล่านี้ บทความนี้ถือว่าความแตกต่างหลากหลายเป็นหัวข้อทางระเบียบวิธีวิจัยภายในการสังเคราะห์หลักฐาน และนำเสนอคำอธิบายอ้างอิง ไม่ใช่คำแนะนำทางคลินิก

Core questions

งานวิจัยที่รวมอยู่ประมาณค่าผลกระทบร่วมกันหนึ่งอย่างหรือผลกระทบที่แตกต่างกันหลายอย่าง?
ความแปรปรวนที่สังเกตได้เป็นความแตกต่างระหว่างงานวิจัยจริง ๆ เทียบกับสัญญาณรบกวนจากการสุ่มตัวอย่างมากน้อยเพียงใด?
ควรตีความ I-squared และ tau-squared อย่างไร และในกรณีใดที่อาจทำให้เข้าใจผิด?
เมื่อใดที่ความแตกต่างหลากหลายทำให้การประมาณค่ารวมเพียงค่าเดียวไม่เหมาะสม?

Key concepts

การทดสอบ Cochran's Q
สถิติ I-squared
Tau-squared (ความแปรปรวนระหว่างงานวิจัย)
ความแตกต่างหลากหลายทางคลินิกเทียบกับทางสถิติ
ช่วงการพยากรณ์
การวิเคราะห์กลุ่มย่อยเพื่อตอบสนองต่อความแตกต่างหลากหลาย

Mechanisms

ความแปรปรวนทั้งหมดในค่าประมาณของงานวิจัยถูกแบ่งออกเป็นความคลาดเคลื่อนจากการสุ่มตัวอย่างภายในงานวิจัยและความแปรปรวนที่แท้จริงระหว่างงานวิจัย การทดสอบ Cochran's Q เปรียบเทียบการกระจายที่สังเกตได้กับสิ่งที่ความคลาดเคลื่อนจากการสุ่มตัวอย่างเพียงอย่างเดียวคาดการณ์ไว้ เนื่องจาก Q มีกำลังการทดสอบต่ำเมื่อมีงานวิจัยน้อย Higgins และ Thompson จึงเสนอ I-squared ซึ่งเป็นเปอร์เซ็นต์ของความแปรปรวนทั้งหมดที่เกิดจากความแตกต่างหลากหลายระหว่างงานวิจัยมากกว่าความบังเอิญ ซึ่งไม่ขึ้นอยู่กับจำนวนงานวิจัย Tau-squared ประมาณค่าความแปรปรวนของการกระจายผลกระทบพื้นฐานและนำไปใช้โดยตรงในการถ่วงน้ำหนักแบบสุ่มผลกระทบและช่วงการพยากรณ์ ข้อควรระวังที่สำคัญมีดังนี้: Rücker และคณะแสดงให้เห็นว่า I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัยที่รวมอยู่ ดังนั้นจึงอาจมีค่าสูงได้เพียงเพราะงานวิจัยมีความแม่นยำ และ von Hippel แสดงให้เห็นว่ามันไม่เสถียรและอาจมีอคติในการวิเคราะห์อภิมานขนาดเล็ก ดังนั้นสถิติเหล่านี้จึงต้องอ่านควบคู่ไปกับการกระจายสัมบูรณ์ของผลกระทบมากกว่าการเทียบกับเกณฑ์คงที่

Clinical relevance

การสรุปผลงานวิจัยจำนวนมากจะขึ้นอยู่กับความแตกต่างหลากหลายอย่างมาก ดังนั้นการประเมินสถิติความแตกต่างหลากหลายจึงเป็นส่วนหนึ่งของการตัดสินว่าผลลัพธ์รวมควรได้รับน้ำหนักเท่าใดในแนวทางปฏิบัติและการประเมินเทคโนโลยีสุขภาพ บทความนี้อธิบายวิธีการวัดความแตกต่างหลากหลายและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล

Evidence & guidelines

คู่มือ Cochrane อธิบายแนวปฏิบัติที่คาดหวังสำหรับการประเมินและรายงานความแตกต่างหลากหลาย รวมถึงการใช้ I-squared พร้อมการตีความที่ระมัดระวังและบทบาทของช่วงการพยากรณ์ ซึ่งสอดคล้องกับวรรณกรรมระเบียบวิธีวิจัยที่สรุปไว้ในที่นี้

History

การทดสอบ Cochran's Q สำหรับการรวมการทดลองมีมาตั้งแต่สถิติกลางศตวรรษที่ยี่สิบ แต่พิสูจน์แล้วว่ามีกำลังการทดสอบไม่เพียงพอสำหรับจำนวนงานวิจัยที่น้อยซึ่งพบได้ทั่วไปในการวิเคราะห์อภิมานทางคลินิก บทความของ Higgins และ Thompson ในปี 2002 ตามด้วยบทความ BMJ ที่อ้างอิงอย่างกว้างขวางในปี 2003 ได้นำเสนอ I-squared เป็นมาตรการที่ตีความได้และไม่ขึ้นอยู่กับขนาดตัวอย่าง หลังจากนั้นวรรณกรรมแก้ไข (Rücker et al., 2008; von Hippel, 2015) ได้ชี้แจงการพึ่งพาความแม่นยำของงานวิจัยและความไม่เสถียรในการสังเคราะห์ขนาดเล็ก

Debates

ควรพึ่งพา I-squared มากน้อยเพียงใดในการตัดสินความแตกต่างหลากหลาย?: I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัยที่รวมอยู่และอาจไม่เสถียรเมื่อรวมงานวิจัยจำนวนน้อย ดังนั้นผู้แสดงความคิดเห็นจึงเตือนไม่ให้ใช้เกณฑ์ตายตัวและแนะนำให้อ่านควบคู่ไปกับ tau-squared และการกระจายสัมบูรณ์ของผลกระทบ

Key figures

Julian Higgins
Simon Thompson
Gerta Rücker
Paul von Hippel
William Cochran

Seminal works

higgins-thompson-2002
higgins-2003

Frequently asked questions

I-squared 75% หมายความว่าอย่างไร?: บ่งชี้ว่าประมาณสามในสี่ของความแปรปรวนทั้งหมดในค่าประมาณของงานวิจัยสะท้อนถึงความแตกต่างระหว่างงานวิจัยที่แท้จริงมากกว่าความคลาดเคลื่อนจากการสุ่มตัวอย่าง อย่างไรก็ตาม เนื่องจาก I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัย จึงควรตีความควบคู่ไปกับการกระจายผลกระทบที่แท้จริง ไม่ใช่เทียบกับป้ายกำกับคงที่
ความแตกต่างหลากหลายสูงเป็นเหตุผลที่ไม่ควรรวมงานวิจัยหรือไม่?: ไม่จำเป็นเสมอไป ความแตกต่างหลากหลายสูงบ่งชี้ว่างานวิจัยมีความแตกต่างกันและกระตุ้นให้มีการตรวจสอบสาเหตุ แต่การจะรวมงานวิจัย ใช้แบบจำลองสุ่มผลกระทบ หรือละเว้นนั้นขึ้นอยู่กับว่าความแตกต่างนั้นสามารถอธิบายได้หรือไม่ และงานวิจัยนั้นเปรียบเทียบกันได้ทางคลินิกหรือไม่