ความแตกต่างหลากหลายในการวิเคราะห์อภิมาน
ความแตกต่างหลากหลายในการวิเคราะห์อภิมานคือความแปรปรวนของผลกระทบที่แท้จริงในงานวิจัยที่นำมารวมกัน ซึ่งเกินกว่าที่ความคลาดเคลื่อนจากการสุ่มตัวอย่างเพียงอย่างเดียวจะก่อให้เกิดได้ การวัดและตีความสิ่งนี้จะบอกนักวิเคราะห์ว่างานวิจัยเหล่านั้นกำลังประเมินสิ่งเดียวกันโดยพื้นฐาน หรือเป็นสิ่งต่างกันอย่างแท้จริง ซึ่งจะส่งผลต่อทั้งแบบจำลองที่ใช้และความเชื่อมั่นในผลสรุป
Definition
ความแตกต่างหลากหลายคือระดับที่ผลกระทบที่แท้จริงซึ่งประเมินโดยงานวิจัยแต่ละชิ้นในการวิเคราะห์อภิมานแตกต่างกัน โดยวัดปริมาณด้วยสถิติ เช่น Cochran's Q, I-squared (สัดส่วนของความแปรปรวนทั้งหมดที่เกิดจากความแตกต่างระหว่างงานวิจัยมากกว่าความบังเอิญ) และ tau-squared (ความแปรปรวนระหว่างงานวิจัยที่ประมาณค่าได้)
Scope
บทความนี้ครอบคลุมการประเมินทางสถิติของความแตกต่างหลากหลายระหว่างงานวิจัย: การทดสอบ Cochran Q, สถิติ I-squared, ความแปรปรวนระหว่างงานวิจัย tau-squared และข้อจำกัดที่เป็นที่ทราบกันดีของมาตรการเหล่านี้ บทความนี้ถือว่าความแตกต่างหลากหลายเป็นหัวข้อทางระเบียบวิธีวิจัยภายในการสังเคราะห์หลักฐาน และนำเสนอคำอธิบายอ้างอิง ไม่ใช่คำแนะนำทางคลินิก
Core questions
- งานวิจัยที่รวมอยู่ประมาณค่าผลกระทบร่วมกันหนึ่งอย่างหรือผลกระทบที่แตกต่างกันหลายอย่าง?
- ความแปรปรวนที่สังเกตได้เป็นความแตกต่างระหว่างงานวิจัยจริง ๆ เทียบกับสัญญาณรบกวนจากการสุ่มตัวอย่างมากน้อยเพียงใด?
- ควรตีความ I-squared และ tau-squared อย่างไร และในกรณีใดที่อาจทำให้เข้าใจผิด?
- เมื่อใดที่ความแตกต่างหลากหลายทำให้การประมาณค่ารวมเพียงค่าเดียวไม่เหมาะสม?
Key concepts
- การทดสอบ Cochran's Q
- สถิติ I-squared
- Tau-squared (ความแปรปรวนระหว่างงานวิจัย)
- ความแตกต่างหลากหลายทางคลินิกเทียบกับทางสถิติ
- ช่วงการพยากรณ์
- การวิเคราะห์กลุ่มย่อยเพื่อตอบสนองต่อความแตกต่างหลากหลาย
Mechanisms
ความแปรปรวนทั้งหมดในค่าประมาณของงานวิจัยถูกแบ่งออกเป็นความคลาดเคลื่อนจากการสุ่มตัวอย่างภายในงานวิจัยและความแปรปรวนที่แท้จริงระหว่างงานวิจัย การทดสอบ Cochran's Q เปรียบเทียบการกระจายที่สังเกตได้กับสิ่งที่ความคลาดเคลื่อนจากการสุ่มตัวอย่างเพียงอย่างเดียวคาดการณ์ไว้ เนื่องจาก Q มีกำลังการทดสอบต่ำเมื่อมีงานวิจัยน้อย Higgins และ Thompson จึงเสนอ I-squared ซึ่งเป็นเปอร์เซ็นต์ของความแปรปรวนทั้งหมดที่เกิดจากความแตกต่างหลากหลายระหว่างงานวิจัยมากกว่าความบังเอิญ ซึ่งไม่ขึ้นอยู่กับจำนวนงานวิจัย Tau-squared ประมาณค่าความแปรปรวนของการกระจายผลกระทบพื้นฐานและนำไปใช้โดยตรงในการถ่วงน้ำหนักแบบสุ่มผลกระทบและช่วงการพยากรณ์ ข้อควรระวังที่สำคัญมีดังนี้: Rücker และคณะแสดงให้เห็นว่า I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัยที่รวมอยู่ ดังนั้นจึงอาจมีค่าสูงได้เพียงเพราะงานวิจัยมีความแม่นยำ และ von Hippel แสดงให้เห็นว่ามันไม่เสถียรและอาจมีอคติในการวิเคราะห์อภิมานขนาดเล็ก ดังนั้นสถิติเหล่านี้จึงต้องอ่านควบคู่ไปกับการกระจายสัมบูรณ์ของผลกระทบมากกว่าการเทียบกับเกณฑ์คงที่
Clinical relevance
การสรุปผลงานวิจัยจำนวนมากจะขึ้นอยู่กับความแตกต่างหลากหลายอย่างมาก ดังนั้นการประเมินสถิติความแตกต่างหลากหลายจึงเป็นส่วนหนึ่งของการตัดสินว่าผลลัพธ์รวมควรได้รับน้ำหนักเท่าใดในแนวทางปฏิบัติและการประเมินเทคโนโลยีสุขภาพ บทความนี้อธิบายวิธีการวัดความแตกต่างหลากหลายและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล
Evidence & guidelines
คู่มือ Cochrane อธิบายแนวปฏิบัติที่คาดหวังสำหรับการประเมินและรายงานความแตกต่างหลากหลาย รวมถึงการใช้ I-squared พร้อมการตีความที่ระมัดระวังและบทบาทของช่วงการพยากรณ์ ซึ่งสอดคล้องกับวรรณกรรมระเบียบวิธีวิจัยที่สรุปไว้ในที่นี้
History
การทดสอบ Cochran's Q สำหรับการรวมการทดลองมีมาตั้งแต่สถิติกลางศตวรรษที่ยี่สิบ แต่พิสูจน์แล้วว่ามีกำลังการทดสอบไม่เพียงพอสำหรับจำนวนงานวิจัยที่น้อยซึ่งพบได้ทั่วไปในการวิเคราะห์อภิมานทางคลินิก บทความของ Higgins และ Thompson ในปี 2002 ตามด้วยบทความ BMJ ที่อ้างอิงอย่างกว้างขวางในปี 2003 ได้นำเสนอ I-squared เป็นมาตรการที่ตีความได้และไม่ขึ้นอยู่กับขนาดตัวอย่าง หลังจากนั้นวรรณกรรมแก้ไข (Rücker et al., 2008; von Hippel, 2015) ได้ชี้แจงการพึ่งพาความแม่นยำของงานวิจัยและความไม่เสถียรในการสังเคราะห์ขนาดเล็ก
Debates
- ควรพึ่งพา I-squared มากน้อยเพียงใดในการตัดสินความแตกต่างหลากหลาย?
- I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัยที่รวมอยู่และอาจไม่เสถียรเมื่อรวมงานวิจัยจำนวนน้อย ดังนั้นผู้แสดงความคิดเห็นจึงเตือนไม่ให้ใช้เกณฑ์ตายตัวและแนะนำให้อ่านควบคู่ไปกับ tau-squared และการกระจายสัมบูรณ์ของผลกระทบ
Key figures
- Julian Higgins
- Simon Thompson
- Gerta Rücker
- Paul von Hippel
- William Cochran
Related topics
Seminal works
- higgins-thompson-2002
- higgins-2003
Frequently asked questions
- I-squared 75% หมายความว่าอย่างไร?
- บ่งชี้ว่าประมาณสามในสี่ของความแปรปรวนทั้งหมดในค่าประมาณของงานวิจัยสะท้อนถึงความแตกต่างระหว่างงานวิจัยที่แท้จริงมากกว่าความคลาดเคลื่อนจากการสุ่มตัวอย่าง อย่างไรก็ตาม เนื่องจาก I-squared ขึ้นอยู่กับความแม่นยำของงานวิจัย จึงควรตีความควบคู่ไปกับการกระจายผลกระทบที่แท้จริง ไม่ใช่เทียบกับป้ายกำกับคงที่
- ความแตกต่างหลากหลายสูงเป็นเหตุผลที่ไม่ควรรวมงานวิจัยหรือไม่?
- ไม่จำเป็นเสมอไป ความแตกต่างหลากหลายสูงบ่งชี้ว่างานวิจัยมีความแตกต่างกันและกระตุ้นให้มีการตรวจสอบสาเหตุ แต่การจะรวมงานวิจัย ใช้แบบจำลองสุ่มผลกระทบ หรือละเว้นนั้นขึ้นอยู่กับว่าความแตกต่างนั้นสามารถอธิบายได้หรือไม่ และงานวิจัยนั้นเปรียบเทียบกันได้ทางคลินิกหรือไม่