การประเมินความเสี่ยงของการมีอคติ
การประเมินความเสี่ยงของการมีอคติคือการประเมินอย่างมีโครงสร้างว่าการออกแบบ การดำเนินการ และการรายงานผลการศึกษา มีแนวโน้มที่จะบิดเบือนผลลัพธ์ไปจากความจริงมากน้อยเพียงใด ซึ่งแตกต่างจากลำดับชั้นของหลักฐานที่จัดอันดับการออกแบบโดยทั่วไป โดยจะพิจารณาการศึกษาแต่ละรายการ โดยตั้งคำถามว่าลักษณะต่างๆ เช่น วิธีการจัดสรรผู้เข้าร่วม การปกปิดข้อมูล การคงอยู่ของผู้เข้าร่วม และการวิเคราะห์ข้อมูล อาจทำให้เกิดอคติต่อผลกระทบที่ประเมินได้หรือไม่
Definition
การประเมินความเสี่ยงของการมีอคติคือการประเมินความถูกต้องภายในของการศึกษาแต่ละรายการโดยพิจารณาจากขอบเขต โดยตัดสินว่าข้อบกพร่องในการออกแบบ การดำเนินการ หรือการรายงานผล มีแนวโน้มที่จะทำให้เกิดความคลาดเคลื่อนอย่างเป็นระบบในผลกระทบที่ประเมินได้สำหรับแต่ละขอบเขตที่เกี่ยวข้องหรือไม่
Scope
เนื้อหานี้ครอบคลุมแนวคิดของอคติในฐานะความคลาดเคลื่อนอย่างเป็นระบบ ขอบเขตมาตรฐานที่ประเมินในการศึกษาแบบสุ่มและไม่สุ่ม และเครื่องมือ Cochrane หลักที่ใช้ในการตัดสินใจเหล่านี้ เป็นข้อมูลอ้างอิงทางระเบียบวิธีเกี่ยวกับการประเมินระดับการศึกษา ไม่ใช่คำแนะนำทางคลินิก
Key concepts
- อคติในฐานะความคลาดเคลื่อนอย่างเป็นระบบ (ไม่ใช่แบบสุ่ม)
- ความถูกต้องภายใน
- อคติในการเลือก / การสุ่มและการปกปิดการจัดสรร
- อคติในการดำเนินการและการตรวจจับ / การปกปิดข้อมูล
- อคติจากการสูญหาย / ข้อมูลผลลัพธ์ไม่สมบูรณ์
- อคติในการรายงาน / การรายงานผลลัพธ์แบบเลือก
- การตัดสินโดยพิจารณาจากขอบเขต (ความเสี่ยงต่ำ / มีข้อกังวลบางประการหรือไม่ชัดเจน / สูง)
- ปัจจัยรบกวนในการศึกษาที่ไม่ใช่แบบสุ่ม
Mechanisms
การประเมินจะดำเนินการตามขอบเขต ซึ่งแต่ละขอบเขตจะระบุช่องทางที่ความคลาดเคลื่อนอย่างเป็นระบบสามารถเกิดขึ้นได้ ในการทดลองแบบสุ่ม สิ่งเหล่านี้รวมถึงกระบวนการสุ่ม การเบี่ยงเบนจากการแทรกแซงที่ตั้งใจไว้ ข้อมูลผลลัพธ์ที่ขาดหายไป การวัดผลลัพธ์ และการเลือกผลลัพธ์ที่รายงาน สำหรับแต่ละรายการ ผู้ทบทวนจะตัดสินความเสี่ยงว่าเป็นต่ำ มีข้อกังวลบางประการ (หรือไม่ชัดเจน) หรือสูง โดยมักจะได้รับคำแนะนำจากคำถามนำร่องและสรุปผลการตัดสินโดยรวม การศึกษาการแทรกแซงที่ไม่ใช่แบบสุ่มจะเพิ่มปัจจัยรบกวนและการเลือกผู้เข้าร่วมเป็นขอบเขตหลัก เนื่องจากหากไม่มีการสุ่ม สิ่งเหล่านี้คือภัยคุกคามที่สำคัญ ผลลัพธ์ที่ได้คือการประเมินที่โปร่งใสและทำซ้ำได้ ซึ่งนำไปสู่การสังเคราะห์หลักฐานและการจัดอันดับความน่าเชื่อถือ แทนที่จะเป็นคะแนนสรุปเพียงคะแนนเดียว
Clinical relevance
การตัดสินความเสี่ยงของการมีอคติอธิบายว่าเหตุใดการศึกษาสองชิ้นที่มีคำถามเดียวกันอาจได้รับน้ำหนักที่แตกต่างกัน และเหตุใดชุดของหลักฐานอาจถูกลดระดับลงเนื่องจากข้อจำกัดของการศึกษา สิ่งเหล่านี้ช่วยให้ผู้อ่านเห็นว่าผลลัพธ์มีแนวโน้มที่จะสะท้อนถึงผลกระทบที่แท้จริงหรือเป็นสิ่งประดิษฐ์จากวิธีการดำเนินการศึกษาหรือไม่ เนื้อหานี้อธิบายระเบียบวิธีประเมินและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล
Evidence & guidelines
เครื่องมือประเมินความเสี่ยงของการมีอคติของ Cochrane (Higgins et al., 2011) ได้กำหนดมาตรฐานการประเมินการทดลองแบบสุ่มโดยพิจารณาจากขอบเขต และถูกแทนที่ด้วย RoB 2 (Sterne et al., 2019) ซึ่งปรับโครงสร้างขอบเขตและเพิ่มคำถามนำร่อง ROBINS-I (Sterne et al., 2016) ได้ขยายแนวทางนี้ไปสู่การศึกษาการแทรกแซงที่ไม่ใช่แบบสุ่ม โดยเน้นที่ปัจจัยรบกวนและการเลือก ใน GRADE ความเสี่ยงของการมีอคติในระดับการศึกษาเป็นปัจจัยแรกที่สามารถลดความน่าเชื่อถือของชุดหลักฐานได้ (Guyatt et al., 2008)
History
การให้คะแนนคุณภาพของการทดลองในช่วงทศวรรษ 1980 และ 1990 อาศัยมาตราส่วนตัวเลขซึ่งมีองค์ประกอบและน้ำหนักที่แตกต่างกันอย่างมาก Cochrane Collaboration ได้เปลี่ยนการประเมินไปสู่การตัดสินที่ชัดเจนโดยพิจารณาจากขอบเขตด้วยเครื่องมือประเมินความเสี่ยงของการมีอคติในปี 2011 โดยให้ความสำคัญกับความโปร่งใสมากกว่าคะแนนสรุป RoB 2 (2019) ได้ปรับปรุงขอบเขตการทดลองแบบสุ่มและแนะนำคำถามนำร่อง ในขณะที่ ROBINS-I (2016) ได้นำกรอบการทำงานที่คล้ายกันซึ่งเน้นปัจจัยรบกวนมาใช้กับการศึกษาที่ไม่ใช่แบบสุ่ม
Debates
- การตัดสินโดยพิจารณาจากขอบเขตเทียบกับคะแนนคุณภาพเชิงตัวเลข
- คะแนนคุณภาพแบบรวมสามารถบดบังว่าข้อบกพร่องเฉพาะใดมีความสำคัญและมากน้อยเพียงใด ดังนั้นเครื่องมือสมัยใหม่จึงนิยมการตัดสินที่โปร่งใสในแต่ละขอบเขต นักวิจารณ์ตั้งข้อสังเกตว่าการตัดสินในแต่ละขอบเขตยังคงต้องอาศัยการตัดสินใจส่วนบุคคลและอาจแตกต่างกันไปในแต่ละผู้ประเมิน
Key figures
- Julian Higgins
- Jonathan Sterne
- Douglas Altman
- Miguel Hernan
Related topics
Seminal works
- higgins-2011-robtool
- sterne-2019-rob2
- sterne-2016-robinsi
Frequently asked questions
- ความเสี่ยงของการมีอคติแตกต่างจากลำดับชั้นของหลักฐานอย่างไร?
- ลำดับชั้นจะจัดอันดับการออกแบบโดยทั่วไปตามความอ่อนแอต่ออคติโดยทั่วไป ในขณะที่การประเมินความเสี่ยงของการมีอคติจะประเมินว่าการศึกษาเฉพาะเจาะจงหนึ่งชิ้นได้รับการดำเนินการมาดีเพียงใด ดังนั้นการออกแบบที่อยู่ในอันดับสูงก็ยังคงมีความเสี่ยงของการมีอคติสูงได้
- เหตุใดคะแนนคุณภาพเชิงตัวเลขจึงไม่เป็นที่นิยมอีกต่อไป?
- คะแนนรวมจะรวมคุณสมบัติที่ไม่เกี่ยวข้องกันเข้าไว้ในตัวเลขเดียวและซ่อนว่าข้อบกพร่องใดเป็นตัวขับเคลื่อนผลลัพธ์ ในทางกลับกัน เครื่องมือที่อิงตามขอบเขตจะทำการตัดสินแยกต่างหากและโปร่งใสสำหรับแหล่งที่มาของอคติที่เป็นไปได้แต่ละแหล่ง