ความเสี่ยงของการมีอคติแตกต่างจากลำดับชั้นของหลักฐานอย่างไร?

ลำดับชั้นจะจัดอันดับการออกแบบโดยทั่วไปตามความอ่อนแอต่ออคติโดยทั่วไป ในขณะที่การประเมินความเสี่ยงของการมีอคติจะประเมินว่าการศึกษาเฉพาะเจาะจงหนึ่งชิ้นได้รับการดำเนินการมาดีเพียงใด ดังนั้นการออกแบบที่อยู่ในอันดับสูงก็ยังคงมีความเสี่ยงของการมีอคติสูงได้

เหตุใดคะแนนคุณภาพเชิงตัวเลขจึงไม่เป็นที่นิยมอีกต่อไป?

คะแนนรวมจะรวมคุณสมบัติที่ไม่เกี่ยวข้องกันเข้าไว้ในตัวเลขเดียวและซ่อนว่าข้อบกพร่องใดเป็นตัวขับเคลื่อนผลลัพธ์ ในทางกลับกัน เครื่องมือที่อิงตามขอบเขตจะทำการตัดสินแยกต่างหากและโปร่งใสสำหรับแหล่งที่มาของอคติที่เป็นไปได้แต่ละแหล่ง

การประเมินความเสี่ยงของการมีอคติ

การประเมินความเสี่ยงของการมีอคติคือการประเมินอย่างมีโครงสร้างว่าการออกแบบ การดำเนินการ และการรายงานผลการศึกษา มีแนวโน้มที่จะบิดเบือนผลลัพธ์ไปจากความจริงมากน้อยเพียงใด ซึ่งแตกต่างจากลำดับชั้นของหลักฐานที่จัดอันดับการออกแบบโดยทั่วไป โดยจะพิจารณาการศึกษาแต่ละรายการ โดยตั้งคำถามว่าลักษณะต่างๆ เช่น วิธีการจัดสรรผู้เข้าร่วม การปกปิดข้อมูล การคงอยู่ของผู้เข้าร่วม และการวิเคราะห์ข้อมูล อาจทำให้เกิดอคติต่อผลกระทบที่ประเมินได้หรือไม่

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การประเมินความเสี่ยงของการมีอคติคือการประเมินความถูกต้องภายในของการศึกษาแต่ละรายการโดยพิจารณาจากขอบเขต โดยตัดสินว่าข้อบกพร่องในการออกแบบ การดำเนินการ หรือการรายงานผล มีแนวโน้มที่จะทำให้เกิดความคลาดเคลื่อนอย่างเป็นระบบในผลกระทบที่ประเมินได้สำหรับแต่ละขอบเขตที่เกี่ยวข้องหรือไม่

Scope

เนื้อหานี้ครอบคลุมแนวคิดของอคติในฐานะความคลาดเคลื่อนอย่างเป็นระบบ ขอบเขตมาตรฐานที่ประเมินในการศึกษาแบบสุ่มและไม่สุ่ม และเครื่องมือ Cochrane หลักที่ใช้ในการตัดสินใจเหล่านี้ เป็นข้อมูลอ้างอิงทางระเบียบวิธีเกี่ยวกับการประเมินระดับการศึกษา ไม่ใช่คำแนะนำทางคลินิก

Key concepts

อคติในฐานะความคลาดเคลื่อนอย่างเป็นระบบ (ไม่ใช่แบบสุ่ม)
ความถูกต้องภายใน
อคติในการเลือก / การสุ่มและการปกปิดการจัดสรร
อคติในการดำเนินการและการตรวจจับ / การปกปิดข้อมูล
อคติจากการสูญหาย / ข้อมูลผลลัพธ์ไม่สมบูรณ์
อคติในการรายงาน / การรายงานผลลัพธ์แบบเลือก
การตัดสินโดยพิจารณาจากขอบเขต (ความเสี่ยงต่ำ / มีข้อกังวลบางประการหรือไม่ชัดเจน / สูง)
ปัจจัยรบกวนในการศึกษาที่ไม่ใช่แบบสุ่ม

Mechanisms

การประเมินจะดำเนินการตามขอบเขต ซึ่งแต่ละขอบเขตจะระบุช่องทางที่ความคลาดเคลื่อนอย่างเป็นระบบสามารถเกิดขึ้นได้ ในการทดลองแบบสุ่ม สิ่งเหล่านี้รวมถึงกระบวนการสุ่ม การเบี่ยงเบนจากการแทรกแซงที่ตั้งใจไว้ ข้อมูลผลลัพธ์ที่ขาดหายไป การวัดผลลัพธ์ และการเลือกผลลัพธ์ที่รายงาน สำหรับแต่ละรายการ ผู้ทบทวนจะตัดสินความเสี่ยงว่าเป็นต่ำ มีข้อกังวลบางประการ (หรือไม่ชัดเจน) หรือสูง โดยมักจะได้รับคำแนะนำจากคำถามนำร่องและสรุปผลการตัดสินโดยรวม การศึกษาการแทรกแซงที่ไม่ใช่แบบสุ่มจะเพิ่มปัจจัยรบกวนและการเลือกผู้เข้าร่วมเป็นขอบเขตหลัก เนื่องจากหากไม่มีการสุ่ม สิ่งเหล่านี้คือภัยคุกคามที่สำคัญ ผลลัพธ์ที่ได้คือการประเมินที่โปร่งใสและทำซ้ำได้ ซึ่งนำไปสู่การสังเคราะห์หลักฐานและการจัดอันดับความน่าเชื่อถือ แทนที่จะเป็นคะแนนสรุปเพียงคะแนนเดียว

Clinical relevance

การตัดสินความเสี่ยงของการมีอคติอธิบายว่าเหตุใดการศึกษาสองชิ้นที่มีคำถามเดียวกันอาจได้รับน้ำหนักที่แตกต่างกัน และเหตุใดชุดของหลักฐานอาจถูกลดระดับลงเนื่องจากข้อจำกัดของการศึกษา สิ่งเหล่านี้ช่วยให้ผู้อ่านเห็นว่าผลลัพธ์มีแนวโน้มที่จะสะท้อนถึงผลกระทบที่แท้จริงหรือเป็นสิ่งประดิษฐ์จากวิธีการดำเนินการศึกษาหรือไม่ เนื้อหานี้อธิบายระเบียบวิธีประเมินและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล

Evidence & guidelines

เครื่องมือประเมินความเสี่ยงของการมีอคติของ Cochrane (Higgins et al., 2011) ได้กำหนดมาตรฐานการประเมินการทดลองแบบสุ่มโดยพิจารณาจากขอบเขต และถูกแทนที่ด้วย RoB 2 (Sterne et al., 2019) ซึ่งปรับโครงสร้างขอบเขตและเพิ่มคำถามนำร่อง ROBINS-I (Sterne et al., 2016) ได้ขยายแนวทางนี้ไปสู่การศึกษาการแทรกแซงที่ไม่ใช่แบบสุ่ม โดยเน้นที่ปัจจัยรบกวนและการเลือก ใน GRADE ความเสี่ยงของการมีอคติในระดับการศึกษาเป็นปัจจัยแรกที่สามารถลดความน่าเชื่อถือของชุดหลักฐานได้ (Guyatt et al., 2008)

History

การให้คะแนนคุณภาพของการทดลองในช่วงทศวรรษ 1980 และ 1990 อาศัยมาตราส่วนตัวเลขซึ่งมีองค์ประกอบและน้ำหนักที่แตกต่างกันอย่างมาก Cochrane Collaboration ได้เปลี่ยนการประเมินไปสู่การตัดสินที่ชัดเจนโดยพิจารณาจากขอบเขตด้วยเครื่องมือประเมินความเสี่ยงของการมีอคติในปี 2011 โดยให้ความสำคัญกับความโปร่งใสมากกว่าคะแนนสรุป RoB 2 (2019) ได้ปรับปรุงขอบเขตการทดลองแบบสุ่มและแนะนำคำถามนำร่อง ในขณะที่ ROBINS-I (2016) ได้นำกรอบการทำงานที่คล้ายกันซึ่งเน้นปัจจัยรบกวนมาใช้กับการศึกษาที่ไม่ใช่แบบสุ่ม

Debates

การตัดสินโดยพิจารณาจากขอบเขตเทียบกับคะแนนคุณภาพเชิงตัวเลข: คะแนนคุณภาพแบบรวมสามารถบดบังว่าข้อบกพร่องเฉพาะใดมีความสำคัญและมากน้อยเพียงใด ดังนั้นเครื่องมือสมัยใหม่จึงนิยมการตัดสินที่โปร่งใสในแต่ละขอบเขต นักวิจารณ์ตั้งข้อสังเกตว่าการตัดสินในแต่ละขอบเขตยังคงต้องอาศัยการตัดสินใจส่วนบุคคลและอาจแตกต่างกันไปในแต่ละผู้ประเมิน

Key figures

Julian Higgins
Jonathan Sterne
Douglas Altman
Miguel Hernan

Seminal works

higgins-2011-robtool
sterne-2019-rob2
sterne-2016-robinsi

Frequently asked questions

ความเสี่ยงของการมีอคติแตกต่างจากลำดับชั้นของหลักฐานอย่างไร?: ลำดับชั้นจะจัดอันดับการออกแบบโดยทั่วไปตามความอ่อนแอต่ออคติโดยทั่วไป ในขณะที่การประเมินความเสี่ยงของการมีอคติจะประเมินว่าการศึกษาเฉพาะเจาะจงหนึ่งชิ้นได้รับการดำเนินการมาดีเพียงใด ดังนั้นการออกแบบที่อยู่ในอันดับสูงก็ยังคงมีความเสี่ยงของการมีอคติสูงได้
เหตุใดคะแนนคุณภาพเชิงตัวเลขจึงไม่เป็นที่นิยมอีกต่อไป?: คะแนนรวมจะรวมคุณสมบัติที่ไม่เกี่ยวข้องกันเข้าไว้ในตัวเลขเดียวและซ่อนว่าข้อบกพร่องใดเป็นตัวขับเคลื่อนผลลัพธ์ ในทางกลับกัน เครื่องมือที่อิงตามขอบเขตจะทำการตัดสินแยกต่างหากและโปร่งใสสำหรับแหล่งที่มาของอคติที่เป็นไปได้แต่ละแหล่ง