ลำดับชั้นของหลักฐานและการประเมินคุณภาพ
ลำดับชั้นของหลักฐานและการประเมินคุณภาพเป็นวิธีการที่การดูแลสุขภาพโดยอาศัยหลักฐานเชิงประจักษ์ใช้ในการตัดสินใจว่างานวิจัยชุดหนึ่งมีความน่าเชื่อถือเพียงใด วิธีการเหล่านี้จัดอันดับการออกแบบการศึกษาตามความอ่อนไหวต่ออคติ ประเมินความถูกต้องภายในของการศึกษาแต่ละชิ้น และให้คะแนนความแน่นอนโดยรวมของหลักฐานสำหรับคำถามที่กำหนด เพื่อให้แนวทางปฏิบัติทางคลินิกและการประเมินเทคโนโลยีสุขภาพอยู่บนพื้นฐานของการอ่านวรรณกรรมที่ชัดเจนและทำซ้ำได้
Definition
การประเมินหลักฐานคือการประเมินอย่างมีโครงสร้างว่าหลักฐานการวิจัยมีความน่าเชื่อถือเพียงใดในการตอบคำถามที่กำหนด โดยรวมลำดับชั้นของการออกแบบการศึกษา การประเมินความเสี่ยงของอคติในระดับการศึกษา และการตัดสินที่ให้คะแนนความแน่นอนของหลักฐานโดยรวม
Scope
ส่วนนี้จะแนะนำผู้อ่านให้รู้จักกับสี่หัวข้อที่เชื่อมโยงกัน: ลำดับชั้นของหลักฐานตามการออกแบบแบบดั้งเดิมและการปรับปรุงให้ทันสมัย; แนวทาง GRADE ในการให้คะแนนหลักฐานและข้อเสนอแนะ; การประเมินความเสี่ยงของอคติของการศึกษาแต่ละชิ้น; และการให้คะแนนความแน่นอน (ความเชื่อมั่น) โดยรวมในชุดของหลักฐาน โดยถือว่าสิ่งเหล่านี้เป็นวิธีการประเมินภายในแนวปฏิบัติที่อิงหลักฐานเชิงประจักษ์และการประเมินเทคโนโลยีสุขภาพ ไม่ใช่คำแนะนำทางคลินิก
Sub-topics
Key concepts
- ลำดับชั้นของหลักฐาน / ระดับของหลักฐาน
- ความถูกต้องภายในเทียบกับความถูกต้องภายนอก
- ความเสี่ยงของอคติ
- ความแน่นอน (คุณภาพ) ของหลักฐาน
- กรอบการให้คะแนน GRADE
- ความแข็งแกร่งของข้อเสนอแนะเทียบกับความแน่นอนของหลักฐาน
- ชุดของหลักฐานเทียบกับการศึกษาเดี่ยว
Clinical relevance
วิธีการเหล่านี้เป็นรากฐานว่าแนวทางปฏิบัติทางคลินิก การทบทวนอย่างเป็นระบบ และการประเมินเทคโนโลยีสุขภาพ แปลงานวิจัยไปสู่ข้อความที่ให้คะแนนอย่างไร การทำความเข้าใจสิ่งเหล่านี้ช่วยให้แพทย์และผู้มีอำนาจตัดสินใจตีความว่าทำไมข้อเสนอแนะหนึ่งจึงถูกระบุว่าแข็งแกร่งและมีหลักฐานสนับสนุนที่ดี ในขณะที่อีกข้อเสนอแนะหนึ่งมีเงื่อนไขและไม่แน่นอน; ส่วนนี้อธิบายวิธีการประเมินหลักฐานและไม่ใช่แหล่งที่มาของคำแนะนำการรักษาเฉพาะบุคคล
Evidence & guidelines
การประเมินสมัยใหม่ได้บรรจบกันในกรอบการทำงานที่ได้รับการยอมรับอย่างกว้างขวางไม่กี่อย่าง: GRADE สำหรับการให้คะแนนความแน่นอนของหลักฐานและความแข็งแกร่งของข้อเสนอแนะ (Guyatt et al., 2008), เครื่องมือความเสี่ยงของอคติและคู่มือของ Cochrane สำหรับการประเมินระดับการศึกษา (Higgins et al., 2019) และพีระมิดหลักฐานที่ได้รับการปรับปรุงซึ่งวางการทบทวนอย่างเป็นระบบเป็นเลนส์เหนือลำดับชั้นของการออกแบบมากกว่าที่จะอยู่บนสุด (Murad et al., 2016) ปรัชญาพื้นฐานของการบูรณาการหลักฐานที่ดีที่สุดเข้ากับความเชี่ยวชาญและคุณค่าของผู้ป่วยสืบย้อนไปถึง Sackett et al. (1996)
History
วลี 'เวชปฏิบัติอิงหลักฐาน' (evidence-based medicine) ได้รับความนิยมในช่วงต้นทศวรรษ 1990 โดยต่อยอดจากระบาดวิทยาคลินิกของ David Sackett และบทบรรณาธิการของ BMJ ในปี 1996 ที่นิยามว่าเป็นบูรณาการอย่างรอบคอบของหลักฐานที่ดีที่สุดที่มีอยู่เข้ากับความเชี่ยวชาญทางคลินิกและคุณค่าของผู้ป่วย ลำดับชั้นแรกๆ จัดอันดับการทดลองแบบสุ่มไว้สูงกว่าการศึกษาเชิงสังเกตการณ์ ตลอดสองทศวรรษต่อมา GRADE ได้ปรับกรอบการให้คะแนนโดยเน้นความแน่นอนที่เฉพาะเจาะจงกับผลลัพธ์ และพีระมิดหลักฐานได้รับการปรับปรุงเพื่อสะท้อนบทบาทของการทบทวนอย่างเป็นระบบและข้อจำกัดของการจัดอันดับการออกแบบที่เข้มงวด
Debates
- ลำดับชั้นที่อิงการออกแบบที่ตายตัวยังคงเพียงพอหรือไม่?
- นักวิจารณ์โต้แย้งว่าการจัดอันดับตามการออกแบบเพียงอย่างเดียวนั้นเข้มงวดเกินไป เนื่องจากงานวิจัยเชิงสังเกตการณ์ที่ดำเนินการอย่างดีอาจมีอันดับสูงกว่าการทดลองที่มีข้อบกพร่อง พีระมิดที่ได้รับการปรับปรุงและ GRADE ได้เปลี่ยนจุดเน้นจากการจัดอันดับการออกแบบไปสู่ความแน่นอนของหลักฐานสำหรับแต่ละผลลัพธ์
Key figures
- David Sackett
- Gordon Guyatt
- Julian Higgins
- Andrew Oxman
- M. Hassan Murad
Related topics
Seminal works
- sackett-1996
- guyatt-2008-grade
- murad-2016-pyramid
Frequently asked questions
- ความแตกต่างระหว่างลำดับชั้นของหลักฐานกับการประเมินความเสี่ยงของอคติคืออะไร?
- ลำดับชั้นจะจัดอันดับการออกแบบการศึกษาตามความอ่อนแอทั่วไปต่ออคติ ในขณะที่การประเมินความเสี่ยงของอคติจะประเมินว่าการศึกษาเฉพาะเจาะจงนั้นดำเนินการได้ดีเพียงใด การออกแบบที่มีอันดับสูงก็ยังคงมีความเสี่ยงสูงต่ออคติได้
- ทำไมความแน่นอนของหลักฐานจึงมีความสำคัญควบคู่ไปกับการออกแบบการศึกษา?
- เนื่องจากความน่าเชื่อถือของข้อสรุปไม่ได้ขึ้นอยู่กับการออกแบบเท่านั้น แต่ยังขึ้นอยู่กับวิธีการดำเนินการศึกษา ความสอดคล้องและความแม่นยำของผลลัพธ์ และความตรงไปตรงมาในการตอบคำถาม ดังนั้นความแน่นอนจึงถูกให้คะแนนจากชุดของหลักฐานทั้งหมด แทนที่จะอ่านจากอันดับการออกแบบเพียงอย่างเดียว