การประเมินอย่างมีวิจารณญาณและการประเมินหลักฐานรายบุคคล
การประเมินอย่างมีวิจารณญาณเป็นกระบวนการที่มีโครงสร้างในการตรวจสอบงานวิจัยแต่ละชิ้นอย่างเป็นระบบ เพื่อตัดสินความถูกต้อง ความแม่นยำของผลลัพธ์ และความเกี่ยวข้องกับคำถามที่กำหนด เป็นทักษะเชิงปฏิบัติที่เปลี่ยนจากการอ่านงานวิจัยไปสู่การประเมินงานวิจัย และเป็นหัวใจของการปฏิบัติที่อิงหลักฐาน: ก่อนที่จะนำหลักฐานไปใช้หรือสังเคราะห์ งานวิจัยแต่ละชิ้นจะต้องได้รับการประเมินตามเงื่อนไขของตนเองก่อน
Definition
การประเมินอย่างมีวิจารณญาณคือการประเมินงานวิจัยแต่ละชิ้นอย่างชัดเจนโดยอิงตามเกณฑ์ เพื่อพิจารณาความน่าเชื่อถือของวิธีการ (ความถูกต้องภายใน) ความหมายและความแม่นยำของผลการวิจัย และขอบเขตที่ผลการวิจัยเหล่านั้นสามารถนำไปใช้กับสถานการณ์หรือประชากรอื่น ๆ ได้ (ความถูกต้องภายนอก)
Scope
ส่วนนี้จะแนะนำผู้อ่านถึงวิธีการประเมินงานวิจัยแต่ละชิ้น แทนที่จะเป็นการรวบรวมหลักฐานจำนวนมาก ครอบคลุมคำถามการประเมินทั่วไป (ถูกต้องหรือไม่? ผลลัพธ์เป็นอย่างไร? สามารถนำไปใช้ได้หรือไม่?) เครื่องมือและรายการตรวจสอบที่มีโครงสร้างที่ใช้ในการตอบคำถามเหล่านั้น และมาตรฐานการรายงาน (เช่น CONSORT และ STROBE) ที่ทำให้งานวิจัยมีความโปร่งใสเพียงพอสำหรับการประเมินตั้งแต่แรก เป็นการให้ความรู้เชิงอ้างอิงและไม่ได้ให้คำแนะนำทางคลินิก
Sub-topics
Core questions
- ผลลัพธ์ของการศึกษาแต่ละชิ้นนี้ถูกต้องหรือไม่ เมื่อพิจารณาจากการออกแบบและวิธีการดำเนินการ?
- ผลลัพธ์เป็นอย่างไร และมีความแม่นยำและมีความสำคัญทางคลินิกหรือในทางปฏิบัติมากน้อยเพียงใด?
- ผลลัพธ์สามารถนำไปใช้กับประชากร สถานการณ์ หรือคำถามที่กำลังพิจารณาได้หรือไม่?
- เครื่องมือที่มีโครงสร้างและมาตรฐานการรายงานทำให้งานวิจัยสามารถประเมินได้และลดการตัดสินที่เป็นอัตวิสัยได้อย่างไร?
Key concepts
- ความถูกต้องภายใน
- ความถูกต้องภายนอก (ความสามารถในการสรุปผล)
- ความเสี่ยงของอคติ
- กรอบการประเมินความถูกต้อง-ผลลัพธ์-การนำไปใช้
- มาตรฐานการรายงานเทียบกับคุณภาพของวิธีการวิจัย
- เครื่องมือและรายการตรวจสอบการประเมินอย่างมีวิจารณญาณ
- ความสามารถในการทำซ้ำและความโปร่งใสของการรายงาน
Mechanisms
การประเมินจะดำเนินการโดยการจับคู่การออกแบบงานวิจัยกับอคติที่การออกแบบนั้นมีแนวโน้มที่จะเกิดขึ้น จากนั้นจึงตั้งคำถามว่าผู้เขียนได้ดำเนินการอย่างเพียงพอเพื่อป้องกันอคติเหล่านั้นหรือไม่ กรอบแนวคิด Users' Guides ที่มีการสอนอย่างแพร่หลายได้จัดระเบียบสิ่งนี้ออกเป็นสามคำถามตามลำดับ — ผลลัพธ์ถูกต้องหรือไม่ ผลลัพธ์เป็นอย่างไร และจะช่วยในท้องถิ่นได้หรือไม่ — เพื่อให้การตัดสินความถูกต้องนำหน้าการตีความขนาดผล ซึ่งจะนำหน้าการตัดสินใด ๆ เกี่ยวกับการนำไปใช้ (Guyatt 1993; Greenhalgh 1997) แตกต่างจากการประเมินวิธีการ มาตรฐานการรายงานจะระบุว่าเอกสารต้องเปิดเผยอะไรบ้างเพื่อให้ผู้อ่านมีข้อมูลที่จำเป็นในการประเมินทั้งหมด ทั้งสองส่วนนี้เสริมซึ่งกันและกัน เนื่องจากงานวิจัยที่ดำเนินการได้ดีแต่รายงานไม่ดีไม่สามารถประเมินได้ และงานวิจัยที่รายงานอย่างโปร่งใสก็ยังคงถูกตัดสินว่ามีความเสี่ยงสูงต่ออคติได้
Clinical relevance
การประเมินอย่างมีวิจารณญาณเป็นความสามารถหลักของการปฏิบัติที่อิงหลักฐานในทุกสาขาวิชาชีพด้านสุขภาพ เนื่องจากการนำงานวิจัยไปใช้อย่างมีความรับผิดชอบจำเป็นต้องตัดสินก่อนว่างานวิจัยนั้นน่าเชื่อถือและเกี่ยวข้องหรือไม่ ส่วนนี้จะอธิบายวิธีการประเมินและรายงานงานวิจัยแต่ละชิ้น โดยจะอธิบายลักษณะของหลักฐานมากกว่าการกำหนดการวินิจฉัยหรือการตัดสินใจในการรักษา และไม่ใช่สิ่งทดแทนแนวทางปฏิบัติทางคลินิก
Evidence & guidelines
การประเมินได้รับการสนับสนุนโดยเครื่องมือที่ได้รับการตรวจสอบความถูกต้องและเฉพาะเจาะจงกับการออกแบบ แทนที่จะเป็นรายการตรวจสอบสากลเพียงรายการเดียว การทบทวนอย่างเป็นระบบพบความหลากหลายอย่างมากในเครื่องมือที่เผยแพร่มากกว่าร้อยรายการ โดยไม่มีมาตรฐานทองคำที่ตกลงกันไว้สำหรับการออกแบบใด ๆ (Katrak 2004) มาตรฐานการรายงานที่ได้รับการรับรองโดยวารสารและเครือข่าย EQUATOR — CONSORT สำหรับการทดลองแบบสุ่มและ STROBE สำหรับการศึกษาเชิงสังเกต — เสริมการประเมินโดยการกำหนดมาตรฐานการเปิดเผยข้อมูล ในขณะที่กรอบแนวคิดเช่น GRADE ขยายการประเมินจากงานวิจัยแต่ละชิ้นไปสู่ความแน่นอนของชุดหลักฐาน (Guyatt 2008)
History
การประเมินอย่างมีวิจารณญาณที่มีโครงสร้างพัฒนามาจากการระบาดวิทยาทางคลินิกที่พัฒนาขึ้นที่มหาวิทยาลัย McMaster และการเคลื่อนไหวทางการแพทย์ที่อิงหลักฐานในช่วงทศวรรษ 1990 คำจำกัดความของการแพทย์ที่อิงหลักฐานของ Sackett และคณะได้กำหนดให้การประเมินงานวิจัยแต่ละชิ้นเป็นทักษะทางคลินิกประจำวัน (Sackett 1996) และชุดคู่มือ JAMA Users' Guides ได้กำหนดคำถามการประเมินที่ชัดเจนและเป็นลำดับสำหรับงานวิจัยแต่ละประเภท (Guyatt 1993) หนังสือเบื้องต้นที่อ่านกันอย่างแพร่หลายของ Greenhalgh ได้นำแนวทางเดียวกันนี้ไปสู่กลุ่มผู้ป่วยทางคลินิกในวงกว้าง (Greenhalgh 1997) ในขณะเดียวกัน มาตรฐานการรายงานและเครื่องมือการประเมินเฉพาะทางก็แพร่หลายตั้งแต่ปลายทศวรรษ 1990 เป็นต้นมา ซึ่งในที่สุดก็ได้รับการประสานงานผ่านเครือข่าย EQUATOR
Debates
- คุณภาพการรายงานวัดคุณภาพการศึกษาหรือไม่?
- มาตรฐานการรายงานระบุสิ่งที่เปิดเผย ไม่ใช่ว่าการศึกษาดำเนินการได้ดีหรือไม่ การถือว่าการปฏิบัติตามรายการตรวจสอบการรายงานเป็นมาตรวัดคุณภาพของวิธีการวิจัยเป็นการรวมความโปร่งใสเข้ากับความถูกต้อง และผู้เขียนมาตรฐานส่วนใหญ่เตือนไม่ให้ใช้เป็นคะแนนคุณภาพ
- มีเครื่องมือประเมินที่เป็นมาตรฐานทองคำหรือไม่?
- รายการตรวจสอบที่มีอยู่จำนวนมาก ซึ่งมีเนื้อหาที่ทับซ้อนกันน้อยและไม่มีเครื่องมืออ้างอิงที่ตกลงกันไว้สำหรับการออกแบบใด ๆ ทำให้การประเมินขึ้นอยู่กับเครื่องมือที่เลือกและการตัดสินของผู้ทบทวนบางส่วน
Key figures
- David Sackett
- Gordon Guyatt
- Trisha Greenhalgh
- Andrew Oxman
Related topics
Seminal works
- sackett-1996
- guyatt-1993
- greenhalgh-1997
Frequently asked questions
- การประเมินอย่างมีวิจารณญาณแตกต่างจากการสังเคราะห์หลักฐานอย่างไร?
- การประเมินอย่างมีวิจารณญาณจะประเมินงานวิจัยทีละชิ้น โดยตัดสินความถูกต้องและความเกี่ยวข้อง การสังเคราะห์หลักฐานจะรวมผลการวิจัยจากงานวิจัยที่ได้รับการประเมินหลายชิ้นเข้าด้วยกัน การประเมินงานวิจัยแต่ละชิ้นเป็นขั้นตอนเบื้องต้นที่จำเป็นในการสังเคราะห์
- การปฏิบัติตามรายการตรวจสอบการรายงานเหมือนกับการประเมินงานวิจัยหรือไม่?
- ไม่เหมือนกัน มาตรฐานการรายงานจะบอกคุณว่างานวิจัยเปิดเผยข้อมูลเพียงพอหรือไม่ การประเมินจะใช้ข้อมูลนั้นเพื่อตัดสินว่าวิธีการและผลลัพธ์ของงานวิจัยสามารถเชื่อถือและนำไปใช้ได้หรือไม่ งานวิจัยที่รายงานครบถ้วนก็ยังคงมีความเสี่ยงสูงต่ออคติได้