การประเมินอย่างมีวิจารณญาณแตกต่างจากการสังเคราะห์หลักฐานอย่างไร?

การประเมินอย่างมีวิจารณญาณจะประเมินงานวิจัยทีละชิ้น โดยตัดสินความถูกต้องและความเกี่ยวข้อง การสังเคราะห์หลักฐานจะรวมผลการวิจัยจากงานวิจัยที่ได้รับการประเมินหลายชิ้นเข้าด้วยกัน การประเมินงานวิจัยแต่ละชิ้นเป็นขั้นตอนเบื้องต้นที่จำเป็นในการสังเคราะห์

การปฏิบัติตามรายการตรวจสอบการรายงานเหมือนกับการประเมินงานวิจัยหรือไม่?

ไม่เหมือนกัน มาตรฐานการรายงานจะบอกคุณว่างานวิจัยเปิดเผยข้อมูลเพียงพอหรือไม่ การประเมินจะใช้ข้อมูลนั้นเพื่อตัดสินว่าวิธีการและผลลัพธ์ของงานวิจัยสามารถเชื่อถือและนำไปใช้ได้หรือไม่ งานวิจัยที่รายงานครบถ้วนก็ยังคงมีความเสี่ยงสูงต่ออคติได้

การประเมินอย่างมีวิจารณญาณและการประเมินหลักฐานรายบุคคล

การประเมินอย่างมีวิจารณญาณเป็นกระบวนการที่มีโครงสร้างในการตรวจสอบงานวิจัยแต่ละชิ้นอย่างเป็นระบบ เพื่อตัดสินความถูกต้อง ความแม่นยำของผลลัพธ์ และความเกี่ยวข้องกับคำถามที่กำหนด เป็นทักษะเชิงปฏิบัติที่เปลี่ยนจากการอ่านงานวิจัยไปสู่การประเมินงานวิจัย และเป็นหัวใจของการปฏิบัติที่อิงหลักฐาน: ก่อนที่จะนำหลักฐานไปใช้หรือสังเคราะห์ งานวิจัยแต่ละชิ้นจะต้องได้รับการประเมินตามเงื่อนไขของตนเองก่อน

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การประเมินอย่างมีวิจารณญาณคือการประเมินงานวิจัยแต่ละชิ้นอย่างชัดเจนโดยอิงตามเกณฑ์ เพื่อพิจารณาความน่าเชื่อถือของวิธีการ (ความถูกต้องภายใน) ความหมายและความแม่นยำของผลการวิจัย และขอบเขตที่ผลการวิจัยเหล่านั้นสามารถนำไปใช้กับสถานการณ์หรือประชากรอื่น ๆ ได้ (ความถูกต้องภายนอก)

Scope

ส่วนนี้จะแนะนำผู้อ่านถึงวิธีการประเมินงานวิจัยแต่ละชิ้น แทนที่จะเป็นการรวบรวมหลักฐานจำนวนมาก ครอบคลุมคำถามการประเมินทั่วไป (ถูกต้องหรือไม่? ผลลัพธ์เป็นอย่างไร? สามารถนำไปใช้ได้หรือไม่?) เครื่องมือและรายการตรวจสอบที่มีโครงสร้างที่ใช้ในการตอบคำถามเหล่านั้น และมาตรฐานการรายงาน (เช่น CONSORT และ STROBE) ที่ทำให้งานวิจัยมีความโปร่งใสเพียงพอสำหรับการประเมินตั้งแต่แรก เป็นการให้ความรู้เชิงอ้างอิงและไม่ได้ให้คำแนะนำทางคลินิก

Sub-topics

Core questions

ผลลัพธ์ของการศึกษาแต่ละชิ้นนี้ถูกต้องหรือไม่ เมื่อพิจารณาจากการออกแบบและวิธีการดำเนินการ?
ผลลัพธ์เป็นอย่างไร และมีความแม่นยำและมีความสำคัญทางคลินิกหรือในทางปฏิบัติมากน้อยเพียงใด?
ผลลัพธ์สามารถนำไปใช้กับประชากร สถานการณ์ หรือคำถามที่กำลังพิจารณาได้หรือไม่?
เครื่องมือที่มีโครงสร้างและมาตรฐานการรายงานทำให้งานวิจัยสามารถประเมินได้และลดการตัดสินที่เป็นอัตวิสัยได้อย่างไร?

Key concepts

ความถูกต้องภายใน
ความถูกต้องภายนอก (ความสามารถในการสรุปผล)
ความเสี่ยงของอคติ
กรอบการประเมินความถูกต้อง-ผลลัพธ์-การนำไปใช้
มาตรฐานการรายงานเทียบกับคุณภาพของวิธีการวิจัย
เครื่องมือและรายการตรวจสอบการประเมินอย่างมีวิจารณญาณ
ความสามารถในการทำซ้ำและความโปร่งใสของการรายงาน

Mechanisms

การประเมินจะดำเนินการโดยการจับคู่การออกแบบงานวิจัยกับอคติที่การออกแบบนั้นมีแนวโน้มที่จะเกิดขึ้น จากนั้นจึงตั้งคำถามว่าผู้เขียนได้ดำเนินการอย่างเพียงพอเพื่อป้องกันอคติเหล่านั้นหรือไม่ กรอบแนวคิด Users' Guides ที่มีการสอนอย่างแพร่หลายได้จัดระเบียบสิ่งนี้ออกเป็นสามคำถามตามลำดับ — ผลลัพธ์ถูกต้องหรือไม่ ผลลัพธ์เป็นอย่างไร และจะช่วยในท้องถิ่นได้หรือไม่ — เพื่อให้การตัดสินความถูกต้องนำหน้าการตีความขนาดผล ซึ่งจะนำหน้าการตัดสินใด ๆ เกี่ยวกับการนำไปใช้ (Guyatt 1993; Greenhalgh 1997) แตกต่างจากการประเมินวิธีการ มาตรฐานการรายงานจะระบุว่าเอกสารต้องเปิดเผยอะไรบ้างเพื่อให้ผู้อ่านมีข้อมูลที่จำเป็นในการประเมินทั้งหมด ทั้งสองส่วนนี้เสริมซึ่งกันและกัน เนื่องจากงานวิจัยที่ดำเนินการได้ดีแต่รายงานไม่ดีไม่สามารถประเมินได้ และงานวิจัยที่รายงานอย่างโปร่งใสก็ยังคงถูกตัดสินว่ามีความเสี่ยงสูงต่ออคติได้

Clinical relevance

การประเมินอย่างมีวิจารณญาณเป็นความสามารถหลักของการปฏิบัติที่อิงหลักฐานในทุกสาขาวิชาชีพด้านสุขภาพ เนื่องจากการนำงานวิจัยไปใช้อย่างมีความรับผิดชอบจำเป็นต้องตัดสินก่อนว่างานวิจัยนั้นน่าเชื่อถือและเกี่ยวข้องหรือไม่ ส่วนนี้จะอธิบายวิธีการประเมินและรายงานงานวิจัยแต่ละชิ้น โดยจะอธิบายลักษณะของหลักฐานมากกว่าการกำหนดการวินิจฉัยหรือการตัดสินใจในการรักษา และไม่ใช่สิ่งทดแทนแนวทางปฏิบัติทางคลินิก

Evidence & guidelines

การประเมินได้รับการสนับสนุนโดยเครื่องมือที่ได้รับการตรวจสอบความถูกต้องและเฉพาะเจาะจงกับการออกแบบ แทนที่จะเป็นรายการตรวจสอบสากลเพียงรายการเดียว การทบทวนอย่างเป็นระบบพบความหลากหลายอย่างมากในเครื่องมือที่เผยแพร่มากกว่าร้อยรายการ โดยไม่มีมาตรฐานทองคำที่ตกลงกันไว้สำหรับการออกแบบใด ๆ (Katrak 2004) มาตรฐานการรายงานที่ได้รับการรับรองโดยวารสารและเครือข่าย EQUATOR — CONSORT สำหรับการทดลองแบบสุ่มและ STROBE สำหรับการศึกษาเชิงสังเกต — เสริมการประเมินโดยการกำหนดมาตรฐานการเปิดเผยข้อมูล ในขณะที่กรอบแนวคิดเช่น GRADE ขยายการประเมินจากงานวิจัยแต่ละชิ้นไปสู่ความแน่นอนของชุดหลักฐาน (Guyatt 2008)

History

การประเมินอย่างมีวิจารณญาณที่มีโครงสร้างพัฒนามาจากการระบาดวิทยาทางคลินิกที่พัฒนาขึ้นที่มหาวิทยาลัย McMaster และการเคลื่อนไหวทางการแพทย์ที่อิงหลักฐานในช่วงทศวรรษ 1990 คำจำกัดความของการแพทย์ที่อิงหลักฐานของ Sackett และคณะได้กำหนดให้การประเมินงานวิจัยแต่ละชิ้นเป็นทักษะทางคลินิกประจำวัน (Sackett 1996) และชุดคู่มือ JAMA Users' Guides ได้กำหนดคำถามการประเมินที่ชัดเจนและเป็นลำดับสำหรับงานวิจัยแต่ละประเภท (Guyatt 1993) หนังสือเบื้องต้นที่อ่านกันอย่างแพร่หลายของ Greenhalgh ได้นำแนวทางเดียวกันนี้ไปสู่กลุ่มผู้ป่วยทางคลินิกในวงกว้าง (Greenhalgh 1997) ในขณะเดียวกัน มาตรฐานการรายงานและเครื่องมือการประเมินเฉพาะทางก็แพร่หลายตั้งแต่ปลายทศวรรษ 1990 เป็นต้นมา ซึ่งในที่สุดก็ได้รับการประสานงานผ่านเครือข่าย EQUATOR

Debates

คุณภาพการรายงานวัดคุณภาพการศึกษาหรือไม่?: มาตรฐานการรายงานระบุสิ่งที่เปิดเผย ไม่ใช่ว่าการศึกษาดำเนินการได้ดีหรือไม่ การถือว่าการปฏิบัติตามรายการตรวจสอบการรายงานเป็นมาตรวัดคุณภาพของวิธีการวิจัยเป็นการรวมความโปร่งใสเข้ากับความถูกต้อง และผู้เขียนมาตรฐานส่วนใหญ่เตือนไม่ให้ใช้เป็นคะแนนคุณภาพ
มีเครื่องมือประเมินที่เป็นมาตรฐานทองคำหรือไม่?: รายการตรวจสอบที่มีอยู่จำนวนมาก ซึ่งมีเนื้อหาที่ทับซ้อนกันน้อยและไม่มีเครื่องมืออ้างอิงที่ตกลงกันไว้สำหรับการออกแบบใด ๆ ทำให้การประเมินขึ้นอยู่กับเครื่องมือที่เลือกและการตัดสินของผู้ทบทวนบางส่วน

Key figures

David Sackett
Gordon Guyatt
Trisha Greenhalgh
Andrew Oxman

Seminal works

sackett-1996
guyatt-1993
greenhalgh-1997

Frequently asked questions

การประเมินอย่างมีวิจารณญาณแตกต่างจากการสังเคราะห์หลักฐานอย่างไร?: การประเมินอย่างมีวิจารณญาณจะประเมินงานวิจัยทีละชิ้น โดยตัดสินความถูกต้องและความเกี่ยวข้อง การสังเคราะห์หลักฐานจะรวมผลการวิจัยจากงานวิจัยที่ได้รับการประเมินหลายชิ้นเข้าด้วยกัน การประเมินงานวิจัยแต่ละชิ้นเป็นขั้นตอนเบื้องต้นที่จำเป็นในการสังเคราะห์
การปฏิบัติตามรายการตรวจสอบการรายงานเหมือนกับการประเมินงานวิจัยหรือไม่?: ไม่เหมือนกัน มาตรฐานการรายงานจะบอกคุณว่างานวิจัยเปิดเผยข้อมูลเพียงพอหรือไม่ การประเมินจะใช้ข้อมูลนั้นเพื่อตัดสินว่าวิธีการและผลลัพธ์ของงานวิจัยสามารถเชื่อถือและนำไปใช้ได้หรือไม่ งานวิจัยที่รายงานครบถ้วนก็ยังคงมีความเสี่ยงสูงต่ออคติได้