ارزیابی انتقادی و ارزیابی شواهد فردی
ارزیابی انتقادی فرآیند ساختاریافتهای است که به صورت نظاممند یک تحقیق واحد را بررسی میکند تا اعتبار، اندازه و دقت نتایج آن، و ارتباط آن با یک پرسش مشخص را قضاوت کند. این یک مهارت عملی است که خواندن یک مطالعه را به ارزیابی آن تبدیل میکند و در مرکز عمل مبتنی بر شواهد قرار دارد: قبل از اینکه شواهد بتوانند به کار گرفته یا ترکیب شوند، هر مطالعه باید ابتدا بر اساس شرایط خود ارزیابی شود.
Definition
ارزیابی انتقادی، ارزیابی صریح و مبتنی بر معیار یک مطالعه تحقیقاتی فردی است تا قابلیت اطمینان روشهای آن (اعتبار داخلی)، معنی و دقت یافتههای آن، و میزان قابل اعمال بودن آن یافتهها در سایر محیطها یا جمعیتها (اعتبار خارجی) را تعیین کند.
Scope
این بخش خواننده را با نحوه ارزیابی مطالعات فردی به جای نحوه تجمیع مجموعهای از شواهد آشنا میکند. این بخش شامل سوالات کلی ارزیابی (آیا معتبر است؟ نتایج چیست؟ آیا قابل اجرا هستند؟)، ابزارها و چکلیستهای ساختاریافتهای که برای اعمال این سوالات استفاده میشوند، و استانداردهای گزارشدهی (مانند CONSORT و STROBE) که یک مطالعه را به اندازه کافی شفاف میکنند تا در وهله اول قابل ارزیابی باشد، میشود. این بخش آموزشی-مرجع است و توصیههای بالینی ارائه نمیدهد.
Sub-topics
Core questions
- با توجه به نحوه طراحی و اجرای این مطالعه فردی، آیا نتایج آن معتبر هستند؟
- نتایج چیست و چقدر دقیق و از نظر بالینی یا عملی مهم هستند؟
- آیا نتایج را میتوان در جمعیت، محیط یا سوال مورد نظر به کار برد؟
- چگونه ابزارهای ساختاریافته و استانداردهای گزارشدهی یک مطالعه را قابل ارزیابی میکنند و قضاوت ذهنی را کاهش میدهند؟
Key concepts
- اعتبار داخلی
- اعتبار خارجی (قابلیت تعمیم)
- خطر سوگیری
- چارچوب ارزیابی اعتبار-نتایج-قابلیت اجرا
- استانداردهای گزارشدهی در مقابل کیفیت روششناختی
- ابزارها و چکلیستهای ارزیابی انتقادی
- قابلیت بازتولید و شفافیت گزارشدهی
Mechanisms
ارزیابی با ترسیم طرح یک مطالعه به سوگیریهایی که آن طرح مستعد آن است، و سپس پرسیدن اینکه آیا نویسندگان گامهای کافی برای مقابله با آنها برداشتهاند، پیش میرود. چارچوب راهنمای کاربران که به طور گسترده آموزش داده میشود، این را به سه سوال متوالی سازماندهی میکند — آیا نتایج معتبر هستند، نتایج چیست، و آیا به صورت محلی کمک خواهند کرد — به طوری که قضاوت اعتبار بر تفسیر اندازه اثر مقدم است، که به نوبه خود بر هر گونه قضاوت در مورد قابلیت اجرا مقدم است (Guyatt 1993; Greenhalgh 1997). متمایز از ارزیابی روشها، استانداردهای گزارشدهی مشخص میکنند که یک مقاله چه چیزی را باید افشا کند تا خواننده اطلاعات لازم برای ارزیابی آن را داشته باشد؛ این دو مکمل یکدیگر هستند، زیرا یک مطالعه خوب انجام شده که به خوبی گزارش نشده باشد قابل ارزیابی نیست، و یک مطالعه شفاف گزارش شده همچنان میتواند در معرض خطر بالای سوگیری قضاوت شود.
Clinical relevance
ارزیابی انتقادی یک صلاحیت اصلی در عمل مبتنی بر شواهد در سراسر حرفههای بهداشتی است، زیرا به کارگیری مسئولانه تحقیقات مستلزم قضاوت اولیه در مورد قابل اعتماد و مرتبط بودن یک مطالعه است. این بخش نحوه ارزیابی و گزارش مطالعات فردی را توصیف میکند؛ این بخش به جای تجویز تصمیمات تشخیصی یا درمانی، شواهد را توصیف میکند و جایگزینی برای دستورالعملهای بالینی نیست.
Evidence & guidelines
ارزیابی توسط ابزارهای معتبر و خاص طراحی شده پشتیبانی میشود تا یک چکلیست جهانی واحد؛ یک مرور سیستماتیک تنوع گستردهای را در بیش از صد ابزار منتشر شده بدون هیچ استاندارد طلایی توافق شده برای هیچ طرحی یافت (Katrak 2004). استانداردهای گزارشدهی که توسط مجلات و شبکه EQUATOR تایید شدهاند — CONSORT برای کارآزماییهای تصادفی شده و STROBE برای مطالعات مشاهدهای — با استانداردسازی افشاگری، ارزیابی را تکمیل میکنند، در حالی که چارچوبهایی مانند GRADE ارزیابی را از یک مطالعه واحد به قطعیت یک مجموعه شواهد گسترش میدهند (Guyatt 2008).
History
ارزیابی انتقادی ساختاریافته از اپیدمیولوژی بالینی توسعه یافته در دانشگاه مکمستر و جنبش پزشکی مبتنی بر شواهد در دهه 1990 نشأت گرفت. تعریف ساکت و همکارانش از پزشکی مبتنی بر شواهد، ارزیابی مطالعات فردی را به عنوان یک مهارت بالینی روتین معرفی کرد (Sackett 1996)، و مجموعه راهنماهای کاربران JAMA سوالات ارزیابی صریح و متوالی را برای هر نوع مطالعه کدگذاری کرد (Guyatt 1993). کتابهای راهنمای پرخواننده گرینهالگ همین رویکرد را به مخاطبان گسترده بالینی آورد (Greenhalgh 1997). به موازات آن، استانداردهای گزارشدهی و ابزارهای ارزیابی اختصاصی از اواخر دهه 1990 به بعد گسترش یافتند و در نهایت از طریق شبکه EQUATOR هماهنگ شدند.
Debates
- آیا کیفیت گزارشدهی، کیفیت مطالعه را اندازهگیری میکند؟
- استانداردهای گزارشدهی آنچه را که افشا شده است مستند میکنند، نه اینکه آیا مطالعه به خوبی انجام شده است؛ تلقی پایبندی به یک چکلیست گزارشدهی به عنوان معیاری برای کیفیت روششناختی، شفافیت را با اعتبار اشتباه میگیرد، و اکثر نویسندگان استانداردها در مورد استفاده از آنها به عنوان نمرات کیفیت هشدار میدهند.
- آیا ابزار ارزیابی استاندارد طلایی وجود دارد؟
- تعداد زیاد چکلیستهای رقیب، با همپوشانی کم در محتوا و عدم وجود ابزار مرجع توافق شده برای هیچ طرحی، ارزیابی را تا حدی وابسته به ابزار انتخابی و قضاوت بازبین میکند.
Key figures
- David Sackett
- Gordon Guyatt
- Trisha Greenhalgh
- Andrew Oxman
Related topics
Seminal works
- sackett-1996
- guyatt-1993
- greenhalgh-1997
Frequently asked questions
- ارزیابی انتقادی چه تفاوتی با سنتز شواهد دارد؟
- ارزیابی انتقادی یک مطالعه را در هر زمان ارزیابی میکند و اعتبار و ارتباط آن را قضاوت میکند. سنتز شواهد یافتههای بسیاری از مطالعات ارزیابی شده را ترکیب میکند؛ ارزیابی هر مطالعه فردی یک گام پیشنیاز در سنتز است.
- آیا پیروی از یک چکلیست گزارشدهی همان ارزیابی یک مطالعه است؟
- خیر. استانداردهای گزارشدهی به شما میگویند که آیا یک مطالعه اطلاعات کافی را افشا کرده است یا خیر؛ ارزیابی از آن اطلاعات برای قضاوت در مورد اینکه آیا روشها و نتایج مطالعه قابل اعتماد و قابل اجرا هستند استفاده میکند. یک مطالعه کاملاً گزارش شده همچنان میتواند در معرض خطر بالای سوگیری باشد.