ارزیابی تستهای غربالگری و تشخیصی
ارزیابی تستهای غربالگری و تشخیصی شاخهای از اپیدمیولوژی است که میزان توانایی یک تست در تمایز افراد دارای یک بیماری هدف از افراد فاقد آن را کمیسازی میکند. این حوزه معیارهایی — حساسیت، ویژگی، مقادیر پیشبینیکننده، نسبتهای درستنمایی، و منحنی مشخصه عملکرد گیرنده — را ارائه میدهد که برای قضاوت یک تست در برابر یک استاندارد مرجع و پیشبینی نحوه عملکرد آن هنگام اعمال در یک جمعیت استفاده میشوند.
Definition
ارزیابی تستهای غربالگری و تشخیصی اندازهگیری سیستماتیک توانایی یک تست در طبقهبندی افراد بر اساس وضعیت واقعی بیماری است که از طریق شاخصهای دقت محاسبه شده از یک جدول متقاطع از نتایج تست در برابر یک استاندارد مرجع بیان میشود.
Scope
این حوزه خواننده را با معیارهای اصلی دقت که از مقایسه یک تست با یک استاندارد مرجع ("طلایی") به دست میآیند، تمایز بین ویژگیهای ذاتی تست و عملکرد پیشبینیکننده وابسته به جمعیت، نقش شیوع بیماری، و استانداردهای گزارشدهی برای مطالعات دقت تشخیصی آشنا میکند. این یک مرور روششناختی است، نه راهنمای بالینی، و هیچ تست یا آستانه خاصی را برای یک فرد توصیه نمیکند.
Sub-topics
Core questions
- یک تست چند وقت یکبار افراد دارای بیماری و افراد فاقد آن را به درستی شناسایی میکند؟
- با توجه به یک نتیجه مثبت یا منفی، چقدر احتمال دارد که بیماری واقعاً وجود داشته باشد یا وجود نداشته باشد؟
- شیوع بیماری در یک جمعیت چگونه ارزش عملی یک تست را تغییر میدهد؟
- مبادله بین تشخیص موارد واقعی و اجتناب از هشدارهای کاذب چگونه باید انتخاب و گزارش شود؟
Key concepts
- استاندارد مرجع (طلایی)
- حساسیت و ویژگی
- ارزش پیشبینیکننده مثبت و منفی
- نسبتهای درستنمایی
- شیوع بیماری و احتمال پیش از تست
- منحنی مشخصه عملکرد گیرنده (ROC)
- آستانه تشخیصی و نقطه برش
- سوگیری طیف و تأیید
Mechanisms
ارزیابی تست با طبقهبندی متقاطع نتیجه تست هر فرد (مثبت یا منفی) در برابر وضعیت واقعی بیماری که توسط یک استاندارد مرجع تعیین شده است، آغاز میشود و چهار خانه یک جدول 2x2 (مثبتهای واقعی، مثبتهای کاذب، منفیهای کاذب، منفیهای واقعی) را تولید میکند. حساسیت و ویژگی در طول ستونهای وضعیت بیماری شناخته شده خوانده میشوند و اصولاً ویژگیهای تست هستند که به میزان شیوع بیماری بستگی ندارند. مقادیر پیشبینیکننده در طول ردیفهای نتیجه تست خوانده میشوند و بنابراین به شیوع بستگی دارند، زیرا همان تست که در جایی که بیماری نادر است اعمال میشود، مثبتهای کاذب بیشتری نسبت به مثبتهای واقعی ایجاد میکند. نسبتهای درستنمایی حساسیت و ویژگی را در عواملی ترکیب میکنند که شانسهای پیش از تست را به شانسهای پس از تست بهروزرسانی میکنند. هنگامی که یک تست اندازهگیری پیوسته یا ترتیبی تولید میکند، جابجایی آستانه تصمیمگیری، حساسیت را در برابر ویژگی مبادله میکند؛ ترسیم این مبادله در تمام آستانهها، منحنی ROC را ایجاد میکند که مساحت آن تمایز را مستقل از هر نقطه برش واحد خلاصه میکند.
Clinical relevance
این معیارها زبان مشترک برای ارزیابی اینکه آیا یک تست غربالگری یا تشخیصی برای هدف مورد نظر مناسب است و برای مقایسه تستهای رقیب در شرایط برابر هستند. درک آنها برای ارزیابی انتقادی ادبیات تشخیصی حیاتی است؛ این حوزه توضیح میدهد که چگونه شواهد تشخیصی تولید و تفسیر میشوند و مبنایی برای تصمیمات تشخیصی یا درمانی فردی نیست.
Epidemiology
معیارهای دقت زیربنای تصمیمات مربوط به برنامههای غربالگری جمعیت هستند، جایی که پیامدهای مثبتهای کاذب و منفیهای کاذب در مقیاس وسیع، همراه با شیوع بیماری، تعیین میکنند که آیا غربالگری بیشتر از ضرر، فایده دارد. استانداردهای گزارشدهی مانند STARD برای بهبود کامل بودن و شفافیت مطالعات دقت تشخیصی توسعه یافتند، و سوگیریهای طیف و تأیید به عنوان تهدیدهای شناخته شده برای اعتبار دقت گزارش شده شناخته میشوند.
Evidence & guidelines
بیانیه STARD یک چکلیست برای گزارشدهی شفاف مطالعات دقت تشخیصی ارائه میدهد و به طور گسترده توسط مجلات زیستپزشکی تأیید شده است.
History
ارزیابی رسمی تستهای تشخیصی از کارهای اواسط قرن بیستم در زمینه تشخیص سیگنال و تصمیمگیری بالینی نشأت گرفت و با تشخیص در دهه 1970 که طراحی مطالعه مغرضانه میتواند دقت ظاهری را افزایش دهد، دقیقتر شد. معیارهای دقت قابل دسترس در ادبیات پزشکی در طول دهه 1990 محبوبیت یافتند، و استانداردهای گزارشدهی در بیانیه STARD در دهه 2000 تثبیت و در سال 2015 بهروزرسانی شدند.
Debates
- چرا یک تست با دقت بالا ممکن است در غربالگری همچنان گمراهکننده باشد؟
- زیرا مقادیر پیشبینیکننده به شیوع بستگی دارند، یک تست با حساسیت و ویژگی بالا میتواند همچنان مثبتهای کاذب زیادی را هنگام اعمال در یک جمعیت غربالگری با شیوع پایین ایجاد کند، که منبع مکرر سوءتفسیر است.
- سوگیریهای طراحی مطالعه چقدر دقت گزارش شده را تحریف میکنند؟
- سوگیری طیف و سوگیری تأیید میتوانند حساسیت و ویژگی اندازهگیری شده را به طور قابل توجهی افزایش دهند، بنابراین دقت گزارش شده باید با توجه به نحوه انتخاب موارد و کنترلها و نحوه اعمال استاندارد مرجع تفسیر شود.
Key figures
- Douglas Altman
- Jonathan Deeks
- David Grimes
- Kenneth Schulz
- Patrick Bossuyt
Related topics
Seminal works
- ransohoff-feinstein-1978
- altman-bland-1994a
- altman-bland-1994b
- bossuyt-2015
Frequently asked questions
- تفاوت بین تست غربالگری و تست تشخیصی چیست؟
- تست غربالگری برای افراد ظاهراً سالم به کار میرود تا افرادی را که احتمال بیشتری برای ابتلا به بیماری دارند شناسایی کند، که معمولاً به حساسیت بیشتر تمایل دارد، در حالی که تست تشخیصی برای تأیید یا رد بیماری در افرادی که از قبل به آن مشکوک هستند استفاده میشود؛ هر دو با همان معیارهای دقت در برابر یک استاندارد مرجع ارزیابی میشوند.
- چرا شیوع برای مفید بودن یک تست اهمیت دارد؟
- حساسیت و ویژگی خود تست را توصیف میکنند، اما احتمال صحیح بودن یک نتیجه مثبت (ارزش پیشبینیکننده مثبت) با نادرتر شدن بیماری کاهش مییابد، بنابراین همان تست میتواند در یک کلینیک با شیوع بالا آموزنده باشد و در یک محیط غربالگری با شیوع پایین گمراهکننده باشد.