スクリーニング検査と診断検査の違いは何ですか？

スクリーニング検査は、一見健康な人々に適用され、疾患を持つ可能性が高い人を特定することを目的とし、通常は感度を重視します。一方、診断検査は、すでに疾患が疑われる人々の疾患を確認または除外するために使用されます。どちらも、基準標準に対して同じ精度指標で評価されます。

有病率が検査の有用性に影響するのはなぜですか？

感度と特異度は検査自体を記述しますが、陽性結果が正しい確率（陽性適中率）は、疾患が稀になるにつれて低下します。そのため、同じ検査でも、有病率の高い診療所では有用である一方、有病率の低いスクリーニング環境では誤解を招く可能性があります。

スクリーニング検査と診断検査の評価

スクリーニング検査と診断検査の評価は、ある検査が対象疾患を持つ人と持たない人をどの程度区別できるかを定量化する疫学の一分野です。これは、感度、特異度、予測値、尤度比、および受信者操作特性曲線といった指標を提供し、これらを用いて検査を基準標準と比較し、集団に適用された場合にどのように機能するかを予測します。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

スクリーニング検査と診断検査の評価とは、検査結果と基準標準とのクロス集計から算出される精度指標を通じて、真の疾患状態によって対象者を分類する検査の能力を体系的に測定することです。

Scope

この分野では、検査と基準（「ゴールド」）標準との比較から導き出される主要な精度指標、検査固有の特性と集団に依存する予測性能との区別、疾患有病率の役割、および診断精度研究の報告基準について読者に説明します。これは方法論的な概観であり、臨床的ガイダンスではなく、特定の検査や個人のための閾値を推奨するものではありません。

Sub-topics

Core questions

検査は、疾患を持つ人と持たない人をどのくらいの頻度で正しく識別しますか？
陽性または陰性の結果が出た場合、実際に疾患が存在する、または存在しない可能性はどのくらいですか？
集団における疾患の有病率は、検査の実用的な価値をどのように変化させますか？
真の症例を検出することと誤報を避けることのトレードオフは、どのように選択し、報告すべきですか？

Key concepts

基準（ゴールド）標準
感度と特異度
陽性適中率と陰性適中率
尤度比
疾患有病率と事前確率
受信者操作特性（ROC）曲線
診断閾値とカットオフ
スペクトラムバイアスと検証バイアス

Mechanisms

検査評価は、各被験者の検査結果（陽性または陰性）を、基準標準によって確立された真の疾患状態とクロス分類することから始まります。これにより、2x2表の4つのセル（真陽性、偽陽性、偽陰性、真陰性）が生成されます。感度と特異度は、既知の疾患状態の列に沿って読み取られ、原則として、疾患の頻度には依存しない検査の特性です。予測値は、検査結果の行に沿って読み取られるため、有病率に依存します。なぜなら、疾患が稀な場合に同じ検査を適用すると、真陽性に対して偽陽性が多くなるからです。尤度比は、感度と特異度を組み合わせて、事前オッズを事後オッズに更新する因子です。検査が連続的または順序的な測定値を生み出す場合、決定閾値を移動させると感度と特異度がトレードオフの関係になります。すべての閾値にわたるそのトレードオフをプロットするとROC曲線が得られ、その曲線下面積は単一のカットオフに依存しない識別能力を要約します。

Clinical relevance

これらの指標は、スクリーニング検査または診断検査が目的に適合しているかどうかを評価し、競合する検査を公平な条件で比較するための共通言語です。これらを理解することは、診断に関する文献を批判的に評価する上で中心的な役割を果たします。この分野は、診断エビデンスがどのように生成され、解釈されるかを説明するものであり、個々の診断や治療の決定の根拠となるものではありません。

Epidemiology

精度指標は、集団スクリーニングプログラムに関する決定の基礎となります。そこでは、大規模な偽陽性および偽陰性の結果と疾患有病率が、スクリーニングが害よりも多くの利益をもたらすかどうかを決定します。STARDなどの報告基準は、診断精度研究の完全性と透明性を向上させるために開発され、スペクトラムバイアスと検証バイアスは、報告された精度の妥当性に対する認識された脅威です。

Evidence & guidelines

STARD声明は、診断精度研究の透明性のある報告のためのチェックリストを提供し、生物医学雑誌によって広く支持されています。

History

診断検査の正式な評価は、20世紀半ばの信号検出と臨床意思決定に関する研究から発展し、1970年代に偏った研究デザインが見かけの精度を膨らませる可能性があるという認識によって洗練されました。アクセスしやすい精度指標は、1990年代を通じて医学文献で普及し、報告基準は2000年代にSTARD声明として統合され、2015年に更新されました。

Debates

なぜ、非常に正確に聞こえる検査でも、スクリーニングでは誤解を招く可能性があるのでしょうか？: 予測値は有病率に依存するため、感度と特異度が高い検査でも、有病率の低いスクリーニング集団に適用された場合、多くの偽陽性を生み出す可能性があり、これは誤解釈の繰り返しの原因となります。
研究デザインのバイアスは、報告された精度をどの程度歪めますか？: スペクトラムバイアスと検証バイアスは、測定された感度と特異度を大幅に膨らませる可能性があるため、報告された精度は、症例と対照がどのように選択され、基準標準がどのように適用されたかを考慮して解釈する必要があります。

Key figures

Douglas Altman
Jonathan Deeks
David Grimes
Kenneth Schulz
Patrick Bossuyt

Seminal works

ransohoff-feinstein-1978
altman-bland-1994a
altman-bland-1994b
bossuyt-2015

Frequently asked questions

スクリーニング検査と診断検査の違いは何ですか？: スクリーニング検査は、一見健康な人々に適用され、疾患を持つ可能性が高い人を特定することを目的とし、通常は感度を重視します。一方、診断検査は、すでに疾患が疑われる人々の疾患を確認または除外するために使用されます。どちらも、基準標準に対して同じ精度指標で評価されます。
有病率が検査の有用性に影響するのはなぜですか？: 感度と特異度は検査自体を記述しますが、陽性結果が正しい確率（陽性適中率）は、疾患が稀になるにつれて低下します。そのため、同じ検査でも、有病率の高い診療所では有用である一方、有病率の低いスクリーニング環境では誤解を招く可能性があります。