エビデンスの評価と批判的吟味
エビデンスの評価と批判的吟味とは、ある研究またはエビデンス全体が妥当であるか、その結果が何を意味するのか、そして特定の問いに適用できるのかどうかを、規律ある判断をもって評価することです。これはエビデンスに基づいた医療の中核をなす分析スキルであり、主張の強さからエビデンスの信頼性を区別するものです。
Definition
批判的吟味とは、研究を検証し、その内的妥当性(バイアスからの自由)、結果の大きさおよび精度、そして外的妥当性(適用可能性)を判断するための体系的なプロセスであり、それによってエビデンスが使用される前にその信頼性を確立することができます。
Scope
このトピックでは、エビデンスの階層、個々の研究におけるバイアスのリスクの構造化された評価、エビデンス全体の確実性のグレーディング、および適用可能性の判断について扱います。これは、エビデンスがどのように判断されるかに関する方法論的かつ参照的なトピックであり、治療指示の出典ではありません。
Core questions
- 研究のデザインと実施は重要なバイアスから自由であるか?
- 報告された効果の大きさおよび精度はどの程度か?
- エビデンス全体としての確実性はどの程度か?
- 結果は対象患者や現在の問いに適用できるか?
Key concepts
- 内的妥当性とバイアスのリスク
- 外的妥当性と適用可能性
- エビデンスの階層
- エビデンスの確実性(質)
- 効果量と精度
- 構造化された吟味ツール(RoB 2、AMSTAR 2)
Mechanisms
吟味は個々の研究からエビデンス全体へと進みます。ランダム化比較試験の場合、RoB 2のような構造化されたツールは、バイアスが入り込む可能性のある領域(ランダム化、意図した介入からの逸脱、欠測データ、測定、選択的報告)を検証します。システマティックレビューの場合、AMSTAR 2が方法論的質を評価します。複数の研究にわたって、GRADEフレームワークは、エビデンス全体の確実性を高、中、低、または非常に低として評価し、バイアスのリスク、非一貫性、間接性、不精確性、出版バイアスによって確実性を下げ、大きな効果などの特徴によって確実性を上げます。この確実性評価は、エビデンスから推奨への移行に影響を与えます。これらすべての根底には、外部エビデンスは臨床的専門知識と統合される前に吟味されなければならないというエビデンスに基づいた医療の原則があります。
Clinical relevance
批判的吟味は、処方集の決定、ガイドラインの作成、および医薬品情報に関する質問への回答において、あるエビデンスがどれだけの重みを持つべきかを決定します。これは、医薬品文献を評価するための参照スキルであり、エビデンスがどのように判断されるかを記述するものであり、個々の診断や治療を直接指示するものではありません。
Evidence & guidelines
いくつかの広く採用されているツールが吟味を標準化しています。ランダム化比較試験におけるバイアスのリスクのためのCochrane RoB 2ツール、システマティックレビューの方法論的質のためのAMSTAR 2、およびエビデンス全体の確実性と推奨の強さを評価するためのGRADEフレームワークです。これらのツールは、開発者グループによって維持され、方法論の進化に応じて更新されます。
History
批判的吟味は、1980年代から1990年代にかけての臨床疫学およびエビデンスに基づいた医療の動きによって形式化され、Sackettらがその原則を明確にしました。その後、構造化されたツールが開発されました。Cochraneのバイアスリスクツール(RoB 2として改訂)、システマティックレビューの質のためのAMSTAR(AMSTAR 2として改訂)、および確実性を評価するためのGRADEアプローチは、非公式な判断を明示的で再現可能な基準に置き換えました。
Key figures
- David Sackett
- Gordon Guyatt
- Jonathan Sterne
- Beverley Shea
Related topics
Seminal works
- sackett-1996
- guyatt-2008-grade
- sterne-2019-rob2
- shea-2017-amstar2
Frequently asked questions
- 内的妥当性と外的妥当性の違いは何ですか?
- 内的妥当性とは、研究の結果がバイアスから自由であり、そのサンプルにおける真の効果を反映しているかどうかです。外的妥当性とは、その結果が他の患者、設定、または問いに適用できるかどうかです。
- エビデンスの階層で上位にあるほど、より良い答えが保証されますか?
- いいえ。研究デザインはエビデンスの潜在的な強さを決定しますが、不適切に実施された試験やレビューは依然としてバイアスがかかる可能性があります。そのため、構造化されたバイアスリスクの吟味と確実性のグレーディングがすべての研究に適用されます。