批判的吟味はエビデンス統合とどう違うのか？

批判的吟味は、一度に1つの研究を評価し、その妥当性と関連性を判断する。エビデンス統合は、吟味された多くの研究の知見を組み合わせるものであり、各個々の研究の吟味は統合内の前提条件となるステップである。

報告チェックリストに従うことは、研究を吟味することと同じか？

いいえ。報告基準は、研究が十分な情報を開示したかどうかを示すものであり、吟味はその情報を用いて、研究の方法と結果が信頼でき、適用可能であるかを判断する。完全に報告された研究であっても、バイアスのリスクが高いと判断される場合がある。

批判的吟味と個々のエビデンス評価

批判的吟味とは、個々の研究を体系的に検討し、その妥当性、結果の規模と精度、および特定の問いへの関連性を判断するための構造化されたプロセスである。これは、研究を読むことを評価することに変える実践的なスキルであり、エビデンスに基づいた実践の中心に位置する。エビデンスを適用または統合する前に、各研究はまずそれ自身の基準で吟味されなければならない。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

批判的吟味とは、個々の研究の明確かつ基準に基づいた評価であり、その方法論の信頼性（内的妥当性）、知見の意味と精度、およびそれらの知見が他の設定や集団にどの程度適用できるか（外的妥当性）を判断するものである。

Scope

この分野は、エビデンスの集合体がどのように統合されるかではなく、個々の研究がどのように評価されるかに読者の焦点を当てる。一般的な吟味の問い（妥当性はあるか？結果は何か？適用可能か？）と、それらの問いを適用するために使用される構造化されたツールやチェックリスト、そして研究を吟味するのに十分な透明性を持たせる報告基準（CONSORTやSTROBEなど）を扱う。これは参照・教育的なものであり、臨床的な推奨を提供するものではない。

Sub-topics

Core questions

この個々の研究の結果は、そのデザインと実施方法を考慮すると妥当か？
結果は何であり、その精度と臨床的または実践的な重要性はどの程度か？
その結果は、対象となる集団、設定、または問いに適用できるか？
構造化されたツールと報告基準は、研究を吟味可能にし、主観的な判断を減らす上でどのように役立つか？

Key concepts

内的妥当性
外的妥当性（一般化可能性）
バイアスのリスク
妥当性-結果-適用可能性の吟味フレームワーク
報告基準と方法論的質
批判的吟味ツールとチェックリスト
報告の再現性と透明性

Mechanisms

吟味は、研究デザインをそのデザインが陥りやすいバイアスにマッピングし、次に著者がそれらに対して適切な対策を講じたかどうかを問うことによって進められる。広く教えられているUsers' Guidesのフレームワークは、これを「結果は妥当か」「結果は何か」「局所的に役立つか」という3つの連続した問いに整理しており、妥当性の判断が効果量の解釈に先行し、それが適用可能性に関する判断に先行する（Guyatt 1993; Greenhalgh 1997）。方法論の吟味とは異なり、報告基準は、読者が研究を吟味するために必要な情報を得るために、論文が何を公開しなければならないかを規定する。この2つは補完的であり、なぜなら、適切に実施された研究であっても報告が不十分であれば吟味できず、透明性高く報告された研究であってもバイアスのリスクが高いと判断される可能性があるからである。

Clinical relevance

批判的吟味は、医療専門職全体におけるエビデンスに基づいた実践の核となる能力である。なぜなら、研究を責任を持って適用するには、まず研究が信頼でき、関連性があるかどうかを判断する必要があるからである。この分野は、個々の研究がどのように評価され、報告されるかを記述するものであり、診断や治療の決定を処方するのではなく、エビデンスを特徴づけるものであり、臨床ガイドラインの代わりとなるものではない。

Evidence & guidelines

吟味は、単一の普遍的なチェックリストではなく、検証済みのデザイン固有のツールによってサポートされている。ある系統的レビューでは、100を超える公開されたツール間で大きなばらつきがあり、どのデザインについても合意されたゴールドスタンダードがないことが判明した（Katrak 2004）。ジャーナルやEQUATOR Networkが推奨する報告基準（ランダム化比較試験にはCONSORT、観察研究にはSTROBE）は、情報開示を標準化することで吟味を補完し、GRADEなどのフレームワークは、個々の研究からエビデンスの集合体の確実性へと吟味を拡張する（Guyatt 2008）。

History

構造化された批判的吟味は、マックマスター大学で発展した臨床疫学と1990年代のエビデンスに基づいた医療運動から生まれた。Sackettらは、エビデンスに基づいた医療の定義において、個々の研究の吟味を日常的な臨床スキルとして位置づけ（Sackett 1996）、JAMA Users' Guidesシリーズは、各研究タイプに対する明確で連続的な吟味の問いを体系化した（Guyatt 1993）。Greenhalghの広く読まれた入門書は、同じアプローチを幅広い臨床読者に届けた（Greenhalgh 1997）。並行して、報告基準と専用の吟味ツールは1990年代後半から増加し、最終的にはEQUATOR Networkを通じて調整された。

Debates

報告の質は研究の質を測るものか？: 報告基準は、何が開示されたかを文書化するものであり、研究が適切に実施されたかどうかを測るものではない。報告チェックリストへの遵守を方法論的質の尺度として扱うことは、透明性と妥当性を混同することであり、ほとんどの基準の著者は、それらを質のスコアとして使用することに注意を促している。
ゴールドスタンダードとなる吟味ツールは存在するのか？: 多数の競合するチェックリストが存在し、内容の重複が少なく、どのデザインについても合意された参照ツールがないため、吟味は選択されたツールと評価者の判断に部分的に依存する。

Key figures

David Sackett
Gordon Guyatt
Trisha Greenhalgh
Andrew Oxman

Seminal works

sackett-1996
guyatt-1993
greenhalgh-1997

Frequently asked questions

批判的吟味はエビデンス統合とどう違うのか？: 批判的吟味は、一度に1つの研究を評価し、その妥当性と関連性を判断する。エビデンス統合は、吟味された多くの研究の知見を組み合わせるものであり、各個々の研究の吟味は統合内の前提条件となるステップである。
報告チェックリストに従うことは、研究を吟味することと同じか？: いいえ。報告基準は、研究が十分な情報を開示したかどうかを示すものであり、吟味はその情報を用いて、研究の方法と結果が信頼でき、適用可能であるかを判断する。完全に報告された研究であっても、バイアスのリスクが高いと判断される場合がある。