ヒエラルキーの上位にあるほど、より信頼性の高い結果が保証されるのか？

いいえ。ヒエラルキーはデザインを典型的なバイアスへの脆弱性によってランク付けしていますが、上位にランク付けされた研究であっても実施が不十分である可能性があります。信頼性は、研究が実際にどのように行われたかに依存し、それはバイアスリスク評価によって判断されます。

系統的レビューがピラミッドの頂点に置かれることが多いのはなぜか？

系統的レビューは、関連する一次研究を系統的に収集、評価、統合するためです。改訂されたピラミッドでは、それらを完全に独立した階層としてではなく、基礎となるデザインに適用されるレンズとして扱っています。

エビデンスのヒエラルキー

エビデンスのヒエラルキーとは、介入の効果に関する推論をどの程度強力に支持できるかに応じて、研究デザインを順序付けてランク付けしたものです。原則として、系統的バイアスに対して脆弱性が低いデザインほど上位に位置付けられます。しばしばピラミッドとして描かれ、ランダム化比較試験とその統合は観察研究よりも上位に置かれ、観察研究は症例集積研究や専門家の意見よりも上位にランク付けされます。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

エビデンスのヒエラルキーとは、因果関係に関する問いに対してバイアスの影響を最も受けにくい研究デザイン（ランダム化比較試験の系統的レビュー）から、最も受けやすい研究デザイン（症例報告や専門家の意見）までをランク付けした分類であり、エビデンスの強さの最初のヒューリスティックとして使用されます。

Scope

この項目では、バイアスへの感受性に基づいてデザインをランク付けする根拠、古典的なピラミッドとその階層、そしてそれを再構築した現代の批判について説明します。これは、デザインが信頼性にどのように影響するかについての方法論的な参照であり、ケアを選択するためのルール集ではありません。

Key concepts

エビデンスレベル
エビデンスピラミッド
一次デザインの頂点としてのランダム化比較試験
観察デザイン（コホート、症例対照）
基盤としての症例集積研究と専門家の意見
順序付けの原則としてのバイアスへの感受性
ヒューリスティックとしてのデザインランクであり、保証ではない

Mechanisms

順序付けの原則は系統誤差に対する脆弱性です。ランダム化は、既知および未知の要因をグループ間で均等に分布させることで交絡を防ぐため、治療効果に関する問いに対しては、ランダム化比較試験は観察デザインよりも上位に位置付けられます。そのような研究の統合（系統的レビューとメタアナリシス）は、利用可能な一次エビデンスを集約し評価するため、さらに上位に位置付けられます。症例集積研究や専門家の意見のような下位の階層は、比較群や系統的なデータ収集を欠いています。重要なのは、このランクがデザインの典型的なバイアスリスクを反映していることであり、特定の研究の実施状況を反映しているわけではないということです。実施が不十分な試験は、厳密な観察研究よりも信頼性が低い可能性があります。

Clinical relevance

このヒエラルキーは、文献を読む上での出発点となるヒューリスティックです。これは、効果に関する問いに対してどのデザインが一般的に強力なエビデンスを提供するのかを示し、ガイドラインパネルがなぜ一部の研究をより重視するのかを理解するのに役立ちます。これはエビデンスの強度がどのように判断されるかを記述するものであり、それ自体で臨床的行動を指示するものではありません。

Evidence & guidelines

初期のヒエラルキーは、『Users' Guides to the Medical Literature』および関連する評価スキーム（Guyatt et al., 1995）で形式化され、その後、GRADE（Guyatt et al., 2008）のようなよりアウトカムに焦点を当てたフレームワークに組み込まれました。Concato et al. (2000) は、観察研究が本質的に信頼性が低いという仮定に異議を唱え、Murad et al. (2016) は、系統的レビューが独立した最上位層としてではなく、デザイン階層全体に適用されるレンズとして機能する改訂されたピラミッドを提案しました。

History

信頼性によるデザインのランク付けは、1970年代から1980年代にかけて臨床疫学とともに登場し、1990年代にはカナダタスクフォースのエビデンスレベルやオックスフォード・センター・フォー・エビデンス・ベースド・メディシンのレベルを含むエビデンスに基づいた医療を通じて普及しました。おなじみのピラミッドのイメージは、簡略化されたものとして教育に導入されました。2000年頃から、研究者たちは厳格なランク付けに疑問を呈し、GRADE運動や改訂されたピラミッドは、デザインのランクから特定の成果に対するエビデンスの確実性へと重点を移しました。

Debates

デザインのランクは観察研究の劣等性を過大評価しているか？: Concatoらは、適切にデザインされた観察研究はランダム化比較試験と同様の推定値をもたらすことが多いため、それらをカテゴリー的に弱いものとして扱うことは誤解を招く可能性があると主張しました。ランクはヒューリスティックであり、個々の研究に対する判断ではありません。
ピラミッドは再描画されるべきか？: 改訂されたピラミッドは、系統的レビューをデザイン階層全体に適用されるレンズとして再定義し、隣接するレベル間の境界線を曖昧にしています。これは、信頼性がデザインのみではなく、実施状況と確実性によって決定されることを反映しています。

Key figures

David Sackett
Gordon Guyatt
John Concato
M. Hassan Murad

Seminal works

sackett-1996
concato-2000
murad-2016-pyramid

Frequently asked questions

ヒエラルキーの上位にあるほど、より信頼性の高い結果が保証されるのか？: いいえ。ヒエラルキーはデザインを典型的なバイアスへの脆弱性によってランク付けしていますが、上位にランク付けされた研究であっても実施が不十分である可能性があります。信頼性は、研究が実際にどのように行われたかに依存し、それはバイアスリスク評価によって判断されます。
系統的レビューがピラミッドの頂点に置かれることが多いのはなぜか？: 系統的レビューは、関連する一次研究を系統的に収集、評価、統合するためです。改訂されたピラミッドでは、それらを完全に独立した階層としてではなく、基礎となるデザインに適用されるレンズとして扱っています。