Was ist der Unterschied zwischen klinischer und statistischer Heterogenität?

Klinische (und methodologische) Heterogenität bezieht sich auf tatsächliche Unterschiede zwischen Studien in ihren Populationen, Interventionen oder Designs. Statistische Heterogenität ist die daraus resultierende Variation in ihren Effektschätzungen über den Zufall hinaus, gemessen durch Statistiken wie I-Quadrat und Tau-Quadrat. Klinische Unterschiede sind oft die Erklärung für die beobachtete statistische Heterogenität.

Bedeutet ein hohes I-Quadrat, dass eine Metaanalyse ungültig ist?

Nicht per se. Ein hohes I-Quadrat signalisiert, dass die Effekte zwischen den Studien variieren und dass eine einzelne Zusammenfassung mit Vorsicht interpretiert werden sollte, was oft ein Random-Effects-Modell, die Untersuchung von Ursachen oder ein Vorhersageintervall anregt. Es ist ein Hinweis für die Interpretation, keine automatische Disqualifikation.

Heterogenität in der Metaanalyse

Heterogenität in der Metaanalyse ist die Variation der wahren Effekte über die kombinierten Studien hinweg, die über die allein durch Stichprobenfehler erwartete Variation hinausgeht. Wenn sich Studien in ihren Populationen, Interventionen, Designs oder ihrer Durchführung unterscheiden, können ihre Ergebnisse tatsächlich voneinander abweichen, und die Quantifizierung dieser Variation ist entscheidend für die Entscheidung, ob und wie sie zusammengeführt werden sollen.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Heterogenität ist der Grad, in dem die wahren Effekte, die von den Studien in einer Metaanalyse geschätzt werden, über das hinaus voneinander abweichen, was allein durch Zufall (Stichprobenfehler) zu erwarten wäre.

Scope

Dieser Eintrag behandelt die Bedeutung von Heterogenität, die Unterscheidung zwischen klinischer, methodologischer und statistischer Heterogenität, die gängigen Statistiken zu ihrer Detektion und Quantifizierung (Cochran's Q, der I-Quadrat-Statistik und der Zwischenstudienvarianz Tau-Quadrat) sowie die Art und Weise, wie Heterogenität die Modellwahl und die Interpretation einer gepoolten Schätzung beeinflusst. Es handelt sich um ein methodologisches Thema, nicht um eine klinische Leitlinie.

Core questions

Schätzen die kombinierten Studien denselben Effekt oder eine Reihe von Effekten?
Wie viel der beobachteten Variation über die Studien hinweg übersteigt den Zufall?
Welche Ursachen für Unterschiede könnten die Variation erklären, und wie sollten sie die Analyse verändern?

Key concepts

Klinische, methodologische und statistische Heterogenität
Cochrans Q-Test
I-Quadrat-Statistik
Zwischenstudienvarianz (Tau-Quadrat)
Random-Effects-Modell
Subgruppenanalyse und Meta-Regression
Vorhersageintervall

Mechanisms

Selbst wenn jede Studie genau denselben Effekt schätzen würde, würden ihre Ergebnisse aufgrund von Stichprobenfehlern streuen. Heterogenität ist die zusätzliche, tatsächliche Variation in den zugrunde liegenden Effekten. Cochrans Q testet, ob die beobachtete Streuung den Zufall übersteigt, hat aber eine geringe Power, wenn nur wenige Studien vorliegen, und detektiert triviale Unterschiede, wenn viele Studien vorhanden sind. Die I-Quadrat-Statistik drückt den Anteil der Gesamtvariation aus, der auf Unterschiede zwischen den Studien und nicht auf Zufall zurückzuführen ist, was die Interpretation über Analysen hinweg erleichtert. Die Zwischenstudienvarianz, Tau-Quadrat, quantifiziert die Streuung der wahren Effekte auf der Effektstärkeskala und ist der Parameter, den ein Random-Effects-Modell zur Poolung hinzufügt. Wenn eine erhebliche Heterogenität vorliegt, kann eine einzelne zusammenfassende Schätzung weniger informativ sein als die Beschreibung der Effektverteilung, beispielsweise mit einem Vorhersageintervall, und Analysten können die Variabilitätsquellen durch vorab spezifizierte Subgruppenanalysen oder Meta-Regressionen untersuchen, anstatt Heterogenität als bloßes Rauschen zu behandeln.

Clinical relevance

Der Grad der Heterogenität beeinflusst, wie ein gepooltes Ergebnis gelesen werden sollte: Ein präzises Zusammenfassungsergebnis aus hoch heterogenen Studien ist möglicherweise nicht einheitlich auf alle Settings anwendbar. Das Erkennen und Interpretieren von Heterogenität ist daher Teil der Bewertung einer Metaanalyse. Dieser Eintrag erklärt, wie Heterogenität gemessen und in der Analyse verwendet wird; er ist keine Anleitung für individuelle klinische Entscheidungen.

Epidemiology

Heterogenitätsstatistiken, insbesondere I-Quadrat und Tau-Quadrat, werden standardmäßig in Metaanalysen in der Medizin und im öffentlichen Gesundheitswesen berichtet, und die meisten Metaanalyse-Softwareprogramme berechnen sie automatisch. Die von Higgins und Thompson eingeführte I-Quadrat-Statistik gehört zu den am häufigsten berichteten Größen in der Syntheseliteratur, obwohl ihre Interpretation häufig diskutiert wird.

History

Cochrans Q-Test, abgeleitet aus der Arbeit von William Cochran Mitte des 20. Jahrhunderts, war der frühe Standard zur Detektion von Heterogenität, wurde aber als wenig aussagekräftig und skalenabhängig erkannt. DerSimonian und Laird (1986) formalisierten den Random-Effects-Ansatz, der die Zwischenstudienvarianz berücksichtigt. Higgins und Thompson (2002) schlugen dann die I-Quadrat-Statistik vor, um Heterogenität als einen von der Anzahl der Studien unabhängigen Anteil auszudrücken, und ihr BMJ-Artikel von 2003 popularisierte diese, wonach I-Quadrat zu einem routinemäßigen Bestandteil der meta-analytischen Berichterstattung wurde.

Debates

Wie sollte I-Quadrat interpretiert werden?: Gängige Faustregeln für niedrige, moderate und hohe Heterogenität sind weit verbreitet, waren aber nie als starre Grenzwerte gedacht; I-Quadrat hängt von der Präzision der eingeschlossenen Studien ab und kann irreführend sein, wenn Studien wenige oder sehr groß sind.

Key figures

Julian Higgins
Simon Thompson
Rebecca DerSimonian
Nan Laird
William Cochran

Seminal works

higgins-2003-i2
higgins-2002-quantifying
dersimonian-laird-1986

Frequently asked questions

Was ist der Unterschied zwischen klinischer und statistischer Heterogenität?: Klinische (und methodologische) Heterogenität bezieht sich auf tatsächliche Unterschiede zwischen Studien in ihren Populationen, Interventionen oder Designs. Statistische Heterogenität ist die daraus resultierende Variation in ihren Effektschätzungen über den Zufall hinaus, gemessen durch Statistiken wie I-Quadrat und Tau-Quadrat. Klinische Unterschiede sind oft die Erklärung für die beobachtete statistische Heterogenität.
Bedeutet ein hohes I-Quadrat, dass eine Metaanalyse ungültig ist?: Nicht per se. Ein hohes I-Quadrat signalisiert, dass die Effekte zwischen den Studien variieren und dass eine einzelne Zusammenfassung mit Vorsicht interpretiert werden sollte, was oft ein Random-Effects-Modell, die Untersuchung von Ursachen oder ein Vorhersageintervall anregt. Es ist ein Hinweis für die Interpretation, keine automatische Disqualifikation.