Warum kann ein sehr genauer Test immer noch hauptsächlich falsch positive Ergebnisse liefern?

Wenn die Erkrankung selten ist, wird die geringe Anzahl echter Fälle von der großen Anzahl nicht betroffener Personen übertroffen; selbst eine niedrige Falsch-Positiv-Rate, die auf diese große Gruppe angewendet wird, kann mehr falsch positive als echte positive Ergebnisse liefern, sodass der positive prädiktive Wert trotz hoher Spezifität niedrig ist.

Warum zielen Screening-Tests in der Regel auf eine hohe Sensitivität ab?

Der Zweck des Screenings ist es, zu vermeiden, Personen mit der Erkrankung zu übersehen, daher minimiert ein sensitiver Test falsch negative Ergebnisse; der Kompromiss sind mehr falsch positive Ergebnisse, die dann durch bestätigende diagnostische Tests aussortiert werden.

Eigenschaften und Leistung von Screening-Tests

Die Leistung eines Screening-Tests wird dadurch beschrieben, wie gut er Personen mit einer Erkrankung von Personen ohne Erkrankung trennt. Sensitivität und Spezifität drücken die intrinsische Genauigkeit des Tests aus, während prädiktive Werte ausdrücken, was ein Ergebnis für eine Einzelperson bedeutet, und stark davon abhängen, wie häufig die Erkrankung in der gescreenten Population ist.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Screening-Test-Eigenschaften sind die quantitativen Merkmale, die die Fähigkeit eines Tests beschreiben, Individuen korrekt zu klassifizieren, hauptsächlich Sensitivität (der Anteil der wirklich betroffenen Personen, die der Test erkennt) und Spezifität (der Anteil der wirklich nicht betroffenen Personen, die er korrekt ausschließt), zusammen mit den prädiktiven Werten, die ein Ergebnis in die Wahrscheinlichkeit einer Krankheit übersetzen.

Scope

Dieses Thema behandelt die Kernmaße der Screening-Testleistung: Sensitivität, Spezifität, positiver und negativer prädiktiver Wert, Likelihood-Ratios, die Wahl des Cut-offs und die Art und Weise, wie die Prävalenz der Krankheit den prädiktiven Wert beeinflusst. Es fasst diese als methodische Konzepte zur Bewertung von Screening-Tests zusammen, nicht als Anweisungen zur Anordnung oder Interpretation eines spezifischen Tests bei einem Patienten.

Core questions

Was messen Sensitivität und Spezifität, und warum gelten sie als intrinsisch für einen Test?
Warum ändern sich positive und negative prädiktive Werte mit der Krankheitsprävalenz, auch wenn der Test unverändert bleibt?
Wie beeinflusst die Verschiebung des Cut-offs eines Tests den Kompromiss zwischen Sensitivität und Spezifität?
Was sind Likelihood-Ratios, und wie aktualisieren sie die Wahrscheinlichkeit einer Krankheit?
Warum bevorzugen Screening-Tests eine hohe Sensitivität, und welche Kosten sind damit verbunden?

Key concepts

Sensitivität (True-Positive-Rate)
Spezifität (True-Negative-Rate)
Positiver und negativer prädiktiver Wert
Krankheitsprävalenz und Vortestwahrscheinlichkeit
Likelihood-Ratios
Cut-off-Punkt und der Sensitivitäts-Spezifitäts-Kompromiss
Falsch positive und falsch negative Ergebnisse

Mechanisms

Ein Screening-Ergebnis wird mit einem Referenzstandard verglichen, um eine Zwei-mal-Zwei-Tabelle von echten Positiven, falsch Positiven, echten Negativen und falsch Negativen zu erstellen. Sensitivität und Spezifität werden entlang der Spalten des Krankheitsstatus berechnet und hängen daher nicht von der Prävalenz ab, während prädiktive Werte über die Zeilen des Testergebnisses abgelesen werden und sich daher mit der Prävalenz ändern: Wenn eine Erkrankung seltener wird, liefert selbst ein hochspezifischer Test proportional mehr falsch Positive, was den positiven prädiktiven Wert senkt. Das Senken des Testschwellenwerts erhöht die Sensitivität, senkt aber die Spezifität, und Likelihood-Ratios kombinieren beides, um die Vortestwahrscheinlichkeit in Richtung einer Nachtestwahrscheinlichkeit zu verschieben.

Clinical relevance

Diese Maße erklären, warum ein positives Screening-Ergebnis in der Regel vorläufig ist und eine bestätigende diagnostische Untersuchung erfordert, und warum das Screening einer Population mit geringer Prävalenz viele Fehlalarme erzeugt. Die Konzepte sind zentral für die Bewertung der veröffentlichten Genauigkeit von Screening-Tests; sie beschreiben, wie Testergebnisse interpretiert werden, und sind kein Ersatz für das klinische Urteilsvermögen bezüglich der Ergebnisse einer Einzelperson.

Epidemiology

Da der prädiktive Wert von der Prävalenz abhängt, liefert derselbe Test in verschiedenen Populationen unterschiedliche Ergebnisse: In einer Hochrisikogruppe ist ein positives Ergebnis wahrscheinlicher wahr, während in einer allgemeinen asymptomatischen Population die meisten positiven Ergebnisse falsch sein können. Aus diesem Grund wird Screening auf Gruppen ausgerichtet, in denen die Erkrankung häufig genug ist, dass die Vorteile der Erkennung die Nachteile von falsch positiven Ergebnissen und der nachfolgenden Abklärung überwiegen.

Evidence & guidelines

Standards für die Berichterstattung über diagnostische und Screening-Genauigkeit betonen einen expliziten Referenzstandard und ein repräsentatives Patientenspektrum, da Fallzusammensetzung und Verifizierung die scheinbare Genauigkeit erhöhen können. Die pädagogischen Darstellungen von Altman und Bland (1994) bleiben weit verbreitete Referenzen für die Definitionen, und Kriterien für Screening-Programme erfordern, dass ein geeigneter, ausreichend genauer Test existiert, bevor ein Bevölkerungsscreening angeboten wird (Wilson & Jungner, 1968).

History

Die Zwei-mal-Zwei-Logik von Sensitivität und Spezifität wurde in der Mitte des 20. Jahrhunderts für die Medizin formalisiert und wurde mit dem Wachstum des Massenscreenings zum Standard. Die Erkenntnis, dass der prädiktive Wert von der Prävalenz abhängt, und die spätere Popularisierung von Likelihood-Ratios für die klinische Entscheidungsfindung verfeinerten die Interpretation von Testergebnissen durch Kliniker und Epidemiologen.

Debates

Wo sollte der Cut-off eines Screening-Tests festgelegt werden?: Ein niedrigerer Schwellenwert erfasst mehr echte Fälle, vervielfacht aber falsch positive Ergebnisse und nachfolgende Schäden, während ein höherer Schwellenwert Fälle übersieht; der optimale Cut-off hängt von den relativen Kosten der beiden Fehler ab und bleibt eher ein wertbehaftetes als ein rein statistisches Urteil.

Key figures

Douglas Altman
J. Martin Bland
Leon Gordis

Seminal works

altman-bland-1994
altman-bland-1994b

Frequently asked questions

Warum kann ein sehr genauer Test immer noch hauptsächlich falsch positive Ergebnisse liefern?: Wenn die Erkrankung selten ist, wird die geringe Anzahl echter Fälle von der großen Anzahl nicht betroffener Personen übertroffen; selbst eine niedrige Falsch-Positiv-Rate, die auf diese große Gruppe angewendet wird, kann mehr falsch positive als echte positive Ergebnisse liefern, sodass der positive prädiktive Wert trotz hoher Spezifität niedrig ist.
Warum zielen Screening-Tests in der Regel auf eine hohe Sensitivität ab?: Der Zweck des Screenings ist es, zu vermeiden, Personen mit der Erkrankung zu übersehen, daher minimiert ein sensitiver Test falsch negative Ergebnisse; der Kompromiss sind mehr falsch positive Ergebnisse, die dann durch bestätigende diagnostische Tests aussortiert werden.