Maße der zentralen Tendenz
Maße der zentralen Tendenz sind Einzelwerte, die zusammenfassen, wo der Großteil eines Datensatzes liegt – die typische oder zentrale Beobachtung, um die sich die anderen gruppieren. Die drei klassischen Maße sind der Mittelwert (arithmetisches Mittel), der Median und der Modus. Die Wahl zwischen ihnen hängt vom Messniveau und der Form der Verteilung ab.
Definition
Ein Maß der zentralen Tendenz ist ein Einzelwert, der das Zentrum einer Verteilung identifiziert: Der arithmetische Mittelwert ist die Summe der Werte geteilt durch ihre Anzahl, der Median ist der mittlere Wert, wenn die Beobachtungen geordnet sind, und der Modus ist der am häufigsten vorkommende Wert.
Scope
Dieser Eintrag behandelt den Mittelwert, den Median und den Modus: wie jeder berechnet wird, was er darstellt und wann jeder die geeignete Zusammenfassung der Lage ist. Es handelt sich um eine methodische Referenz und bietet keine klinische Anleitung.
Core questions
- Welches Lagemaß repräsentiert diese Variable am besten?
- Wie beeinflusst die Verteilungsform die Wahl zwischen Mittelwert und Median?
- Wann ist der Modus die informativste Zusammenfassung?
Key concepts
- Arithmetisches Mittel
- Median
- Modus
- Robustheit gegenüber Ausreißern
- Auswirkung der Schiefe auf Mittelwert und Median
- Messniveau und Wahl des Durchschnitts
Mechanisms
Der Mittelwert verwendet jede Beobachtung und ist die natürliche Zusammenfassung für symmetrische, intervall- oder verhältnisskalierte Daten. Gerade weil er alle Werte berücksichtigt, wird er jedoch von extremen Beobachtungen beeinflusst und durch Schiefe und Ausreißer verzerrt. Der Median, der mittlere Wert der geordneten Daten, ignoriert die Größe der Extreme und ist daher robust, was ihn zur bevorzugten Zusammenfassung für schiefe kontinuierliche Daten und ordinale Variablen macht. Der Modus, der häufigste Wert, ist das einzige Maß, das auf nominale Daten anwendbar ist, und ist nützlich, um die typischste Kategorie oder einen Gipfel in der Verteilung zu identifizieren. In einer perfekt symmetrischen unimodalen Verteilung fallen die drei zusammen; mit zunehmender Schiefe wird der Mittelwert am weitesten in Richtung des Ausläufers verschoben.
Clinical relevance
Berichtete Durchschnittswerte – mittlerer Blutdruck, mediane Überlebenszeit, die häufigste Diagnose – sind zentral für die Kommunikation klinischer Ergebnisse. Das Erkennen, welches Maß verwendet wurde, schützt vor einer Fehlinterpretation schiefer Daten. Dieser Eintrag beschreibt, wie die Lage zur Bewertung zusammengefasst wird, und ist keine Grundlage für individuelle diagnostische oder Behandlungsentscheidungen.
Epidemiology
Da viele Gesundheitsmessungen schief sind, ist der Median häufig die genauere Zusammenfassung eines typischen Wertes, und die Angabe eines Mittelwerts für solche Daten kann den Zentralwert überbewerten. Die Wahl des Maßes beeinflusst daher, wie Populationsmerkmale und -ergebnisse vermittelt werden.
History
Der arithmetische Mittelwert wird seit der Antike zur Kombination von Messungen verwendet, und die formale Unterscheidung zwischen Mittelwert, Median und Modus wurde mit der Reifung der deskriptiven Statistik im neunzehnten und frühen zwanzigsten Jahrhundert konsolidiert. Die Erkenntnis, dass der Median schiefe Verteilungen besser repräsentiert, ist ein langjähriges Prinzip, das in der angewandten statistischen Literatur immer wieder betont wird.
Debates
- Mittelwert oder Median für schiefe klinische Daten?
- Bei in der Medizin häufig vorkommenden rechtsschiefen Größen – Kosten, Verweildauern, Biomarker-Spiegel – wird der Mittelwert durch den Ausläufer aufgebläht, während der Median den typischen Wert abbildet. Daher wird in der Regel der Median bevorzugt, wobei der Mittelwert für annähernd symmetrische Daten vorbehalten ist.
Key figures
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-mean
- manikandan-2011-median-mode
Frequently asked questions
- Wann sollte der Median anstelle des Mittelwerts angegeben werden?
- Wenn die Verteilung schief ist oder Ausreißer enthält oder wenn die Variable ordinal ist. In diesen Situationen repräsentiert der Median den typischen Wert genauer als der Mittelwert, der zu den Extremen hin gezogen wird.
- Kann der Modus für jede Art von Daten verwendet werden?
- Ja. Der Modus ist das einzige Maß der zentralen Tendenz, das auf nominale (kategorische) Daten anwendbar ist, und er kann auch Gipfel oder den häufigsten Wert in numerischen Daten hervorheben.