Warum ist Normalität wichtig?

Viele gängige Zusammenfassungen (Mittelwert, Standardabweichung) und Tests (t-Test, ANOVA) setzen annähernd normale Daten voraus; wenn diese Annahme nicht erfüllt ist, können diese Maße irreführend sein, und nicht-parametrische oder transformierte Alternativen können geeigneter sein.

Ist ein signifikanter Shapiro-Wilk-Test Grund genug, eine parametrische Methode aufzugeben?

Nicht allein. Der Test wird bei großen Stichproben sehr empfindlich und bei kleinen Stichproben unzureichend aussagekräftig. Daher sollten das Ausmaß der Abweichung, die im Q-Q-Plot sichtbare Form und die Robustheit der geplanten Analyse berücksichtigt werden.

Datenverteilung und Normalität

Die Verteilung einer Variablen beschreibt, wie ihre Werte über den Bereich der Möglichkeiten verteilt sind, und viele deskriptive und inferenzstatistische Methoden hängen von der Form dieser Verteilung ab. Die Normalität – ob Daten der symmetrischen, glockenförmigen Normalverteilung folgen – ist die Verteilungsannahme, die in der Gesundheitsforschung am häufigsten untersucht wird, da sie die Wahl zwischen parametrischen und nicht-parametrischen Zusammenfassungen und Tests bestimmt.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Eine statistische Verteilung beschreibt die relative Häufigkeit oder Wahrscheinlichkeit der möglichen Werte einer Variablen; Normalität bezieht sich auf die Übereinstimmung mit der Gaußschen (Normal-)Verteilung, einer symmetrischen glockenförmigen Form, die grafisch und mit formalen Tests bewertet wird, um zu entscheiden, ob parametrische Methoden geeignet sind.

Scope

Dieser Eintrag behandelt die Form der Verteilung (Symmetrie, Schiefe, Kurtosis), die Normalverteilung und ihre Bedeutung sowie die Bewertung der Normalität durch grafische Inspektion und formale Tests. Es handelt sich um eine methodische Referenz und bietet keine klinische Anleitung.

Core questions

Welche Form nimmt die Verteilung der Variablen an, und ist sie symmetrisch oder schief?
Ist die Annahme der Normalität für diese Variable plausibel?
Welche grafischen und formalen Werkzeuge eignen sich am besten zur Beurteilung der Normalität, und wie verhalten sie sich bei kleinen oder großen Stichproben?

Key concepts

Normalverteilung (Gauß-Verteilung)
Schiefe und Kurtosis
Grafische Beurteilung (Histogramm, Q-Q-Plot)
Shapiro-Wilk-Test
Kolmogorov-Smirnov-Test
Parametrische versus nicht-parametrische Wahl
Stichprobengrößenabhängigkeit von Normalitätstests

Key theories

Zentraler Grenzwertsatz: Der zentrale Grenzwertsatz besagt, dass für eine ausreichend große Stichprobe die Stichprobenverteilung des Mittelwerts unabhängig von der Form der zugrunde liegenden Variablen einer Normalverteilung zustrebt. Er ist der Grund, warum Methoden der Normaltheorie für Mittelwerte oft auch dann noch brauchbar sind, wenn die Rohdaten nicht normalverteilt sind.

Mechanisms

Die Normalität wird auf zwei komplementäre Weisen beurteilt. Grafische Methoden – das Histogramm und der Quantil-Quantil (Q-Q)-Plot – zeigen Abweichungen wie Schiefe, schwere Enden oder Bimodalität direkt. Formale Tests, von denen der Shapiro-Wilk-Test zu den am weitesten verbreiteten gehört, liefern eine Wahrscheinlichkeit, die Daten unter einem Normalmodell zu beobachten. Da diese Tests mit zunehmender Stichprobengröße an Aussagekraft gewinnen, neigen sie dazu, triviale Abweichungen in großen Stichproben zu erkennen und bedeutsame in kleinen Stichproben zu übersehen. Daher werden die grafische Inspektion und die praktischen Konsequenzen der Nicht-Normalität neben jedem Testergebnis berücksichtigt. Wenn die interessierende Größe ein Mittelwert ist, rechtfertigt der zentrale Grenzwertsatz häufig Methoden der Normaltheorie, selbst für nicht-normale Rohdaten.

Clinical relevance

Ob ein Biomarker, die Verweildauer oder ein Score als normal behandelt wird, bestimmt, wie er in der gesamten klinischen Literatur zusammengefasst und analysiert wird. Daher ist die Beurteilung der Normalität Teil der Bewertung der Methoden einer Studie. Dieser Eintrag beschreibt die Bewertung von Verteilungsannahmen und ist keine Grundlage für individuelle diagnostische oder Behandlungsentscheidungen.

Epidemiology

Viele biologische und klinische Messungen sind rechtsschief (zum Beispiel Hormonspiegel, Kosten und Wartezeiten), sodass Normalität nicht angenommen werden kann und routinemäßig überprüft wird. Die Entscheidung beeinflusst, ob Ergebnisse mit Mittelwerten und Standardabweichungen oder mit Medianen und Spannen berichtet werden und ob parametrische oder nicht-parametrische Tests verwendet werden.

History

Die Normalverteilung wurde im achtzehnten und neunzehnten Jahrhundert in den Arbeiten von de Moivre, Laplace und Gauss entwickelt und wurde durch die Fehlertheorie und den zentralen Grenzwertsatz zentral für die Statistik. Formale Werkzeuge zur Überprüfung der Annahme folgten im zwanzigsten Jahrhundert, wobei der Varianzanalyse-Test von Shapiro und Wilk aus dem Jahr 1965 für Normalität zu einem Standardverfahren in der angewandten Arbeit wurde.

Debates

Sollte die Normalität durch formale Tests oder durch grafische Inspektion beurteilt werden?: Formale Normalitätstests sind empfindlich gegenüber der Stichprobengröße – sie lehnen triviale Abweichungen in großen Stichproben ab und erkennen wichtige in kleinen Stichproben nicht. Daher empfehlen viele Methodologen, dass die grafische Beurteilung und die praktische Robustheit der geplanten Analyse die Entscheidung leiten sollten und nicht allein der p-Wert eines Tests.

Key figures

Samuel S. Shapiro
Martin B. Wilk
Carl Friedrich Gauss

Seminal works

shapiro-wilk-1965
kwak-2017
ghasemi-2012

Frequently asked questions

Warum ist Normalität wichtig?: Viele gängige Zusammenfassungen (Mittelwert, Standardabweichung) und Tests (t-Test, ANOVA) setzen annähernd normale Daten voraus; wenn diese Annahme nicht erfüllt ist, können diese Maße irreführend sein, und nicht-parametrische oder transformierte Alternativen können geeigneter sein.
Ist ein signifikanter Shapiro-Wilk-Test Grund genug, eine parametrische Methode aufzugeben?: Nicht allein. Der Test wird bei großen Stichproben sehr empfindlich und bei kleinen Stichproben unzureichend aussagekräftig. Daher sollten das Ausmaß der Abweichung, die im Q-Q-Plot sichtbare Form und die Robustheit der geplanten Analyse berücksichtigt werden.