ScholarGate
Assistent

Datenvisualisierung

Datenvisualisierung ist die grafische Darstellung von Daten, sodass deren Muster, Verteilungen und Beziehungen direkt wahrgenommen werden können. Gut gewählte Darstellungen – Histogramme, Boxplots, Streudiagramme und andere – offenbaren Merkmale wie Schiefe, Clusterbildung und Ausreißer, die numerische Zusammenfassungen allein verbergen können, wodurch Grafiken zu einem integralen Bestandteil der Datenbeschreibung und -exploration werden.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Datenvisualisierung ist die Praxis, Daten und statistische Zusammenfassungen grafisch darzustellen – durch Diagramme wie Histogramme, Boxplots und Streudiagramme –, um Verteilungsformen, Vergleiche und Beziehungen visuell sichtbar zu machen.

Scope

Dieser Eintrag behandelt die Rolle der grafischen Darstellung bei der Zusammenfassung von Daten, die wichtigsten Diagrammtypen, die in den Gesundheitswissenschaften verwendet werden, und die Prinzipien der grafischen Wahrnehmung, die einige Darstellungen lesbarer machen als andere. Es handelt sich um eine methodologische Referenz und bietet keine klinische Anleitung.

Core questions

  • Welche Darstellung offenbart das betreffende Merkmal der Daten am besten – Verteilung, Vergleich oder Beziehung?
  • Wie beeinflussen die Prinzipien der grafischen Wahrnehmung, welche Kodierungen genau gelesen werden?
  • Wie kann ein Diagramm irreführend sein, und wie wird das vermieden?

Key concepts

  • Histogramm
  • Boxplot
  • Streudiagramm
  • Balkendiagramm und Häufigkeitsdarstellung
  • Grafische Wahrnehmung und Kodierungsgenauigkeit
  • Explorative Datenanalyse
  • Irreführende Grafiken

Key theories

Grafische Wahrnehmung
Clevelands und McGills Theorie der grafischen Wahrnehmung ordnet die visuellen Kodierungen (Position, Länge, Winkel, Fläche, Farbe) danach, wie genau Menschen sie dekodieren, und liefert eine empirische Grundlage für die Bevorzugung positionsbasierter Darstellungen wie Punkt- und Streudiagramme gegenüber flächen- oder winkelbasierten wie Tortendiagrammen.

Mechanisms

Verschiedene Darstellungen zeigen unterschiedliche Merkmale. Ein Histogramm zeigt die Form einer einzelnen Verteilung – ihr Zentrum, ihre Streuung, Schiefe und Modalität. Ein Boxplot fasst den Median, die Quartile und Ausreißer kompakt zusammen, wodurch er effizient für den Vergleich der Verteilung einer Variablen über Gruppen hinweg ist. Ein Streudiagramm zeigt die Beziehung zwischen zwei kontinuierlichen Variablen. Die Wirksamkeit jeder Darstellung beruht auf der grafischen Wahrnehmung: Empirische Studien zeigen, dass das Auge einige Kodierungen (Position entlang einer gemeinsamen Skala) weitaus genauer dekodiert als andere (Winkel, Fläche, Farbsättigung), weshalb positionsbasierte Diagramme im Allgemeinen bevorzugt werden und warum Darstellungen wie Tortendiagramme und dreidimensionale Effekte vermieden werden sollten. Ein gutes Design vermeidet auch Verzerrungen – abgeschnittene oder inkonsistente Achsen, übermäßige Ornamente –, die den Leser zu einem falschen Eindruck führen können.

Clinical relevance

Abbildungen tragen einen Großteil der Botschaft in klinischen Arbeiten und Präsentationen, und die Fähigkeit, sie kritisch zu lesen – und irreführende zu erkennen – ist Teil der Bewertung von Evidenz. Dieser Eintrag beschreibt Prinzipien der grafischen Darstellung zu diesem Zweck und ist keine Grundlage für individuelle diagnostische oder Behandlungsentscheidungen.

Epidemiology

Die grafische Darstellung wird in jeder Phase der Gesundheitsforschung eingesetzt, von der Exploration von Rohdaten und der Überprüfung von Verteilungsannahmen bis zur Kommunikation von Ergebnissen an klinische und öffentliche Zielgruppen. Die Wahl und Ehrlichkeit der Darstellungen beeinflussen direkt, wie klar und genau Studienergebnisse verstanden werden.

History

Statistische Grafiken lassen sich bis ins späte 18. und 19. Jahrhundert zurückverfolgen, in die Arbeiten von William Playfair, der Linien-, Balken- und Tortendiagramme einführte, und Florence Nightingale, die Grafiken nutzte, um für Sanitärreformen zu argumentieren. Die moderne Ära wurde geprägt durch John Tukeys explorative Datenanalyse (1977), die Darstellungen wie den Boxplot einführte und populär machte, durch Clevelands und McGills empirische Studie zur grafischen Wahrnehmung und durch Edward Tuftes Prinzipien für die ehrliche und effiziente Darstellung quantitativer Informationen.

Debates

Welche Darstellungen sollten für eine genaue Lesbarkeit bevorzugt werden?
Die Forschung zur grafischen Wahrnehmung zeigt, dass Mengen, die durch die Position entlang einer Skala kodiert sind, genauer beurteilt werden als solche, die durch Winkel oder Fläche kodiert sind, was die langjährige Empfehlung untermauert, Punkt-, Balken- und Streudiagramme zu bevorzugen und Tortendiagramme sowie dreidimensionale Verzierungen zu vermeiden.

Key figures

  • John W. Tukey
  • William S. Cleveland
  • Edward R. Tufte

Related topics

Seminal works

  • tukey-1977
  • cleveland-1984
  • tufte-2001
  • mcgill-1978

Frequently asked questions

Warum sollte man eine Grafik verwenden, wenn bereits zusammenfassende Statistiken vorliegen?
Grafiken offenbaren Merkmale – Schiefe, mehrere Spitzen, Ausreißer und Beziehungen zwischen Variablen –, die einzelne Zahlen wie Mittelwert und Standardabweichung verbergen können. Sie ergänzen daher numerische Zusammenfassungen, anstatt sie zu ersetzen.
Was macht ein Diagramm genauer lesbar als ein anderes?
Menschen dekodieren die Position entlang einer gemeinsamen Skala genauer als Winkel, Fläche oder Farbe. Darstellungen, die auf Position basieren, wie Punkt- und Streudiagramme, werden daher in der Regel zuverlässiger gelesen als Tortendiagramme oder dreidimensionale Grafiken.

Methods for this concept

Related concepts