Was macht Gesundheitsdaten zu 'Big Data'?

Gesundheitsdaten werden oft als Big Data bezeichnet, wenn sie ein großes Volumen haben, schnell ankommen oder sich ändern (Geschwindigkeit) und viele heterogene und unstrukturierte Typen kombinieren (Vielfalt), bis zu dem Punkt, an dem konventionelle Einzelmaschinen-Tools sie nicht einfach speichern oder analysieren können.

Ist ein größerer Gesundheitsdatensatz immer zuverlässiger?

Nein. Der Umfang kann die Fähigkeit verbessern, Muster zu erkennen, aber wenn die Daten nicht repräsentativ oder von schlechter Qualität sind, können große Datensätze Verzerrungen verstärken. Zuverlässige Schlussfolgerungen hängen von Datenqualität, Repräsentativität, Validierung und Interoperabilität ab, nicht allein von der Größe.

Big-Data-Technologien und Anwendungen im Gesundheitswesen

Big Data im Gesundheitswesen bezieht sich auf Datensätze, deren Volumen, Geschwindigkeit und Vielfalt die Kapazität konventioneller Datenmanagement-Tools übersteigen, sowie auf die verteilten Technologien, die zu deren Speicherung und Analyse entwickelt wurden. Anwendungen umfassen klinische, genomische, administrative und Sensordaten, wobei das Ziel darin besteht, Muster und Vorhersagen zu extrahieren, die kleinere oder aus einer einzigen Quelle stammende Datensätze nicht unterstützen können.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Big-Data-Technologien im Gesundheitswesen sind verteilte Speicher- und Analysemethoden, die für gesundheitsbezogene Datensätze mit hohem Volumen, hoher Geschwindigkeit und großer Vielfalt entwickelt wurden und auf klinische, genomische, administrative und gerätegenerierte Daten angewendet werden, um Vorhersagen, Entdeckungen und Management zu unterstützen.

Scope

Dieses Thema behandelt die definierenden Merkmale von Big Data in Bezug auf das Gesundheitswesen, die technologischen Ansätze zur Handhabung von Daten in großem Maßstab und repräsentative Anwendungen im Gesundheitswesen wie prädiktive Analysen und das Management von Hochrisikopopulationen. Es werden auch die Grenzen und Risiken dieser Ansätze aufgezeigt. Es handelt sich um eine Referenzübersicht über Methoden und Anwendungen, nicht um Implementierungs- oder klinische Leitlinien.

Key concepts

Volumen, Geschwindigkeit und Vielfalt (die 'drei Vs')
Verteilte Speicherung und Verarbeitung
Heterogene und unstrukturierte Daten
Prädiktive Analysen
Maschinelles Lernen in der Medizin
Genomische und Sensordaten
Skalierbarkeit und Interoperabilität
Generalisierbarkeit und Verzerrung in großen Datensätzen

Mechanisms

Gesundheitsdaten sind in Umfang und Heterogenität gewachsen, da elektronische Aufzeichnungen, Bildgebung, Genomik, Abrechnungsdaten und tragbare Sensoren sich ansammeln. Big-Data-Ansätze begegnen dem, indem sie Speicherung und Berechnung auf viele Maschinen verteilen und strukturierte und unstrukturierte Daten gemeinsam verarbeiten. Sobald Daten in großem Maßstab vorliegen, werden Analysemethoden, zunehmend auch maschinelles Lernen, angewendet, um Muster zu erkennen und Vorhersagen zu treffen, wie z. B. die Identifizierung von Hochrisiko- oder kostenintensiven Patienten für ein gezieltes Management. Der Wert dieser Methoden hängt von der Datenqualität, Repräsentativität und Interoperabilität ab; große Datensätze allein garantieren keine validen Schlussfolgerungen und können Verzerrungen verstärken, wenn die zugrunde liegenden Daten verzerrt sind.

Clinical relevance

Big-Data-Technologien bilden die Grundlage für prädiktive Tools, Risikomodelle und Entscheidungsunterstützungssysteme, die zunehmend in der Gesundheitsversorgung und Forschung eingesetzt werden. Das Verständnis ihrer Merkmale und Grenzen hilft Anwendern zu beurteilen, wann groß angelegte Analysen einen Mehrwert bieten und wann der Umfang Verzerrungen oder schlechte Datenqualität verschleiert. Dieses Thema beschreibt Technologien und Anwendungen; es gibt keine Anweisungen zur individuellen Diagnose oder Behandlung.

History

Als die routinemäßig gesammelten Gesundheitsdaten in den frühen 2010er Jahren zunahmen, wurde das Konzept von Big Data, ursprünglich definiert durch Volumen, Geschwindigkeit und Vielfalt in Informationssystemen, auf das Gesundheitswesen angewendet. Übersichten zeigten sein Potenzial für den klinischen, genomischen und operativen Einsatz auf, und Analysen für das Management von Hochrisikopopulationen demonstrierten konkrete Anwendungen. Der anschließende Aufstieg des maschinellen Lernens in der Medizin baute auf diesen großen Datensätzen auf, während gleichzeitig die Aufmerksamkeit auf Verzerrungen, Validierung und Generalisierbarkeit geschärft wurde.

Debates

Bedeutet mehr Daten automatisch bessere Evidenz im Gesundheitswesen?: Die Begeisterung für Big Data wird durch die Sorge gedämpft, dass der Umfang Verzerrungen eher verfestigen als überwinden kann, wenn die zugrunde liegenden Daten nicht repräsentativ oder von schlechter Qualität sind; Übersichten betonen, dass Volumen mit Datenqualität, Validierung und Interoperabilität gepaart werden muss, um vertrauenswürdige Ergebnisse zu erzielen.

Key figures

David W. Bates
Alvin Rajkomar
Isaac Kohane

Seminal works

raghupathi-2014
bates-2014

Frequently asked questions

Was macht Gesundheitsdaten zu 'Big Data'?: Gesundheitsdaten werden oft als Big Data bezeichnet, wenn sie ein großes Volumen haben, schnell ankommen oder sich ändern (Geschwindigkeit) und viele heterogene und unstrukturierte Typen kombinieren (Vielfalt), bis zu dem Punkt, an dem konventionelle Einzelmaschinen-Tools sie nicht einfach speichern oder analysieren können.
Ist ein größerer Gesundheitsdatensatz immer zuverlässiger?: Nein. Der Umfang kann die Fähigkeit verbessern, Muster zu erkennen, aber wenn die Daten nicht repräsentativ oder von schlechter Qualität sind, können große Datensätze Verzerrungen verstärken. Zuverlässige Schlussfolgerungen hängen von Datenqualität, Repräsentativität, Validierung und Interoperabilität ab, nicht allein von der Größe.