Big-Data-Technologien und Anwendungen im Gesundheitswesen
Big Data im Gesundheitswesen bezieht sich auf Datensätze, deren Volumen, Geschwindigkeit und Vielfalt die Kapazität konventioneller Datenmanagement-Tools übersteigen, sowie auf die verteilten Technologien, die zu deren Speicherung und Analyse entwickelt wurden. Anwendungen umfassen klinische, genomische, administrative und Sensordaten, wobei das Ziel darin besteht, Muster und Vorhersagen zu extrahieren, die kleinere oder aus einer einzigen Quelle stammende Datensätze nicht unterstützen können.
Definition
Big-Data-Technologien im Gesundheitswesen sind verteilte Speicher- und Analysemethoden, die für gesundheitsbezogene Datensätze mit hohem Volumen, hoher Geschwindigkeit und großer Vielfalt entwickelt wurden und auf klinische, genomische, administrative und gerätegenerierte Daten angewendet werden, um Vorhersagen, Entdeckungen und Management zu unterstützen.
Scope
Dieses Thema behandelt die definierenden Merkmale von Big Data in Bezug auf das Gesundheitswesen, die technologischen Ansätze zur Handhabung von Daten in großem Maßstab und repräsentative Anwendungen im Gesundheitswesen wie prädiktive Analysen und das Management von Hochrisikopopulationen. Es werden auch die Grenzen und Risiken dieser Ansätze aufgezeigt. Es handelt sich um eine Referenzübersicht über Methoden und Anwendungen, nicht um Implementierungs- oder klinische Leitlinien.
Key concepts
- Volumen, Geschwindigkeit und Vielfalt (die 'drei Vs')
- Verteilte Speicherung und Verarbeitung
- Heterogene und unstrukturierte Daten
- Prädiktive Analysen
- Maschinelles Lernen in der Medizin
- Genomische und Sensordaten
- Skalierbarkeit und Interoperabilität
- Generalisierbarkeit und Verzerrung in großen Datensätzen
Mechanisms
Gesundheitsdaten sind in Umfang und Heterogenität gewachsen, da elektronische Aufzeichnungen, Bildgebung, Genomik, Abrechnungsdaten und tragbare Sensoren sich ansammeln. Big-Data-Ansätze begegnen dem, indem sie Speicherung und Berechnung auf viele Maschinen verteilen und strukturierte und unstrukturierte Daten gemeinsam verarbeiten. Sobald Daten in großem Maßstab vorliegen, werden Analysemethoden, zunehmend auch maschinelles Lernen, angewendet, um Muster zu erkennen und Vorhersagen zu treffen, wie z. B. die Identifizierung von Hochrisiko- oder kostenintensiven Patienten für ein gezieltes Management. Der Wert dieser Methoden hängt von der Datenqualität, Repräsentativität und Interoperabilität ab; große Datensätze allein garantieren keine validen Schlussfolgerungen und können Verzerrungen verstärken, wenn die zugrunde liegenden Daten verzerrt sind.
Clinical relevance
Big-Data-Technologien bilden die Grundlage für prädiktive Tools, Risikomodelle und Entscheidungsunterstützungssysteme, die zunehmend in der Gesundheitsversorgung und Forschung eingesetzt werden. Das Verständnis ihrer Merkmale und Grenzen hilft Anwendern zu beurteilen, wann groß angelegte Analysen einen Mehrwert bieten und wann der Umfang Verzerrungen oder schlechte Datenqualität verschleiert. Dieses Thema beschreibt Technologien und Anwendungen; es gibt keine Anweisungen zur individuellen Diagnose oder Behandlung.
History
Als die routinemäßig gesammelten Gesundheitsdaten in den frühen 2010er Jahren zunahmen, wurde das Konzept von Big Data, ursprünglich definiert durch Volumen, Geschwindigkeit und Vielfalt in Informationssystemen, auf das Gesundheitswesen angewendet. Übersichten zeigten sein Potenzial für den klinischen, genomischen und operativen Einsatz auf, und Analysen für das Management von Hochrisikopopulationen demonstrierten konkrete Anwendungen. Der anschließende Aufstieg des maschinellen Lernens in der Medizin baute auf diesen großen Datensätzen auf, während gleichzeitig die Aufmerksamkeit auf Verzerrungen, Validierung und Generalisierbarkeit geschärft wurde.
Debates
- Bedeutet mehr Daten automatisch bessere Evidenz im Gesundheitswesen?
- Die Begeisterung für Big Data wird durch die Sorge gedämpft, dass der Umfang Verzerrungen eher verfestigen als überwinden kann, wenn die zugrunde liegenden Daten nicht repräsentativ oder von schlechter Qualität sind; Übersichten betonen, dass Volumen mit Datenqualität, Validierung und Interoperabilität gepaart werden muss, um vertrauenswürdige Ergebnisse zu erzielen.
Key figures
- David W. Bates
- Alvin Rajkomar
- Isaac Kohane
Related topics
Seminal works
- raghupathi-2014
- bates-2014
Frequently asked questions
- Was macht Gesundheitsdaten zu 'Big Data'?
- Gesundheitsdaten werden oft als Big Data bezeichnet, wenn sie ein großes Volumen haben, schnell ankommen oder sich ändern (Geschwindigkeit) und viele heterogene und unstrukturierte Typen kombinieren (Vielfalt), bis zu dem Punkt, an dem konventionelle Einzelmaschinen-Tools sie nicht einfach speichern oder analysieren können.
- Ist ein größerer Gesundheitsdatensatz immer zuverlässiger?
- Nein. Der Umfang kann die Fähigkeit verbessern, Muster zu erkennen, aber wenn die Daten nicht repräsentativ oder von schlechter Qualität sind, können große Datensätze Verzerrungen verstärken. Zuverlässige Schlussfolgerungen hängen von Datenqualität, Repräsentativität, Validierung und Interoperabilität ab, nicht allein von der Größe.
Methods for this concept
- Hospital Readmission Prediction Model
- Real-World Evidence Studies
- Machine learning-assisted copy number variation analysis
- Digital Health Acceptance Scale
- Data Protection and Privacy in Research
- Data Warehousing
- Machine learning-assisted microbiome diversity analysis
- Machine learning-assisted pathway enrichment analysis
Related concepts
- Gesundheitsdatenmanagement und -analyse
- Management und Analyse von Gesundheitsdaten
- Governance und Datenqualität im Gesundheitswesen
- Informationssysteme in Gesundheitseinrichtungen
- Elektronische Gesundheitsakten und Interoperabilität
- Maschinelles Lernen und prädiktive Analysen in der klinischen Versorgung