Tecnologias de Big Data e Aplicações em Saúde
Big data em saúde refere-se a conjuntos de dados cujo volume, velocidade e variedade excedem a capacidade das ferramentas convencionais de gerenciamento de dados, e às tecnologias distribuídas desenvolvidas para armazená-los e analisá-los. As aplicações abrangem dados clínicos, genômicos, administrativos e de sensores, com o objetivo de extrair padrões e previsões que conjuntos de dados menores ou de fonte única não podem suportar.
Definition
As tecnologias de big data em saúde são os métodos de armazenamento e análise distribuídos projetados para conjuntos de dados relacionados à saúde caracterizados por alto volume, velocidade e variedade, aplicados a dados clínicos, genômicos, administrativos e gerados por dispositivos para apoiar a previsão, descoberta e gerenciamento.
Scope
Este tópico aborda as características definidoras de big data aplicadas à saúde, as abordagens tecnológicas para lidar com dados em escala e aplicações representativas na área da saúde, como análises preditivas e gerenciamento de populações de alto risco. Também são observados os limites e riscos dessas abordagens. É uma visão geral de referência de métodos e aplicações, não de implementação ou orientação clínica.
Key concepts
- Volume, velocidade e variedade (os 'três Vs')
- Armazenamento e processamento distribuídos
- Dados heterogêneos e não estruturados
- Análise preditiva
- Aprendizado de máquina em medicina
- Dados genômicos e de sensores
- Escalabilidade e interoperabilidade
- Generalizabilidade e viés em grandes conjuntos de dados
Mechanisms
Os dados de saúde cresceram em escala e heterogeneidade à medida que registros eletrônicos, imagens, genômica, reivindicações e sensores vestíveis se acumulam. As abordagens de big data abordam isso distribuindo o armazenamento e a computação em muitas máquinas e acomodando dados estruturados e não estruturados juntos. Uma vez que os dados estão em escala, métodos analíticos, incluindo cada vez mais o aprendizado de máquina, são aplicados para detectar padrões e construir previsões, como a identificação de pacientes de alto risco ou alto custo para gerenciamento direcionado. O valor desses métodos depende da qualidade dos dados, representatividade e interoperabilidade; grandes conjuntos de dados não garantem por si só conclusões válidas e podem amplificar o viés se os dados subjacentes forem distorcidos.
Clinical relevance
As tecnologias de big data sustentam ferramentas preditivas, modelos de risco e sistemas de suporte à decisão que são cada vez mais usados na prestação de cuidados de saúde e na pesquisa. Compreender suas características e limites ajuda os usuários a julgar quando análises em larga escala agregam valor e quando a escala mascara viés ou baixa qualidade de dados. Este tópico descreve tecnologias e aplicações; não direciona o diagnóstico ou tratamento individual.
History
À medida que os dados de saúde coletados rotineiramente se expandiram no início dos anos 2010, o conceito de big data, originalmente enquadrado em torno de volume, velocidade e variedade em sistemas de informação, foi aplicado à saúde. Revisões mapearam sua promessa para uso clínico, genômico e operacional, e análises para gerenciamento de populações de alto risco demonstraram aplicações concretas. A subsequente ascensão do aprendizado de máquina na medicina baseou-se nesses grandes conjuntos de dados, ao mesmo tempo em que aguçou a atenção para o viés, validação e generalizabilidade.
Debates
- Mais dados significam automaticamente melhor evidência em saúde?
- O entusiasmo pelo big data é temperado pela preocupação de que a escala pode consolidar, em vez de superar, o viés quando os dados subjacentes são não representativos ou de baixa qualidade; revisões enfatizam que o volume deve ser combinado com qualidade de dados, validação e interoperabilidade para produzir resultados confiáveis.
Key figures
- David W. Bates
- Alvin Rajkomar
- Isaac Kohane
Related topics
Seminal works
- raghupathi-2014
- bates-2014
Frequently asked questions
- O que torna os dados de saúde 'big data'?
- Os dados de saúde são frequentemente descritos como big data quando são grandes em volume, chegam ou mudam rapidamente (velocidade) e combinam muitos tipos heterogêneos e não estruturados (variedade), a ponto de as ferramentas convencionais de máquina única não conseguirem armazená-los ou analisá-los facilmente.
- Um conjunto de dados de saúde maior é sempre mais confiável?
- Não. A escala pode melhorar a capacidade de detectar padrões, mas se os dados forem não representativos ou de baixa qualidade, grandes conjuntos de dados podem reforçar o viés. Conclusões confiáveis dependem da qualidade dos dados, representatividade, validação e interoperabilidade, não apenas do tamanho.
Methods for this concept
- Hospital Readmission Prediction Model
- Real-World Evidence Studies
- Machine learning-assisted copy number variation analysis
- Digital Health Acceptance Scale
- Data Protection and Privacy in Research
- Data Warehousing
- Machine learning-assisted microbiome diversity analysis
- Machine learning-assisted pathway enrichment analysis