O que torna os dados de saúde 'big data'?

Os dados de saúde são frequentemente descritos como big data quando são grandes em volume, chegam ou mudam rapidamente (velocidade) e combinam muitos tipos heterogêneos e não estruturados (variedade), a ponto de as ferramentas convencionais de máquina única não conseguirem armazená-los ou analisá-los facilmente.

Um conjunto de dados de saúde maior é sempre mais confiável?

Não. A escala pode melhorar a capacidade de detectar padrões, mas se os dados forem não representativos ou de baixa qualidade, grandes conjuntos de dados podem reforçar o viés. Conclusões confiáveis dependem da qualidade dos dados, representatividade, validação e interoperabilidade, não apenas do tamanho.

Tecnologias de Big Data e Aplicações em Saúde

Big data em saúde refere-se a conjuntos de dados cujo volume, velocidade e variedade excedem a capacidade das ferramentas convencionais de gerenciamento de dados, e às tecnologias distribuídas desenvolvidas para armazená-los e analisá-los. As aplicações abrangem dados clínicos, genômicos, administrativos e de sensores, com o objetivo de extrair padrões e previsões que conjuntos de dados menores ou de fonte única não podem suportar.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

As tecnologias de big data em saúde são os métodos de armazenamento e análise distribuídos projetados para conjuntos de dados relacionados à saúde caracterizados por alto volume, velocidade e variedade, aplicados a dados clínicos, genômicos, administrativos e gerados por dispositivos para apoiar a previsão, descoberta e gerenciamento.

Scope

Este tópico aborda as características definidoras de big data aplicadas à saúde, as abordagens tecnológicas para lidar com dados em escala e aplicações representativas na área da saúde, como análises preditivas e gerenciamento de populações de alto risco. Também são observados os limites e riscos dessas abordagens. É uma visão geral de referência de métodos e aplicações, não de implementação ou orientação clínica.

Key concepts

Volume, velocidade e variedade (os 'três Vs')
Armazenamento e processamento distribuídos
Dados heterogêneos e não estruturados
Análise preditiva
Aprendizado de máquina em medicina
Dados genômicos e de sensores
Escalabilidade e interoperabilidade
Generalizabilidade e viés em grandes conjuntos de dados

Mechanisms

Os dados de saúde cresceram em escala e heterogeneidade à medida que registros eletrônicos, imagens, genômica, reivindicações e sensores vestíveis se acumulam. As abordagens de big data abordam isso distribuindo o armazenamento e a computação em muitas máquinas e acomodando dados estruturados e não estruturados juntos. Uma vez que os dados estão em escala, métodos analíticos, incluindo cada vez mais o aprendizado de máquina, são aplicados para detectar padrões e construir previsões, como a identificação de pacientes de alto risco ou alto custo para gerenciamento direcionado. O valor desses métodos depende da qualidade dos dados, representatividade e interoperabilidade; grandes conjuntos de dados não garantem por si só conclusões válidas e podem amplificar o viés se os dados subjacentes forem distorcidos.

Clinical relevance

As tecnologias de big data sustentam ferramentas preditivas, modelos de risco e sistemas de suporte à decisão que são cada vez mais usados na prestação de cuidados de saúde e na pesquisa. Compreender suas características e limites ajuda os usuários a julgar quando análises em larga escala agregam valor e quando a escala mascara viés ou baixa qualidade de dados. Este tópico descreve tecnologias e aplicações; não direciona o diagnóstico ou tratamento individual.

History

À medida que os dados de saúde coletados rotineiramente se expandiram no início dos anos 2010, o conceito de big data, originalmente enquadrado em torno de volume, velocidade e variedade em sistemas de informação, foi aplicado à saúde. Revisões mapearam sua promessa para uso clínico, genômico e operacional, e análises para gerenciamento de populações de alto risco demonstraram aplicações concretas. A subsequente ascensão do aprendizado de máquina na medicina baseou-se nesses grandes conjuntos de dados, ao mesmo tempo em que aguçou a atenção para o viés, validação e generalizabilidade.

Debates

Mais dados significam automaticamente melhor evidência em saúde?: O entusiasmo pelo big data é temperado pela preocupação de que a escala pode consolidar, em vez de superar, o viés quando os dados subjacentes são não representativos ou de baixa qualidade; revisões enfatizam que o volume deve ser combinado com qualidade de dados, validação e interoperabilidade para produzir resultados confiáveis.

Key figures

David W. Bates
Alvin Rajkomar
Isaac Kohane

Seminal works

raghupathi-2014
bates-2014

Frequently asked questions

O que torna os dados de saúde 'big data'?: Os dados de saúde são frequentemente descritos como big data quando são grandes em volume, chegam ou mudam rapidamente (velocidade) e combinam muitos tipos heterogêneos e não estruturados (variedade), a ponto de as ferramentas convencionais de máquina única não conseguirem armazená-los ou analisá-los facilmente.
Um conjunto de dados de saúde maior é sempre mais confiável?: Não. A escala pode melhorar a capacidade de detectar padrões, mas se os dados forem não representativos ou de baixa qualidade, grandes conjuntos de dados podem reforçar o viés. Conclusões confiáveis dependem da qualidade dos dados, representatividade, validação e interoperabilidade, não apenas do tamanho.