Por que o processamento de texto clínico é mais difícil do que o texto geral?

As notas clínicas são densas em abreviações, erros ortográficos, fragmentos de modelos e termos específicos do domínio, e o significado muitas vezes depende do contexto, como negação ou incerteza, o que torna a extração precisa mais difícil do que para a prosa comum.

O que é normalização de conceitos em PLN clínica?

É a etapa de mapear uma menção textual, como 'ataque cardíaco' ou 'enfarte do miocárdio', para um único conceito padronizado num vocabulário controlado, de modo que diferentes formas de superfície da mesma ideia possam ser tratadas consistentemente por sistemas a jusante.

Processamento de Linguagem Natural em Documentação Clínica

Uma grande parte da informação clínica é registada como texto livre, notas narrativas, sumários de alta, relatórios de radiologia e patologia, em vez de códigos estruturados. O processamento de linguagem natural (PLN) em documentação clínica é o conjunto de métodos computacionais que extraem informação estruturada e utilizável por máquinas desse texto, apoiando tarefas desde a codificação e identificação de coortes até à alimentação de sistemas de apoio à decisão e previsão.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

O processamento de linguagem natural clínica é a aplicação de métodos linguísticos computacionais a texto livre clínico, a fim de identificar, normalizar e estruturar a informação que contém, por exemplo, mapeando menções de condições, achados e medicamentos para conceitos codificados, enquanto se considera o contexto, como negação e incerteza.

Scope

A entrada abrange as principais tarefas de PLN aplicadas a narrativas clínicas, como tokenização, reconhecimento de entidades nomeadas, normalização de conceitos para terminologias controladas, deteção de negação e afirmação, e extração de relações; pipelines de PLN clínica estabelecidas; as dificuldades particulares da linguagem clínica; e a transição de abordagens baseadas em regras para abordagens estatísticas e neurais. É um tópico metodológico que descreve como o texto é processado, não uma fonte de recomendações clínicas.

Key concepts

Reconhecimento de entidades nomeadas e normalização de conceitos
Deteção de negação e afirmação
Extração de informação e extração de relações
Mapeamento de conceitos para UMLS / terminologias controladas
Pipelines de PLN clínica (por exemplo, cTAKES)
Métodos baseados em regras vs. estatísticos vs. neurais
Desidentificação de texto clínico
Ambiguidade, abreviação e mudança de domínio

Mechanisms

O PLN clínico tipicamente encadeia etapas: segmentar e tokenizar texto, reconhecer menções clinicamente relevantes, normalizá-las para conceitos num vocabulário controlado e detetar o contexto, como negação, incerteza ou se um achado se refere ao paciente ou a um membro da família. Pipelines abertas como o cTAKES empacotaram estes componentes para narrativas clínicas e mapearam termos extraídos para conceitos padronizados (Savova, 2010). A normalização de conceitos baseia-se na integração de recursos como o UMLS, que liga muitos vocabulários de origem para que diferentes formas de superfície se resolvam em identificadores comuns (Bodenreider, 2004). O campo evoluiu de regras construídas manualmente para modelos estatísticos e neurais, enquanto as tarefas subjacentes permanecem consistentes (Nadkarni, 2011).

Clinical relevance

Como muitos detalhes clinicamente significativos residem em notas narrativas, o PLN determina o quanto desses detalhes se torna disponível para codificação, medição de qualidade, seleção de coortes e apoio à decisão a jusante. Esta entrada descreve como o texto clínico é processado e estruturado; a informação extraída requer validação e supervisão humana, e o texto não é uma base para qualquer decisão individual de diagnóstico ou tratamento.

Evidence & guidelines

O PLN clínico é avaliado principalmente através de métricas de desempenho específicas da tarefa e desafios de avaliação partilhados, em vez de ensaios de resultados clínicos. Artigos introdutórios e de sistemas documentam o pipeline padrão e os seus componentes (Nadkarni, 2011; Savova, 2010), e a normalização de conceitos depende da integração de terminologias como o UMLS (Bodenreider, 2004). O desempenho é conhecido por variar entre instituições e tipos de notas, pelo que a validação local é enfatizada.

History

O PLN clínico cresceu a partir de sistemas iniciais de processamento de linguagem médica e correspondência de padrões baseada em regras, amadurecendo nos anos 2000 com pipelines de código aberto reutilizáveis e desafios de avaliação partilhados que padronizaram tarefas e benchmarks. Ao longo dos anos 2010, o campo mudou de métodos baseados em regras e de aprendizagem de máquina clássica para modelos de linguagem neurais e, posteriormente, baseados em transformadores, mantendo as mesmas tarefas centrais de extração e normalização.

Debates

Quão portáteis são os sistemas de PLN clínica entre locais?: Modelos e regras ajustados às notas de uma instituição frequentemente degradam-se nas de outra devido a diferenças em modelos, abreviações e estilo de documentação, levantando debate sobre a generalizabilidade, a necessidade de adaptação local e corpora anotados partilhados.

Key figures

Wendy W. Chapman
Guergana K. Savova
Prakash M. Nadkarni
Lucila Ohno-Machado

Seminal works

nadkarni-2011
savova-2010
bodenreider-2004

Frequently asked questions

Por que o processamento de texto clínico é mais difícil do que o texto geral?: As notas clínicas são densas em abreviações, erros ortográficos, fragmentos de modelos e termos específicos do domínio, e o significado muitas vezes depende do contexto, como negação ou incerteza, o que torna a extração precisa mais difícil do que para a prosa comum.
O que é normalização de conceitos em PLN clínica?: É a etapa de mapear uma menção textual, como 'ataque cardíaco' ou 'enfarte do miocárdio', para um único conceito padronizado num vocabulário controlado, de modo que diferentes formas de superfície da mesma ideia possam ser tratadas consistentemente por sistemas a jusante.