Upload
internet
View
110
Download
0
Embed Size (px)
Citation preview
Codificação automatizada de documentos clínicos
Prof Dr Stefan Schulz Universidade de Freiburg (Alemanha)
Linguagem Natural (Texto)
Introdução Métodos Resultados Conclusão
Introdução Métodos Resultados Conclusão
Introdução Métodos Resultados Conclusão
Introdução Métodos Resultados Conclusão
SEQ DE MULTIPLOS AVCS , HIST DE CRISES
CONVULSIVAS PREVIAS AOS EPISODIOS DESTA NOITE ,
APRESENTANDO PIORA GERAL , DESIDRATACAO LEVE
SEM PIUORA DA FUNACAO RENAL, RX COM
ATELECTASIAS DE BASES - CONSOLIDADCEOS??
PACIENTE SEM FEBRE MEDIDAAQUI -MAX 37,1 TEM
NIVEL SERICO EM ANDAMNETO DE FENITOINA A SER
CHECADO COM FAMILAIR EM EM 24 H RECEBE TTO
ATB COM CEFUROXIMA VO -HMG NORMAL É DM SEM
IMPORTANTE DESCOPENSACAO.
Introdução Métodos Resultados Conclusão
Paciente procedente do Hospital de Alvorada onde estava internado desde 28/05 por broncoespasmo e
disfunção respiratória, recebendo ampi-sulbactam e beta 2 agonista de 2/2h, com boa evolução.
Encaminhado ao HCPA em 01/06 por ter iniciado dia 31/05 com distensão e dor abdominal
importantes, acompanhado de vômitos fecalóides, sendo iniciado metro e genta. Havia recebido
albendazol durante a internação, sem eliminar vermes. Avaliado pela CIPED: provável obstrução
intestinal por ascaris. Na chegada a UTIP feito push soro fisiologico, CHAD (Hb 9 do dia 30/05) e
deixado O2 3l/min. Foi submetido a laparotomia exploradora em 01/06,sem intercorrências com
infestação maciça por ascaris e necrose intestinal, sendo realizada enterectomia -60cm- e ileostomia.
Recebeu CHAD novamente no pós operatório (Hb 7,6), precisou de dopa e vários pushs de soro
fisiológico. Em 03/06 apresentou RG com coloração fecalóide e eliminou ascaris VO. Fez RX sem
evidência de obstrução, tracionada sonda de entérica para gástrica com melhora do RG. Foi extubado,
apresentou estridor que cedeu com NBZ com adrenalina e dexa. Apresentou bradicardia. Suspenso
fentanil, permaneceu bradicárdico, necessitou atropina. Avaliado pela cardiologia sem particularidades.
Após alta da UTI, recebeu óleo mineral e permaneceu eliminando ascaris. Após retirada do óleo
mineral foi iniciado dieta, com boa aceitação,
e albendazol. Recebe alta em bom estado geral, aceitando dieta
VO, SV estáveis, apresentando hiperemia ao
redor da ileostomia. Retorno com CIPED.
Introdução Métodos Resultados Conclusão
Structured Data
… indispensável para documentação e comunicação
Prestação de serviços de saúde
Pesquisa científica
Médico / Paciente
Ensino
Linguagem Natural (Texto)
Introdução Métodos Resultados Conclusão
e.g. Hospital Universitário
Freiburg (p.a.)
280.000 Sumários de Alta
140.000 Laudos de imagem
55.000 Laudos anatomopatológicos
40.000 Laudos de imagens
70.000 Outros textos
600.000 documentos em texto livre por ano.
Linguagem Natural (Texto)
Introdução Métodos Resultados Conclusão
Dadosestruturados
Introdução Métodos Resultados Conclusão
…indispensável para abstracção:
Codificação de doenças e procedimentos
Indexação bibliográfica
Gestão hospitalar
Apoio a decisão
Epidemiologia
Dadosestruturados
Introdução Métodos Resultados Conclusão
…requer sistemas terminológicos
CID MeSH /DeCS UMLS LOINC SNOMED CT etc., etc.
Introdução Métodos Resultados Conclusão
Dadosestruturados
Dadosestruturados
Linguagem Natural (Texto)
Introdução Métodos Resultados Conclusão
Levantamento de dados
- +
+ -
Linguagem Natural (Texto)
Dadosestruturados
QualidadeCusto
Introdução Métodos Resultados Conclusão
Levantamento de dados estruturados Volume – Qualidade - Motivação
Qualidade
Volume
motivação alta
motivação média
motivação baixa
Padrão Ouro
Introdução Métodos Resultados Conclusão
Dadosestruturados
Linguagem Natural (Texto)
Introdução Métodos Resultados Conclusão
Dadosestruturados
Linguagem Natural (Texto)
Método: Text Mining
Introdução Métodos Resultados Conclusão
Investigação
• Dados
• Corpus de documentos clínicos (laudos, sumários)
• Sistema terminológico que cobre o espaço conceitual
do domínio
• Usando métodos de “mineração de texto” para
representar o conteúdo dos documentos
• Qual é a qualidade do mapeamento em
comparação com codificação manual?
Introdução Métodos Resultados Conclusão
Estudo
• Fonte:
– sumários de alta do departmento
de cardiologia do Hospital de
Clínicas de Porto Alegre, Brasil
• Destino
• SNOMED Clinical Terms, 01/2009
• Linguagens: Inglês, Espanhol
Introdução Métodos Resultados Conclusão
SNOMED CT
Standardized Nomenclature of Medicine – Clinical
Terms:
• Sistema de codificação para todo o conteúdo do prontuário
eletrônico
• Padrão terminológico global
• Manutenção / desenvolvimento: IHTSDO (International Health
Terminology Standards Development Organisation):
Membros: US, UK, AU, NZ, CA, DK, SE, NL, LV, ES
Introdução Métodos Resultados Conclusão
SNOMED CT como vocabulário controlado
Termos médicos (inclusive sinônimos
e traduções) são conectados com
conceitos (portadores de significado)
311 000conceitos
~750 000 termos em Inglês,
~400 000 em Espanhol
Introdução Métodos Resultados Conclusão
SNOMED CT como sistema formal
taxonomias:especialização
(is-a)
Introdução Métodos Resultados Conclusão
SNOMED CT como sistema formal
Restrições: lógica de descriçãoC1 – Rel – C2 significa:x: instanceOf(x, C1) y: instanceOf(C2) Rel(x,y)ouC1 ⊑ Rel.C2
Relações (Attributos): Associated morphologyFinding site
(50 tipos)
Introdução Métodos Resultados Conclusão
SNOMED CT como sistema formal
definierte vs. primitive Konzepte
conceitos definidos conceitos primitivos ⊑
Introdução Métodos Resultados Conclusão
Social context (10)CommunityFamilyGroup
(…)Special concept
Namespace conceptNavigational conceptNon-current concept
Specimen (45)Biopsy sampleBody substance sampleCardiovascular sample(…)
Staging and scales (6)Assessment scalesEndometriosis
classificationof American Fertility
Society(…)
Substance (11)Allergen classBiological substanceBody substance (…)
Body structure (10)Acquired body structureAnatomical organizational pattern(…)
Clinical finding (22)Administrative statusesAdverse incident outcome categories
(…)Environment or geographical location
EnvironmentGeogr. and/or political region of the
worldEvent (19)
AbuseAccidental eventBioterrorism related event (…)
Linkage conceptAttributeLink assertion
Observable entityAge AND/OR growth periodBody product observable (…)
Clin. history / examination observable (21)Device observableDrug therapy observableFeature of Entity (…)
Organism (11)AnimalChromistaInfectious agent (…)
Pharmaceutical / biologic product (58)
Alcohol productsAlopecia preparationAlternative medicines
(…)Physical force (21)
AltitudeElectricity
(…)Physical object (8)
DeviceDomestic, office and
garden artefactFastening
(…)Procedure (23)
Administrative procedureCommunity health
procedure(…)
Qualifier value (52)ActionAdditional dosage
instructions(…)
Record artifactRecord organizerRecord type
Situation with explicit context (17)A/N risk factorsCritical incident factors
(…)
SNOMED CT Top
Introdução Métodos Resultados Conclusão
SNOMED CT : Hierarquias taxonômicas
Introdução Métodos Resultados Conclusão
SNOMED CT : Hierarquias taxonômicas
Introdução Métodos Resultados Conclusão
Relatório de alta: amostra
# HAS # DM # Miocardiopatia dilatada chagásica (FE 35%) # Ca de prostata -
orquiectomia (2004) # Cardiopatia isquêmica - IAM em 2005, com colocação de
stent em DA e lesão severa inoperável em CD Pct vem a emergência em 20/03
com quadro de dor torácica típica, sem elevação enzimática, com diagnóstico
de angina instável e fibrilação atrial não identificada em avaliações prévias.
Adicionalmente, apresentava descompensação do diabetes com sindrome
hiperosmlar não cetótica. Recebe tratamento clínico para otimização do quadro
e é submetido a novo cateterismo em 28/03, que demonstra CD ocluída no
terço proximal, DA com stent rpoximal com lesão de 40% no seu interior e Mg
de Cx com lesão de 60-65%. Recebe alta em bom estado geral, sem dor
torácica, anticoagulado, com plano de retorno ambulatorial para equipe de
cardiopatia isquêmica e para o ambulatório de anticoagulação.
acrónimos
abreviações
erros depontuação
erros de digitação
estilo telegráfico
Introdução Métodos Resultados Conclusão
PLN (processamento de linguagem natural)
identificarsentenças
verificarortografia
expansãoacrônimos
identificaçãode nomes
etiquetadortipo de palavra
extraçãofrases nominais
deteção de contexto
abstraçãomorfo-semântica
SCT - EN
SCT - SP
criaçãosubconjunto
abstraçãomorfo-semântica
MID-representaçãoSNOMED CT
MID-representação
candidatos a termo
Introdução Métodos Resultados Conclusão
Desafios lingüísticos da linguagem médica:
• Derivação, neologismos:
nefrótico, antiinflamatórios, parkinsoniana, aidéticos
• Composição:
musculoesqueletico, esplenomegalia,
transfosforribosidasa, polyradiculoneuropathy
• Sinonímia: hepático = do figado, renal = do rim,
cephal... = cabeça
• Ambigüidade:
head = cabeça ou chefe
Introdução Métodos Resultados Conclusão
Ferramentas PLN
• Detector de sentenças, etiquetador : openNLP, treinado com
textos que foram manualmente anotados
• Expansor de acrónimos: casamento de padrões (expressões
regulares) contra base de acrónimos, disambiguação por
contexto locat (coocorrencia de token em janela de 3
tokens)
• Detector de frases nominais: identificação de seqüências
típicas de etiquetas POS na SNOMED CT espanhola
“aportuguesada”
• Maior desafio: mapear frases nominais entre Português
(documentos) e Espanhol / Inglês (SNOMED)
Introdução Métodos Resultados Conclusão
Mapeamento de termos médicos
Problema:
highbloodpressure
hipertensãoarterial
meningoencefalite
Bluthochdruck
Entzündung
von Hirnhäuten
Gehirn
und
meningocerebral inflammation hipertensiónarterialmeningoencefaliti
s
Introdução Métodos Resultados Conclusão
Aborgagem MorphoSaurus: construir equivalências semánticas a nivel de fragmentos de palavras
Átomos semânticos ou „subwords“
• Definição: sequência de caracteres cujo significado
não decorre dos significados dos componentes,
exemplo: diafise mas não dia + fisediáfise = haste do osso, fise (gr. physis) = natureza
neur + ite, mas neurose, não neur + oseneur… = nervo, -ite = inflamação, -ose = doença:
Uma neurite é uma inflamação de nervo(s), mas neurose não é uma
doença de nervo(s)
• Subwords podem ser morfemas assim como
combinações de morfemas, inclusive palavras
inteiras
Introdução Métodos Resultados Conclusão
Sistema MorphoSaurus
• Sistema de indexação morfo-semântica
• Traduz texto para interlíngua
• Domínio: Linguagem Clínica
• Idiomas: Inglês, Alemão, Português, Espanhol, Sueco, Francês
• Componentes:
Léxico de subwords
Tesauro
Parser morfossintático
Indexador
Introdução Métodos Resultados Conclusão
Modelo do Léxico
String of characters
Type = {stem, invariant, prefix, infix, suffix, initial prefix, terminal suffix}
Language = {English, German, Spanish, Portuguese, French, Swedish}
Lexeme(e.g. „anticoncepcionais“)
[anti, prefix, portuguese][concepc, stem, portuguese][ionais, terminal suffix, portuguese]
(e.g. „partnership“)
[partner, stem, english][ship, suffix, english]
(e.g. „ship“)
[ship, invariant, english]
Introdução Métodos Resultados Conclusão
Modelo do Léxico
String of characters
Type = {stem, invariant, prefix, infix, suffix, initial prefix, terminal suffix}
Language = {English, German, Spanish, Portuguese, French,Swedish}
Lexeme
MID1..n 1
MID42= ([muscle, stem, english], [muscul, stem, english], [myo, prefix, english], [muscul, stem, portuguese], [mio, prefix, portuguese], [muskel, stem, german], [muskul, stem, german],
[myo, prefix, german])
MIDs identificam grupos de lexemas sinônimos
Introdução Métodos Resultados Conclusão
Modelo do Léxico
String of characters
Type = {stem, invariant, prefix, infix, suffix, initial prefix, terminal suffix}
Language = {English, German, Spanish, Portuguese, French,Swedish}
Lexeme
MID1..n 1
1
12…n
2…n
has-sense
expands-to
associa um MID ambíguo com dois ou mais MID nãoambíguos
(expansão paradigmática)
associa um MID de sentido não atômico com dois ou mais MID atômicos
(expansão sintagmática)
Introdução Métodos Resultados Conclusão
Modelo do Léxico
MID
1
12…n
2…n
has-sense
expands-to
associa um MID ambíguo com dois ou mais MID nãoambíguos
(expansão paradigmática)
associa um MID de sentido não atômico com dois ou mais MID atômicos
(expansão sintagmática)
MID16: ([head, stem, english])- has-sense MID12:
([caput, stem, english], [capit, stem, english], [cephal, stem, english], [cefal, stem, portuguese], [cabec, stem, portuguese])
- has-sense MID34: ( [chief, stem, english], [chef, stem, portuguese])
MID26: ([myalg, stem, english], [mialg, stem, portuguese])
-expands-to MID42: ([muscle, stem, english],
[muscul, stem, english], [muscul, stem, portuguese])
-expands-to MID88: ([pain, stem, english],
[dor, invariant, portuguese], [algia, suffix, portuguese])
Introdução Métodos Resultados Conclusão
(MIDs)
Hahn, Schulz et al., RIAO 2004
Queries: German, Documents: English(OHSUMED collection)
Baseline: English / English
Morphosaurus Indexing
Automated Query Translation+Dictionary Lookup
Sistema MorphoSaurus : resultados experimentais em cenário CLIR
Introdução Métodos Resultados Conclusão
PLN (processamento de linguagem natural)
identificarsentenças
verificarortografia
expansãoacrônimos
identificaçãode nomes
etiquetadortipo de palavra
extraçãofrases nominais
deteção de contexto
abstraçãomorfo-semântica
SCT - EN
SCT - SP
criaçãosubconjunto
abstraçãomorfo-semântica
MID-representaçãoSNOMED CT
MID-representação
candidatos a termo
Introdução Métodos Resultados Conclusão
Heurística deMapeamento
Heurística de mapeamento: Exemplo
SNOMED CTConcept Description
MIDs
ENG: Congestive heart failure #abund #cardiac #deficien
ENG: Congestive cardiac failure #abund #cardiac #disorder
POR: Insuficiência cardíaca #insuff #cardiac
SPA: Insuficiencia cardíaca #insuff #cardiac
SPA: Insuficiencia cardíaca congestiva #insuff #cardiac #abund
Introdução Métodos Resultados Conclusão
Heurística de mapeamento
• Para cada “candidato a termo” no documento
• decida se existem um termo SNOMED correspondentes
• caso sim, seleccione o melhor termo SNOMED
• Critérios de preferência:
• Sequências “típicas” de etiquetas POS, ex:
“Infarto agudo do miocárdio”
substantivo – adjetivo – DE – substantivo
• coincidência de MIDs
• threshold: 60%
• Em caso de falha: verifique se “candidato a termo”
corresponde para dois conceitos da SNOMED , usando
relacionamentos da SNOMED para preselecção
Introdução Métodos Resultados Conclusão
Padrão ouro (kappa = 0.89)
Introdução Métodos Resultados Conclusão
Resultados preliminares
Number of tokens (MIDs) Correct Mappings2 66%3 71%4 80%5 89%6 79%7 80%8 75%9 45%10 25%
Introdução Métodos Resultados Conclusão
Próximo passo: identificar contextos
• Problema: nem toda ocorrência de um termo em um
documento refere a uma instância concreta de um conceito
terminológico ou ontológico
• Contextos alternativos:
• planos
• hipóteses
• negação
• Ignorar contextos: dados não confiáveis
Introdução Métodos Resultados Conclusão
acute abdomen
CTabdomen
aortal aneurysm
aneurysm-ectomy
vascular prosthesis
deathsystemicinfection
multiple organ failure
vasoactive drug
hemodialysis
Paciente interna por quadro de abdome agudo. TC de abdome mostrou aneurisma de aorta com evidencia de extravasamento de contraste. Levado a cirurgia de urgência, sendo realizada aneurismectomia com colocação de prótese. No pós-operatório evoluiu com síndrome da resposta inflamatória sistêmica, com disfunção de múltiplos órgãos e instabilidade hemodinâmica. Apesar do manejo com drogas vasoativas, reposição hídrica e hemodiálise veno-venosa crônica, o paciente apresentou piora progressiva, evoluindo para óbito.
Ontology
Contextos: Exemplo 1
Introdução Métodos Resultados Conclusão
incisionalhernia herniorrhaphy
operation room
liver transplant
operation
• instance • not instantiated• reference to a
plan
operation
• reference to a suspendedplan
• instance • referenceto a plan
• NOT referringto the samepatient
• reference to a new plan
• not yet executed
PACIENTE COM HÉRNIA INCISIONAL INTERNOU PARA REALIZAÇÃO DE HERNIOPLASTIA PORÉM A CIRURGIA FOI SUSPENSA DEVIDO A NECESSIDADE DE SALA COM URGÊNCIA PARA TRANSPLANTE HEPÁTICO. RECEBE ALTA COM ORIENTAÇÕES E CIRURGIA REMARCADA.
Ontology
Contextos: Exemplo 2
Introdução Métodos Resultados Conclusão
ConclusãoConclusão
• Trabalho ainda não concluído– primeiros resultados mostram que o mapeamento para
SNOMED funciona através de idiomas
• Trabalho futuro– completar o “pipeline”
– Avaliar impacto de cada elemento do pipeline
– Identificar contextos
– Uso da estrutura ontológica da SNOMED
– Publicação em preparação (IEEE Transactions on Information Technology in Biomedicine)
Introdução Métodos Resultados Conclusão
Acknowledgements
• German Research Foundation (DFG)
• International Bureau of the
German Ministry of Research (BMBF-IB)
• Brazilian National Research Council (CNPq)
• Paraná Catholic University (PUCPR), Curitiba
• Hospital de Clínicas de Porto Alegre (HCPA)
• Averbis GmbH, Freiburg
acute abdomen
CTabdomen
aortal aneurysm
aneurysm-ectomy
vascular prosthesis
deathsystemicinfection
multiple organ failure
vasoactive drug
hemodialysis
Paciente interna por quadro de abdome agudo. TC de abdome mostrou aneurisma de aorta com evidencia de extravasamento de contraste. Levado a cirurgia de urgência, sendo realizada aneurismectomia com colocação de prótese. No pós-operatório evoluiu com síndrome da resposta inflamatória sistêmica, com disfunção de múltiplos órgãos e instabilidade hemodinâmica. Apesar do manejo com drogas vasoativas, reposição hídrica e hemodiálise veno-venosa crônica, o paciente apresentou piora progressiva, evoluindo para óbito.
Ontology
incisionalhernia herniorrhaphy
operation room
liver transplant
operation
• instance • not instantiated• reference to a
plan
operation
• reference to a suspendedplan
• instance • referenceto a plan
• NOT referringto the samepatient
• reference to a new plan
• not yet executed
PACIENTE COM HÉRNIA INCISIONAL INTERNOU PARA REALIZAÇÃO DE HERNIOPLASTIA PORÉM A CIRURGIA FOI SUSPENSA DEVIDO A NECESSIDADE DE SALA COM URGÊNCIA PARA TRANSPLANTE HEPÁTICO. RECEBE ALTA COM ORIENTAÇÕES E CIRURGIA REMARCADA.
Ontology