Upload
emerson-moretto
View
20
Download
0
Embed Size (px)
DESCRIPTION
Apresentacao do meu trabalho no CBIS 2013
Citation preview
5/23/2018 Higienizacao de Base de Dados do SUS
1/16
Projeto de Identificao de Pacientesdo Carto SUS do estado de So Paulo
Secretaria Estadual de Sade de So Paulo - SESSP
Laboratrio de Sistemas Integrveis e Tecnolgico - LSITEC
Organizao Pan-!mericana da Sade - OP!S
Laboratrio de Sistemas Integrveis " LSI EP#$SP
Emerson Moretto
5/23/2018 Higienizacao de Base de Dados do SUS
2/16
O desa%io
Identi%icar e remover &acientes du&licadosemuma base com
~30 milhesde &acientes
Estat'sticas erradas
Consultas incertas(egistros )om*nimos ou so a mesma &essoa+Informaes no confieis
!s "ro#lemas
5/23/2018 Higienizacao de Base de Dados do SUS
3/16
Como resolver+
,o entanto
$enhumcam&o . /001 signi%icativo
Com&arao de nomes no . to sim&les
Erros de di%itao
Erros de fon&tica
Maior "artedos registros no&ossuem documentos
&reenc)idos
Com"arando os re%istros entre si'
5/23/2018 Higienizacao de Base de Dados do SUS
4/16
Com&arar todos com todos+
30 micom&arando todoscom todos2
(()333345000000 com&ara6es7
Com&utacionalmente %alando82~ * anos
8 considerando 9ue cada com&arao de &acientes leva / ms
5/23/2018 Higienizacao de Base de Dados do SUS
5/16
! soluo
Criar conjuntos' +diiso e con,uista-
ou se:a;
!gru&ar os "oss.eis&acientes du&licados
e de&ois;
Com&arar todoscom todos; &or.m somentedentro do con:unto
5/23/2018 Higienizacao de Base de Dados do SUS
6/16
!gru&amento
Cintia < Souza = C/S1
Cintia asta criarmos um 2ash si%nificatio&ara cada &acienteusando fon&ticaeconsideraes so#re erros de di%itao
?uliano @oraes = 4$M5EAiuliano @oraes = 4$M5EAiuliano @orais = 4$M5E
C/S14$5E
Cintia 6erreira Sousa@e2 @aria Sousa
Primeiro nome %on.tico 7ltimo nome %on.tico7Primeiro nome da me %on.tico 7ltimo nome da me %on.tico
2ash si%nificatio 8 C/S1M5S1
EB2
5/23/2018 Higienizacao de Base de Dados do SUS
7/16
Com&arando
Com os gru&os de candidatos %ormados
(ealizamos as com&ara6es entre os candidatos
do mesmo %ru"oa&enas
/ B / B D/ B
B D B D B
/ Cintia < Souza = C/S1
D Cintia
5/23/2018 Higienizacao de Base de Dados do SUS
8/16
! com&arao
F %eita uma com"arao estat.stica9ue gera um"ercentual de similaridadeentre &acientes
Para os nomes; usamos algoritmos de dist9ncia decaracteresconsiderando %onemas e erros de digitao
!lgoritmo 4eenshteinGbastante modi%icadoH EB2 Cint)a
5/23/2018 Higienizacao de Base de Dados do SUS
9/16
! com&arao
nome Cint)a *@-nome do &ai Paulo Oliveira Souza B Paulo Oliveira Souza
?00; = "eso +0>*0-
data de nascimento 0#03#/34 B /#03#/34
5/23/2018 Higienizacao de Base de Dados do SUS
10/16
! com&arao
i% "ercentual de similaridadeK= 41
Com&arao . considerada candidatae vai &ara
uma base de dados de com&arao
O usurio analisa as com&ara6es candidatas
atrav.s de uma interface9ue acessa esta base
5/23/2018 Higienizacao de Base de Dados do SUS
11/16
Memonstrao
5/23/2018 Higienizacao de Base de Dados do SUS
12/16
Tela de listagem
5/23/2018 Higienizacao de Base de Dados do SUS
13/16
Tela de com&arao
5/23/2018 Higienizacao de Base de Dados do SUS
14/16
!r9uitetura>ase de dados
Carto S$SOracle /0g
>anco de dadosem rvore
desenvolvido &elo LSI
T)read decom&arao T)read de
com&arao
T)read decom&arao
Mistribuidor
ETL
Escalvel sobreTCP#IP
>anco de com&ara6es
PostgreSNL 4
Com&araoD8 @
5/23/2018 Higienizacao de Base de Dados do SUS
15/16
!lgumas in%orma6es t.cnicas
5/23/2018 Higienizacao de Base de Dados do SUS
16/16
Obrigado7
Emerson @oretto
emorettolsi>us">#r6inanciamento
Fesenolimento