27
iCube iCube: Um Cubo de Dados para Imagens Médicas Um Cubo de Dados para Imagens Médicas baseado em Similaridade baseado em Similaridade Aluna: Luana Peixoto Annibal Orientador: Ricardo Rodrigues Ciferri Co-orientador: Joaquim Cezar Felipe (FFCLRP-USP) Colaboradora: Cristina Dutra de Aguiar Ciferri (ICMC-USP) 1 iCube: Cubo de Imagens Médicas

iCubeiCube:gbd.dc.ufscar.br/.../meetings/meetings2009-2/Luana.iCube.pdf · 2009. 11. 12. · iCube: Cubo de Imagens Médicas 10. Agenda Contexto em que se Insere Objetivo Motivação

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • iCubeiCube::Um Cubo de Dados para Imagens Médicas Um Cubo de Dados para Imagens Médicas

    baseado em Similaridadebaseado em Similaridade

    Aluna: Luana Peixoto Annibal

    Orientador: Ricardo Rodrigues Ciferri

    Co-orientador: Joaquim Cezar Felipe (FFCLRP-USP)

    Colaboradora: Cristina Dutra de Aguiar Ciferri (ICMC-USP)

    1iCube: Cubo de Imagens Médicas

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 2

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 3

  • Contexto em que se insereContexto em que se insere

    � Armazenamento e recuperação de imagens digitais é fundamental na área médica ◦ Filmless (Radiologia)◦◦ Rápido

    � Ampla utilização de ferramentas de apoio a decisão◦ Superintendentes, diretores, líderes de equipe,

    gestores◦ Obtenção de informações estratégicas

    iCube: Cubo de Imagens Médicas 4

  • Contexto em que se insereContexto em que se insere

    � Desafio da pesquisa◦ Dificuldade em processar similaridade e agregação

    entre imagens� Content-Based Image Retrieval (CBIR)

    � Composição do vetor de característica� Composição do vetor de característica

    � Utilização de descritores semânticos relacionados a forma, textura e cor

    ◦ Dificuldade em recuperar as imagens em curto tempo� Métodos de Acesso Métrico (MAM) – Índice

    iCube: Cubo de Imagens Médicas 5

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 6

  • ObjetivoObjetivo

    � Investigar o armazenamento e a manipulação de imagens médicas em aplicações de DW

    ◦ Quais características das imagens são importantes?� Como a semântica da aplicação médica influencia a escolha do vetor de

    característica?

    ◦ Como estas devem ser armazenadas e recuperadas no DW?� Como a semântica da aplicação médica influencia a escolha da estrutura de

    armazenamento?

    ◦ Quais funções de agregação devem ser propostas para gerar os níveis de agregação? � Como a semântica da aplicação médica influencia a escolha das funções de

    agregação propostas?

    Cubo Métrico

    iCube: Cubo de Imagens Médicas 7

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 8

  • MotivaçãoMotivação� DW para a área médica = Informação estratégica para a área◦ Análises estatísticas de determinadas doenças

    � Análise de Tendência � Qual a incidência de câncer de mama em julho de 2009?

    � Análise Comparativa � Qual a incidência de câncer nas diferentes faixas etárias?

    � Análise de Tendência Múltipla � Análise de Tendência Múltipla � Qual a incidência de câncer de mama nos últimos 3 anos, nas diferentes faixas etárias?

    iCube: Cubo de Imagens Médicas 9

  • MotivaçãoMotivação� Entretanto, não é possível realizar uma análise sobre imagens

    médicas

    ◦ Por que não? � DW convencionais não realização operações baseadas em similaridade

    entre imagens e nem agregação

    ◦ Qual a evolução da prevalência de determinadas formas da patologia nas diferentes faixas etárias?patologia nas diferentes faixas etárias?� Quantas imagens são similares?

    � Quais serão as medidas?

    � Como tratar medidas semi-aditivas?

    � Como será o cubo?

    � Cubo por paciente – fato ?

    iCube: Cubo de Imagens Médicas 10

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 11

  • Detalhamento do TrabalhoDetalhamento do Trabalho� Ambiente de Data Warehousing◦ Dados operacionais � Informação voltada à tomada de decisão

    estratégica

    ◦ Oferecem funcionalidades de obtenção e manipulação de dados � ETL - extração, tradução, filtragem, integração e armazenamento

    � Rollup� Rollup

    � Drill-down

    � Slice_and_dice

    � Pivô

    iCube: Cubo de Imagens Médicas 12

  • Detalhamento do TrabalhoDetalhamento do Trabalho� Data Warehouse◦ Armazém de dados orientada, integrada, invariante, não-volátil,

    utilizada na tomada de decisão organizacional

    � Consultas OLAP (on-line analytical processing)◦◦ Consultas complexas

    ◦ Manipulam um elevado volume de dados

    ◦ Demandam uma grande quantidade de operações de varredura, junção e agregação

    ◦ Desafio - Garantir um bom desempenho no processamento destas consultas� Visões materializadas

    � Índices específicos

    � Fragmentação dos dados do DW

    iCube: Cubo de Imagens Médicas 13

  • Detalhamento do TrabalhoDetalhamento do Trabalho� Método de Acesso (MA)◦ Relação de Ordem Total

    � Igualdade (igual e diferente)

    � Relacional (maior, maior e igual, menor, menor e igual)

    � < ?

    iCube: Cubo de Imagens Médicas 14

  • Detalhamento do TrabalhoDetalhamento do Trabalho� Métodos de Acesso Multidimensional (MAMd)◦ Consultas em que existe definição de dimensão do vetor de

    característica� Vetores pequenos e de tamanho fixo

    � Método de Acesso Métrico◦ Comparação entre vetores de tamanhos diferentes ◦ Comparação entre vetores de tamanhos diferentes

    � Vetor adimensional e geralmente grande

    ◦ Características das imagens obtidas por descritores intrínsecos� CBIR – Recuperação de Imagens Baseada Conteúdo� Descritores de formas, texturas e cores, etc

    ◦ Função de distância - Consultas por Similaridade� Propriedade de Simetria � d(s1,s2) = d(s2,s1)

    � Não negatividade � 0 < d(s1,s2) < ∞ se s1 ≠ s2� Desigualdade triangular � d(s1,s2) ≤ d(s1,s3) + d(s3, s2)

    iCube: Cubo de Imagens Médicas 15

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 16

  • ValidaçãoValidação� Imagens médicas reais◦ ROI de câncer de mama – aproximadamente 300 imagens

    � Dados sintéticos ◦ Testar características que afetam o desempenho de consultas

    OLAP

    � Comparação do desempenho◦ iCube X MAM

    � Até o momento, são desconhecidas propostas similares ◦ Armazenamento de características de imagens em um cubo de

    dados

    iCube: Cubo de Imagens Médicas 17

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 18

  • Meios de PublicaçãoMeios de Publicação� Possíveis meios de publicação◦ Simpósio Brasileiro de Banco de Dados

    ◦ International Conference on Data Warehousing and Knowledge Discovery (DaWaK)

    ◦ ACM International Workshop on Data Warehousing and OLAP (DOLAP)(DOLAP)

    ◦ Computer-Based Medical System (CBMS);

    ◦ Congresso Brasileiro de Informática em Saúde (CBIS);

    ◦ Transaction on Image Processing (ACM?)

    ◦ ACM SAC

    ◦ Outros eventos de banco de dados descritos na URL

    iCube: Cubo de Imagens Médicas 19

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 20

  • CronogramaCronograma� Esta pesquisa contará com etapas de estudo sobre:◦ Conceitos básicos de DW e OLAP

    ◦ Armazenamento e recuperação de imagens baseada em conteúdo

    ◦ Espaço métrico e similaridade

    ◦ Estruturas de armazenamento propostos para DW◦ Estruturas de armazenamento propostos para DW

    iCube: Cubo de Imagens Médicas 21

  • CronogramaCronograma� Atividade 1: Cursar disciplinas do segundo semestre de 2009;

    � Atividade 2: Estudos de conceitos de data warehouse e OLAP.

    � Atividade 3: Estudos de conceitos sobre recuperação de imagens baseada em conteúdo, espaço métrico e similaridade, além de conceitos relacionados a identificação de características de imagens;

    � Atividade 4: Levantamento bibliográfico sobre o estado da arte em estruturas de armazenamento propostos para DW;

    � Atividade 5: Escrita da monografia a ser apresentada no exame de qualificação;

    � Atividade 6: Preparação para o exame de qualificação;

    � Atividade 7: Defesa da qualificação de mestrado;

    iCube: Cubo de Imagens Médicas 22

    7

    6

    5

    4

    3

    2

    1

    ativ./meses

    8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3

    2009 2010 2011

  • CronogramaCronograma� Atividade 8: Projeto e carga de DW voltados para o estudo de imagens médicas;

    � Atividade 9: Desenvolvimento da proposta do MCube;

    � Atividade 10: Realização de testes e validação do MCube;

    � Atividade 11: Escrita da monografia da dissertação de mestrado;

    � Atividade 12: Preparação para a defesa da dissertação de mestrado;

    � Atividade 13: Defesa da dissertação de mestrado; e

    � Atividade 14: Escrita e submissão de artigos científicos.� Atividade 14: Escrita e submissão de artigos científicos.

    iCube: Cubo de Imagens Médicas 23

    14

    13

    12

    11

    10

    9

    8

    ativ./meses

    8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3

    2009 2010 2011

  • AgendaAgenda

    � Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual

    iCube: Cubo de Imagens Médicas 24

  • Bibliografia InicialBibliografia Inicial� BARIONI, M.C.N. (2006) Operações de consulta por similaridade em grandes bases de dados complexos. Tese

    de Doutorado: ICMC/USP, Brasil.

    � BELLATRECHE, L.; SCHNEIDER, M.; LORINQUER, H.; MOHANIA, M.K. Bringing Together Partitioning, Materialized Views and Indexes to Optimize Performance of Relational Data Warehouses. In: INTERNATIONAL CONFERENCE ON DATA WAREHOUSING AND KNOWLEDGE DISCOVERY, 6., 2004, Zaragoza, Spain. Proceedings… p.15-25.

    � CHAUDHURI, S. and DAYAL, U. (1997). An overview of data warehousing and OLAP technology. SIGMOD Record. 26(1):65-74.

    � CHÁVEZ, E., NAVARRO, G., BAEZA-YATES, R. and MARROQUÍN, J. L. (2001). Searching in metric spaces. ACM Computing Surveys, 33(3):273–321.Computing Surveys, 33(3):273–321.

    � CHAUDHURI, S.; NARASAYYA, V. An Efficient Cost-Driven Index Selection Tool for Microsoft SQL Server. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATABASES, 23., 1997, Athens, Greece. Proceedings… p. 146-155.

    � CIFERRI, C.D.A.; CIFERRI, R.R.; FORLANI, D.T.; TRAINA, A.J.M.; SOUZA, F.F. Horizontal Fragmentation as a Technique to Improve the Performance of Drill-Down and Roll-Up Queries. In: ACM SYMPOSIUM ON APPLIED COMPUTING, 22., 2007, Seoul, Korea. Proceedings… p. 494-499.

    � CIFERRI, C.D.A.; SOUZA, F.F. Data Warehousing: Estado da Arte e Direções Futuras. In: CONFERÊNCIA LATINO-AMERICANA DE INFORMÁTICA, 26., 2000, Mexico City, Mexico. Memorias... CD-ROM.

    � CIFERRI, C.D.A.; SOUZA, F.F. Materialized Views in Data Warehousing Environments. In: INTERNATIONAL CONFERENCE OF THE CHILEAN COMPUTER SCIENCE SOCIETY, 21., 2001, Punta Arenas, Chile. Proceedings… p. 3-12.

    � CIFERRI, C.D.A., CIFERRI, R.R., OGATA, R.J., LIMA, A.M.P. and TRAINA, A.J.M. (2006). Data warehousing na saúde: melhorando a tomada de decisão médico-analítica. In Proc. XXXII CLEI, p. 1-12.

    iCube: Cubo de Imagens Médicas 25

  • Bibliografia InicialBibliografia Inicial� FELIPE, J. C., TRAINA, A. J. M, e TRAINA Jr., C (2005). Global warp metric distance: Boosting content-based image

    retrieval through histograms. In IEEE International Symposium on Multimedia (ISM 2005), Irvine, CA, USA.

    � GARCIA, A., SAMPAIO. R., XÉVEO, G., PASSOS, L.C., REIS, F., LOBO, N., XIMENES, RABELO, L. and RABELO JÚNIOR, A. (2001). FBCDataWare: um data warehouse para cardiologia, In Proc. 4th SADIO, p.1-5.

    � GOLFARELLI, M.; RIZZI, S. and CELLA, I. (2004). Beyond data warehousing: what´s next in business intelligence? In Proc. 7th DOLAP Workshop, p.1-6.

    � GRAY, J., BOSWORTH, A., LAYMAN, A. and PIRAHESH, H. (1996). Data cube: a relational aggregation operator generalizing group-by, cross-tab, and sub-totals. In Proc. 12th ICDE, p. 152-159.

    � HAN, J., PEI, J., DONG, G. and WANG, K. (2001) Efficient computation of iceberg cubes with complex measures. � HAN, J., PEI, J., DONG, G. and WANG, K. (2001) Efficient computation of iceberg cubes with complex measures. SIGMOD Record, 30(2):1-12.

    � HARINARAYAN, V.; RAJARAMAN, A.; ULLMAN, J.D. Implementing Data Cubes Efficiently. SIGMOD Record, v.25, p. 205-216, 1996.

    � INMON, W.H. Building the Data Warehouse. 2.ed. John Wiley & Sons, Inc., 1996. 401p.

    � KIMBALL, R. The Data Warehouse Toolkit. 1.ed. John Wiley & Sons, Inc., 1996.

    � LAI, S.Y. and NICOLLET, P. (2000). A clinical data warehouse effort to support the measurable organizational patient care and health outcomes improvement initiative. In Proc. AMIA Symposium.

    � MURPHY, S. N., MORGAN, M. M., BARNETT, G. O. and CHUEH, H. C. (1999). Optimizing healthcare research data warehouse design through past COSTAR query analysis. In Proc. AMIA Symposium, p. 892-896.

    � POLA, I.R.V. (2005). Indexação de dados em domínios métricos generalizáveis. Dissertação de Mestrado: ICMC/USP, Brasil.

    � TRAINA, A.J.M., TRAINA JÚNIOR, C., BUENO, J.M. and MARQUES, P.M.A. (2002). The metric histogram: A new and efficient approach for content based image retrieval. In Xiaofang Zhou and Pearl Pu. (Org.). Visual and Multimedia Information Management: 1:297-311.

    iCube: Cubo de Imagens Médicas 26

  • iCubeiCube::Um Cubo de Dados para Imagens Médicas Um Cubo de Dados para Imagens Médicas

    baseado em Similaridadebaseado em Similaridade

    27iCube: Cubo de Imagens Médicas

    Obrigada