Upload
internet
View
110
Download
0
Embed Size (px)
Citation preview
Visão Computacional – 2010Aula 0: Introdução
Paulo Sérgio RodriguesPEL205
Administrivia
• Aulas: Quartas: 18:30 às 22:10 hs
• Professor: Paulo Sérgio Rodrigues www.fei.edu.br/~psergio
[email protected]• Pré-requisitos: Programação, Álgebra, Cálculo e
Experiência na preparação de Documentos Acadêmicos
• Textbooks:“Digital Image Processing” by Rafael Gonzalez & Richard
Woods
“Vários artigos científicos”
Objetivos
• Introdução dos Principais problemas de Visão Computacional.
• Introduzir os principais problemas e técnicasvolta às aplicações
• Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos.
• Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância.
Por que estudar Visão Computacional?
• Imagens e vídeos existem em todo lugar• A cada dia, novas aplicações práticas têm
surgido:– Construção de modelos virtuais de estruturas
reais 3D.– segurança (quem está fazendo o que?)– Pós-processamento de vídeo– Reconhecimento de faces, gestos, etc..
• Vários problemas científicos desafiadores– Como funciona um sistema de reconhecimento de
objetos?
• Um entendimento melhor a respeito da visão humana.
Principais Tópicos tratados em Visão Computacional
• Detecção de Formas ou Movimento “Qual a forma 3D desse objeto?” • Segmentação
“O que pertence a que?”
• Tracking (Rastreamento) “A onde cada objeto vai?”
• Reconhecimento“O que é isso?”
Visão
Visão Top Down
x
Visão Bottom Up
Visão Bottom Up
Desafio: Visão Baseada em Contexto
Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura
Visão Top Down
Visão Top Down ou Bottom Up ?
Visão Computacional
Grandes Desafios Futuros
Telemedicina
Gerenciamento de Grandes Bases de Dados
Análise de Imagens em Vídeo
Ambientes Virtuais Colaborativos
Ambientes Virtuais Colaborativos
TV-Digital
Sub-divisão da Disciplina
Visão de Baixo
Médio
Alto-Nível
Visão de Baixo Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant
Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica
Filtragem: Espacial e Freqüência
Processamento baseado em Cor: Sistemas de Cores
Processamento Baseado em Gradiente: Detectores de Direção
Processamento Baseado em Textura: Matriz de Co-ocorrência
Compressão de Imagens: Compressão JPEG
Compressão de Vídeos: Detecção de Transição
Registro de Imagens: Entropia: Tradicional e Não-Extensiva
Morfologia Matemática
Visão de Médio Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento
Clusterização: K-Means, SOM, outros métodos, CrescimentoDe Região
Entropia: Tradicional e Não-Extensiva
Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo
Visão de Alto Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Representação de Cenas: Código de Cadeia,Assinaturas de Imagens, Aproximação Poligonal, Squeletização
Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões
Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos
Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos
Visão de Baixo Nível:
Geralmente é abordado, mas não necessariamente restrito a
Restauração de Imagens:
Melhoramento de Imagens: Espacial e Freqüência
Filtragem: Espacial e Freqüência
Processamento baseado em Cor
Processamento Baseado em Gradiente
Processamento Baseado em Textura
Curso de Visão 2010: PEL205
Regras:
Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível
Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível
Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível
Prova Final (PF): Todo o Conteúdo
Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF
Média < 5.0 = D (Reprovado)5.0 <= Média < 7.5 = C7.5 <= Média < 8.5 = B 8.5 <= Média = A
Trabalhos Teóricos-Práticos
Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível;
Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff
De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional.
Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso.
OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina.
TTP-I
Assunto: Visão de Baixo Nível
Equipe GW: Guilherme e Werner
O artigo consta do tema de Análise de Vídeo explorando o tema EntropiaNão-Extensiva para Detecção de Transições.
Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.
Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube.
Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.
Todo o Material deverá ser atualizado no DropBox.
Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor.
Data da entrega: 13 de Outubro de 2010
TTP-I
Assunto: Visão de Baixo Nível
Equipe CAP: Celso, André e Puff
O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia Não-Extensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outrassugeridas.
Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.
Base de dados: disponível com o Professor
Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.
Todo o Material deverá ser atualizado no DropBox.
Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor.
Data da entrega: 13 de Outubro de 2010