View
217
Download
0
Category
Preview:
Citation preview
Dorirley Rodrigo Alves
Avaliacao dos Modelos de Cores RGB e
HSV na segmentacao de Curvas de Nıvel
em Cartas Topograficas Coloridas
Belo Horizonte
Maio de 2010
Dorirley Rodrigo Alves
Avaliacao dos Modelos de Cores RGB e
HSV na segmentacao de Curvas de Nıvel
em Cartas Topograficas Coloridas
Dissertacao apresentada ao programa dePos-Graduacao em Engenharia Eletrica daPontifıcia Universidade Catolica de MinasGerais, como requisito parcial para obtencaodo tıtulo de Mestre em Engenharia Eletrica
Orientador:
Prof. Alexei Manso Correa Machado, D.Sc.
Pontifıcia Universidade Catolica de Minas GeraisPrograma de Pos-graduacao em Engenharia Eletrica
Belo Horizonte
Maio de 2010
FICHA CATALOGRÁFICA Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais
Alves, Dorirley Rodrigo A474a Avaliação dos modelos de cores RGB e HSV na segmentação de curvas de
nível em cartas topográficas coloridas. / Dorirley Rodrigo Alves. Belo Horizonte, 2010.
65f. : il. Orientador: Alexei Manso Correa Machado Dissertação (Mestrado) – Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Engenharia Elétrica. 1. Processamento de Imagens. 2. Mapas Topográficos. I. Machado, Alexei
Manso Correa. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Engenharia Elétrica. III. Título.
CDU:681.3
Dorirley Rodrigo Alves
Avaliacao dos Modelos de Cores RGB e HSV na segmentacao de Curvas
de Nıvel em Cartas Topograficas Coloridas
Dissertacao de Mestrado apresentada no Programa de Pos-graduacao em Engenharia
Eletrica, da Pontifıcia Universidade Catolica de Minas Gerais, como parte dos requisitos
para obtencao do grau de Mestre em Engenharia Eletrica. Belo Horizonte, 03 de maio de
2010.
Prof. Dr. Alexei Manso Correa Machado – PUC MinasOrientador
Profa. Dra. Flavia Magalhaes Freitas Ferreira – PUCMinas
Prof. Dr. Clodoveu Augusto Davis Junior – UFMG
Dedicatoria
Durante a minha infancia, me recordo que sempre minha mae manifestava seu desejo
em ter uma mesa redonda. Naquela epoca, a famılia pobre, com dinheiro minguado e
almondegas de soja contadas para o mes seguinte, a desejada mesa era um sonho de
consumo muito distante para ser alcancado.
Um dia, lembro-me bem, brincando no chao da cozinha com meu carrinho sem ro-
das herdado de um dos vizinhos, assustei-me com ela. De serrote em punho tendo na
outra mao um pedaco de barbante amarrado a um prego e do outro lado um lapis, ela
mirava a mesa velha, retangular, que foi montada pelo meu pai sobre um tronco seco
envernizado, procurando seu centro. Ao encontra-lo, cravou-lhe o prego e esticando o
barbante, comecou a desenhar o que me parecia um grande cırculo. De lıngua entre os
dentes, comecou a serra-la. Eu, espantado com a destruicao, assistia a tudo absoluta-
mente mudo. No almoco daquele dia, sentados a nova mesa, eu e minha irma vıamos
minha mae com um brilho radiante nos olhos, deliciando mais uma vez, a almondega com
arroz e feijao.
Hoje, percebo o valor dos sonhos realizados. Consigo compreender a razao do brilho
radiante nos olhos de uma intrepida mulher que, sem escolaridade, geometricamente,
conseguiu materializar uma grande parte dos seus sonhos. Aprendi com ela o bom sabor
das simples coisas. Aprendi com ela que basta perseguir incansavelmente seus sonhos
para que eles se tornem realidade. E isso, so depende da gente.
Dedico a realizacao deste sonho a voce minha mae, por me ensinar que em uma mesa
redonda pode haver muito mais que uma simples bancada para o almoco, pode haver
conquistas.
Agradecimento
Ao Laboratorio de Cartografia do Departamento de Geografia da PUC Minas e ao
Centro de Geoprocessamento das Paroquias da Arquidiocese de Belo Horizonte - CGPAR,
por cederem, sempre de forma gentil, os laboratorios e sobretudo o saber de seus tecnicos
para a realizacao das minhas pesquisas e experiencias.
A todos os Professores, Funcionarios e colegas do PPGEE por contribuir, e muito,
para minha formacao.
Ao meu orientador e agora amigo, Alexei Manso, por seu inigualavel apoio e inabalavel
confianca, sendo, portanto, uma das forcas propulsoras para minha pos-graduacao. A
voce Alexei, minha eterna gratidao. Se hoje sou Mestre, voce sera meu eterno Mestre dos
Magos.
Aos meus grandes amigos e socios Edgard e Bertelli por me ajudarem incondicional-
mente. A paciencia de voces e um modelo de hombridade.
A minha grande famılia, da Cidade Nova a Tres Rios, sogro, sogra, cunhadas, con-
cunhados e maravilhosos sobrinhos que nunca mediram esforcos para me apoiar, ajudar,
auxiliar e socorrer, deixando-me convicto que todas essas acoes podem ser definidas com
uma unica palavra: amor. Muito obrigado por tudo.
A minha irma Dorian e meu sobrinho Gabriel, por entenderem as minhas ausencias e
mesmo assim, me deixar sempre presente em seus coracoes.
A minha esposa Claudia, por sua abdicacao, paciencia e seu incontestavel amor. Se
hoje cheguei aqui, ela e a maior responsavel por este feito, pois sempre acreditou mais
em mim do que eu mesmo. Voce Claudia, e o meu maior orgulho, minha grande alegria,
simplesmente, meu porto seguro;
Finalmente, aos meus pais, por ser a base do que sou e a quem muito devo e sobretudo
a Deus, por sempre me dar mais do que peco, mostrando sua gigante generosidade.
Resumo
Esta dissertacao apresenta uma avaliacao do comportamento dos modelos de cores
RGB e HSV na segmentacao de curvas de nıvel em cartas topograficas coloridas. Esse
processo de segmentacao nao e uma tarefa trivial devido a sobreposicao ou juncao de
variados geo-objetos em uma mesma posicao do documento cartografico, alem da pre-
senca do aliasing e falsas cores geradas pelo processo de digitalizacao. O objetivo desta
avaliacao e identificar os impactos causados pelo uso dos dois modelos em diferentes cartas
topograficas. Primeiro, as cartas foram classificadas de acordo com a concentracao dos
geo-objetos ao longo do documento cartografico e de acordo com a firmeza da cor das
curvas de nıvel. Depois, as curvas de nıvel foram segmentadas utilizando os diferentes
modelos de cores. Finalmente, foi realizada uma operacao logica entre as imagens segmen-
tadas e uma imagem mestre com o mesmo conteudo, porem vetorizada, a fim de identificar
o volume preservado do geo-objeto apos a operacao. Os resultados finais apresentam uma
dependencia entre as classificacoes das cartas e os modelos de cores utilizados.
Palavras-chave: Processamento de imagem, Sistema de Informacao Geografica (SIG),
segmentacao de mapas, extracao de curvas de nivel em cartas topograficas.
Abstract
This thesis presents an evaluation of the behavior of the RGB and HSV color models in
the segmentation of contour lines in color topographical maps. Segmentation is a difficult
process, since contour lines overlap or intersect with other information, and aliasing and
false colors may be induced by the scanning process. The objective of this evaluation
is to identify the impacts caused by the use of color models in different topographical
maps. The maps are classified based on the concentration of geo-objects throughout the
cartographic document and in accordance with the characteristics of color and form of the
contour lines. Later, the contour lines are segmented using different color models. Finally,
a logical operation between the segmented images is carried through and an image master
and contend content the same, however vectoring the same in order to after identify to the
preserved volume of the geo-object the operation. The final results present a dependence
between map classification and the color models under investigation.
Keywords: Image Processing, Geographic Information System (GIS), map segmen-
tation, topographic map contour line extraction.
Lista de Figuras
1 Parte de uma carta topografica com a identificacao de alguns geo-objetos. p. 13
2 Problemas causados pelo processo de digitalizacao e do proprio conteudo
da carta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 16
3 Ilustracoes contendo exemplos de caracterısticas que determinam a clas-
sificacao de qualidade de uma carta topografica. . . . . . . . . . . . . . p. 21
4 Principais caracterısticas das curvas de nıvel. . . . . . . . . . . . . . . . p. 22
5 Exemplos de caracterısticas das curvas de nıvel. . . . . . . . . . . . . . p. 23
6 Vetorizacao manual usando o AutoCAD Map 3D. . . . . . . . . . . . . p. 23
7 Ilustracoes destacando o cruzamento de um geo-objeto curva de nıvel
com o geo-objeto hidrografia. . . . . . . . . . . . . . . . . . . . . . . . p. 25
8 Simulacao de um processo de vetorizacao semiautomatica que desvia-se
do seu curso correto ao encontrar um cruzamento de linhas. . . . . . . p. 25
9 Representacao do espaco de cores do Modelo RGB. . . . . . . . . . . . p. 28
10 Representacao do espaco de cores do Modelo HSV. . . . . . . . . . . . p. 29
11 Classificacao dos artigos de acordo com as caracterısticas dos geo-objetos
utilizados e os modelos de cores aplicados na dissertacao. . . . . . . . . p. 32
12 Exemplo do formato da distribuicao das cores que representam as curvas
de nıvel no espaco vetorial que corresponde ao espaco de cores do modelo
RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 40
13 Diagrama contendo as etapas necessarias para a realizacao da coleta de
dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 43
14 Interface da aplicacao implementada para a segmentacao utilizando o
modelo RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 48
15 Interface implementada para execucao do processo de segmentacao uti-
lizando o modelo de cor HSV. . . . . . . . . . . . . . . . . . . . . . . . p. 49
16 Interface da aplicacao implementada para realizacao da operacao logica
AND entre uma imagem contendo o geo-objeto curva de nıvel segmentado
e sua respectiva imagem mestre contendo o mesmo geo-objeto vetorizado p. 50
17 Grafico contendo o comportamento da estabilidade das medias ao longo
do processo de segmentacao das cartas topograficas coloridas. . . . . . p. 55
18 Grafico contendo o comportamento das Medias Harmonicas ao longo do
processo de segmentacao das cartas topograficas coloridas. . . . . . . . p. 57
19 Grafico demonstrando o comportamento dos Modelos RGB e HSV no
processo de segmentacao das curvas de nıvel em uma determinada carta
topografica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 61
20 Resultados obtidos com processo de segmentacao utilizando o Modelo de
Cor RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 62
Lista de Tabelas
1 Caracterısticas basicas das imagens das cartas topograficas coloridas utilizadas
no experimento. Apesar de diferentes medidas e escalas, todas possuem a
mesma resolucao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 44
2 Resultados alcancados ao final das Etapas 2 e 3, classificacao das cartas to-
pografica e geo-objetos respectivamente. . . . . . . . . . . . . . . . . . . . p. 47
3 Resultados obtidos com o uso do Metodo proposto na Secao 5.6. . . . . . . p. 52
4 Classificacao do geo-objeto curva de nıvel e respectivos resultados acerca
da precisao, acertividade e media harmonica advindas de cada modelo
de cor utilzado no processo de segmentacao. . . . . . . . . . . . . . . . p. 56
Sumario
1 Introducao p. 12
1.1 Descricao do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 14
1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17
1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 17
2 Cartas Topograficas: classificacao e formas de vetorizacao p. 20
2.1 Classificacao das cartas topograficas pelo conjunto de elementos que as
compoem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 20
2.2 Caracterısticas especıficas do geo-objeto curva de nıvel . . . . . . . . . p. 21
2.3 Formas de vetorizacao em cartas topograficas . . . . . . . . . . . . . . p. 22
3 Modelos de Cores p. 26
3.1 Modelo RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 27
3.2 Modelo HSV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 28
4 Revisao da Literatura p. 31
4.1 Segmentacao de geo-objetos em documentos cartograficos . . . . . . . . p. 31
4.1.1 O uso do modelo de cor RGB . . . . . . . . . . . . . . . . . . . p. 32
4.1.2 O uso do modelo de cor HSV . . . . . . . . . . . . . . . . . . . p. 34
5 Metodos p. 35
5.1 Relacao do problema da pesquisa com as hipoteses levantadas . . . . . p. 35
5.2 Hipotese, questao-chave e suas questoes-teste . . . . . . . . . . . . . . . p. 36
Hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 36
Questao-chave da Hipotese . . . . . . . . . . . . . . . . . . . . . p. 36
Questoes-teste da Hipotese . . . . . . . . . . . . . . . . . . . . . p. 37
5.3 Descricao da amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37
5.4 Instrumentos de medida . . . . . . . . . . . . . . . . . . . . . . . . . . p. 37
5.5 Implementacao do processo de segmentacao . . . . . . . . . . . . . . . p. 38
5.5.1 Segmentacao das curvas de nıvel utilizando o espaco de cor do
modelo RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 38
5.5.2 Segmentacao das curvas de nıvel utilizando o espaco de cor do
modelo HSV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 41
5.6 Coleta dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 42
6 Apresentacao dos Resultados p. 46
6.1 Apresentacao dos resultados obtidos . . . . . . . . . . . . . . . . . . . . p. 46
7 Interpretacao dos Resultados, Conclusoes e Recomendacoes p. 53
7.1 Avaliacao das questoes-teste da hipotese . . . . . . . . . . . . . . . . . p. 53
Hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 53
Questao chave . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 53
Questao-teste 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54
Questao-teste 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 54
Questao-teste 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 58
7.2 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 60
7.3 Limitacoes do metodo e recomendacoes . . . . . . . . . . . . . . . . . . p. 63
Referencias p. 64
12
1 Introducao
De um modo geral, desde a epoca mais remota ate hoje, a construcao de mapas e
a maneira mais comum para auxiliar a analise de problemas que envolvem o tratamento
de informacoes espaciais. Na Geografia, mapas ou cartas topograficas1 sao documentos
geograficos utilizados para a realizacao de analises espaciais, e um dado geografico contido
nesses documentos pode ser estudado segundo duas visoes complementares: o modelo de
campos e o modelo de objetos. Sobre o modelo de campos ou geo-campos, esse dado
corresponde a grandezas distribuıdas espacialmente, como tipo de solo, topografia e teor
de minerais. Quanto ao modelo de objetos ou geo-objetos, esse dado representa elementos
individualizaveis e tem identificacao com elementos do mundo real, como rios, curvas de
nıvel, estradas ou postes numa rede eletrica. Na ilustracao da Fig. 1 sao apresentados
alguns exemplos de geo-objetos.
Atualmente, dados extraıdos de cartas topograficas digitalizadas sao largamente u-
sados a fim de se produzirem informacoes corretas para tomadas de decisoes. Como
exemplo, a partir do processamento dessas cartas e possıvel identificar uma determinada
caracterıstica de um terreno (plano ou montanhoso), ou calcular a maximizacao dos lucros
de uma certa cultura de plantio atrelada a informacoes climaticas em um determinado
perıodo do ano.
Atraves do uso de scanners, mapas ou cartas topograficas impressas em papel (formato
analogico) sao convertidos para o meio digital. Entretanto, para a construcao de um banco
de dados geografico nao basta ter apenas esse arquivo digital, sendo necessaria tambem a
extracao dos dados contidos nesse documento. Portanto, para a construcao desse banco
de dados sao indispensaveis tres etapas dependentes: (a) selecao de elementos a partir de
algum criterio; (b) segmentacao do elemento selecionado e (c) vetorizacao dos geo-campos
e/ou geo-objetos.
A primeira etapa consiste em selecionar um elemento de interesse, como o conjunto
1Carta topografica e uma representacao grafica de uma parte da superfıcie da terra, tal como ela e, edentro de uma precisao matematica, sempre compatıvel com a escala.
13
Figura 1: Parte de uma carta topografica com a identificacao de alguns geo-objetos que acompoem. FONTE: (CARTOGRAFIA., 1979)
14
de todas as curvas de nıvel, rios ou estradas. Quanto a segunda, segmentar consiste em
delimitar um ou mais elementos presentes na imagem a partir da identificacao e selecao
correta de sua localizacao, topologia e forma. Por exemplo, segmentar as curvas de nıvel
em uma carta topografica significa extrair todos os geo-objetos desse elemento ao longo da
imagem por meio de sua cor e forma do tracado, permitindo com isso facilitar o processo
de vetorizacao. Por fim, vetorizar uma carta topografica consiste em converter todos
os elementos (campos ou objetos) contidos nessa imagem em pontos, linhas, polıgonos
ou conjunto de isolinhas, dependendo das caracterısticas estruturais de cada elemento,
produzindo com isso, um arquivo vetorial. Esse arquivo contera os mesmos geo-campos ou
geo-objetos, porem, representados agora por vetores. Esse processo tambem e conhecido
na literatura por conversao raster to vector ou vetorizacao.
1.1 Descricao do problema
Embora mapas ou cartas topograficas possuam uma grande quantidade de geo-objetos,
pois cada um deles deve ser representado sob formas diferentes, visto que possuem car-
acterısticas visuais diferentes, a etapa de vetorizacao e realizada muitas vezes de forma
manual, devido a dificuldade em segmenta-los. Segmentar geo-objetos em uma carta to-
pografica nao e uma tarefa trivial devido a enorme variedade de tons de cor e forma
de tracado que uma unica classe de elementos, por exemplo uma curva de nıvel, pode
possuir. Isso faz com que esse procedimento de conversao manual seja muito comum,
apesar do processo nao ser uma tarefa tao simples, uma vez que exige o uso de sistemas
CAD2 especıficos para reproduzir uma representacao fiel das informacoes desejadas. Nao
obstante, a maioria dos sistemas CAD existentes nao estao preparados para tratar todos
os elementos presentes em uma carta topografica ou um mapa. Por exemplo, os SIG
(Sistemas de Informacao Geografica) comerciais nao sao capazes de armazenar e utilizar
multiplas representacoes para cada objeto geografico. Essas multiplas representacoes sao
necessarias para que usuarios e sistemas que manipulam o espaco de formas diferentes
possam utilizar o mesmo banco de dados geograficos. Essas limitacoes sao causadas pelas
diferencas entre as informacoes que o CAD e capaz de produzir e aquelas corretas que sao
necessarias para um eficiente funcionamento do SIG. Ou seja, o CAD tem que ter a ca-
pacidade de unir as ferramentas de vetorizacao semiautomatica de imagens com um banco
de dados geograficos do SIG. Entretanto, essa uniao torna os processos mais propensos a
2 CAD - Computer-Aided Design ou (Projeto Auxiliado por Computador). No contexto deste trabalho,Sistemas CAD representam um conjunto de ferramentas que permite automatizar a criacao e manutencaode mapas que contenham volumes muito grandes de dados e abranjam areas geograficas extensas.
15
erros, e quando a correcao desses erros e realizada por procedimentos semiautomaticos, o
processo torna-se lento e custoso. Essa lentidao na digitalizacao das cartas deve-se a falta
de ferramentas especıficas para tratar determinadas representacoes, tais como pontos, lin-
has, polıgonos ou conjuntos de isolinhas, para a representacao de componentes espaciais,
que sao peculiares aos documentos que sao transformados em imagens. Davis:01, Fitz:08,
Joly:03.
Com a crescente utilizacao de documentos geograficos representando a cada dia uma
quantidade maior de elementos do mundo real, o uso da cor tornou-se tao importante
quanto a definicao de novas formas para expressar ou definir esses elementos. Devido ao
grande volume de informacoes que as cartas possuem, e normal que haja fusao ou cruza-
mento de elementos, gerando, consequentemente, erros que inviabilizam a vetorizacao
automatica. No entanto, mesmo havendo alguma interferencia humana a fim de facilitar
a ocorrencia da vetorizacao, essa devera ser altamente especializada devido a variedade de
elementos apresentados nesses documentos geograficos. Portanto, a utilizacao de tecnicas
de segmentacao e muito bem vinda para a criacao de banco de dados geograficos, uma vez
que elas permitem a reducao dos problemas causados pelo uso de CAD, pois ele possui
limitacoes no que diz respeito a forma de representacao, organizacao e armazenamento
desses geo-objetos.
Nos ultimos 40 anos, um razoavel volume de trabalhos foi publicado com o intuito de
elaborar processos que permitam resolver o problema de segmentacao de geo-objetos em
cartas topograficas. Esses processos sao elaborados com o objetivo de criar metodos que
promovam a vetorizacao automatica de variados tipos de geo-objetos independentemente
do tipo da carta topografica utilizada. Essa afirmacao pode ser observada, por exem-
plo, em (COFER; TOU, 1972), (GREENLEE, 1987), (MARCU; ABE, 1995), (POUDEROUX;
SPINELLO, 2007) e (CHIANG et al., 2009). Entretanto, e possıvel perceber que, quando
os pesquisadores tem como objetivo a segmentacao de geo-objetos, todos conseguem re-
sultados de forma satisfatoria, porem, sem alcancar uma segmentacao perfeita. Ou seja,
nao segmentam um determinado geo-objeto de interesse preservando suas caracterısticas
fundamentais, tais como forma e cor, e mantendo a continuidade do tracado do referido
elemento. Nesses resultados, o geo-objeto segmentado ainda necessita passar, inclusive,
por algum processo que o reconstrua para que a vetorizacao seja realizada com sucesso.
Especificamente sobre a extracao de curvas de nıvel em cartas topograficas coloridas,
varios autores buscam uma implementacao eficaz para a remocao dessas curvas. Entre-
tanto, em todos os trabalhos pesquisados, quatro grandes problemas sao apresentados
16
Figura 2: (a) Falsas cores geradas ao longo do geo-objeto curva de nıvel. Esse artefato e causadopelo desalinhamento das lentes instaladas no scanner em relacao aos canais que compoem omodelo de cor RGB que e utilizado para a conversao do documento analogico para digital.A existencia das falsas cores pode ser observada proximo ao geo-objeto curva de nıvel, ondeexistem pixels com coloracao diferente da cor marrom atribuıda ao referido geo-objeto. (b)Aliasing gerado no entorno do geo-objeto curva de nıvel. Os dois problemas anteriores ocorremem funcao do processo de conversao do documento analogico para o digital. (c) Fusao de dois geo-objetos curvas de nıvel e (d) Sobreposicao de geo-objetos malha de coordenadas (tons de preto)com curvas de nıvel (tons de marrom) e hidrografia (tons de azul) sao problemas decorrentes doconteudo da carta topografica.
como os maiores entraves na busca de uma segmentacao perfeita. Dois deles sao causados
pelo processo de digitalizacao da carta, que sao as falsas cores e o aliasing (observe-as re-
spectivamente nas ilustracoes (a) e (b) da Fig. 2). Os outros dois desafios sao provenientes
do proprio conteudo da carta topografica utilizada: as fusoes de diferentes geo-objetos de
uma mesma classe (ilustracao (c) da Fig. 2) ou as sobreposicoes de varios geo-objetos de
classes diferentes (curva de nıvel, mallha de coordenada e hidrografia conforme a ilustracao
(d) da Fig. 2).
A existencia de falsas cores ocorre quando sao apresentadas cores diferentes da com-
binacao daquelas que deveriam ser percebidas como corretas para representar um deter-
minado elemento. Observe a ilustracao (a) da Fig. 2. Nessa ilustracao existem cores
17
diferentes da cor marrom que representa a curva de nıvel ao longo do elemento.
O aliasing e um efeito indesejado que resulta na degradacao da qualidade da imagem,
manifestando-se, como degraus que sao criados ao se desenhar uma reta em diagonal em
uma imagem, conforme ilustracao (b) da Fig. 2. Este efeito pode ser notado tambem
nas demais ilustracoes da mesma Figura. Isso e causado pela distorcao que ocorre num
sinal amostrado quando a taxa de amostragem nao respeita a taxa mınima (Teorema de
Nyquist), impedindo a correta recuperacao do sinal (JAIN, 1989, p. 87).
A fusao de dois ou mais elementos e outro problema. Normalmente, esses sao sep-
arados pelas cores que representam o fundo do documento. Entretanto, quando esses
elementos estao muito proximos, a baixa taxa de amostragem no processo de digitali-
zacao pode uni-los, dificultando a segmentacao, conforme ilustracao (b) da Fig. 2.
A intersecao ou sobreposicao das curvas de nıvel com outros elementos presentes
no documento topografico e inevitavel em qualquer carta topografica. Esse documento
representa um cenario do mundo real, contendo variados elementos que podem ser repre-
sentados por inumeros geo-objetos distintos em uma mesma posicao geografica, tais como
estradas sobre rios, estradas entre as vegetacoes, rios sobre curvas de nıvel ou malha de
coordenadas sobre qualquer elemento presente na carta, conforme pode ser observado na
ilustracao (c) da Fig. 2.
1.2 Objetivo
O objetivo deste estudo e analisar o impacto dos modelos de cor RGB e HSV no pro-
cesso de segmentacao do geo-objeto curva de nıvel, utilizando varias cartas topograficas
coloridas digitalizadas. A implementacao desse processo servira para verificar qual dos
modelos proporciona melhor resultado no processo de segmentacao, ou seja, qual o mod-
elo e capaz de segmentar o referido geo-objeto, mantendo o maior conjunto possıvel de
suas caracterısticas estruturais (cor, forma e continuidade do tracado) e permitindo uma
vetorizacao menos dispendiosa.
1.3 Justificativa
Ao longo da literatura pesquisada, os autores tem uma preocupacao em escolher um
modelo de cor que apresente, em seu espaco de cores, a identificacao correta dos valores
das cores do geo-objeto de interesse ou sua posicao em coordenadas, facilitando com
18
isso a segmentacao, a fim de solucionar os quatro problemas apresentados anteriormente.
Ademais, considerando que a partir dos referidos problemas os autores optam por dois
tipos de modelos de cores para a realizacao dessa segmentacao, o modelo RGB e o modelo
HSV, e possıvel perceber que em um processo de segmentacao de um determinado geo-
objeto, os modelos de cores utilizados como base para identifica-los nao permitem a rea-
lizacao de uma segmentacao perfeita sendo sempre necessaria a aplicacao de um processo
de reconstrucao sobre esse geo-objeto.
Nao obstante, em laboratorios de cartografia, estejam eles instalados em ambientes
academicos ou comerciais, tornou-se imprescindıvel o uso da ferramenta CAD devido as
facilidades de georreferenciar os dados contidos nos documentos digitais de forma semi-
automatica para a construcao de bancos de dados geograficos. Especificamente sobre a
vetorizacao das curvas de nıvel em cartas topograficas coloridas, se o processo de seg-
mentacao produzir uma imagem basica referente a essa carta contendo somente as curvas,
a funcao de vetorizacao semiautomatica sera executada em um tempo menor se comparado
com o processo que utiliza a carta original. Essa reducao e devido a facilidade do usuario
tomar a decisao do que deve ser vetorizado. Todavia, mesmo que, durante o processo de
segmentacao, as curvas de nıvel venham acompanhadas de outros geo-objetos que foram
segmentados em conjunto, devido a enorme presenca de caracterısticas semelhantes, tais
como cores e formas ou por causa da sobreposicao dos variados elementos existentes, o
processo ainda e valido sob o ponto de vista da reducao do tempo de vetorizacao.
Alem dessas questoes, a avaliacao do uso dos modelos de cores no processo de seg-
mentacao de elementos contidos em imagens ainda permanece um problema em aberto.
Ou seja, ainda nao existe uma receita para a escolha do modelo ideal ou do melhor
modelo que favoreca a producao de resultados no processo de segmentacao. Portanto, a
compreensao do papel desses modelos de cores, em variados problemas que necessitam da
aplicacao de tecnicas de segmentacao, contribui para a tomada de decisao na escolha de
qual deles pode ser utilizado em diferentes problemas.
Este trabalho esta organizado da seguinte forma. Nos Capıtulos 2 e 3, sao apresentados
os conceitos necessarios para a compreensao deste trabalho. O Capıtulo 4 apresenta uma
revisao da literatura por meio do levantamento do que ja foi publicado sobre o tema.
No Capıtulo 5, e apresentado o metodo que sera utilizado nesta dissertacao a partir da
intersecao dos conceitos teoricos apresentados neste trabalho com os problemas levantados
como objeto de discussao. No Capıtulo 6, sao apresentados os resultados alcancados com
o metodo e no Capıtulo 7, as conclusoes finais sobre todo o trabalho realizado, alem dos
20
2 Cartas Topograficas:classificacao e formas devetorizacao
2.1 Classificacao das cartas topograficas pelo conjunto
de elementos que as compoem
Uma analise paisagıstica pode ser realizada de duas formas: (a) quando o observador
aprecia o alcance e a magnitude das vistas panoramicas observadas de diferentes altitudes
da area, ou (b) por meio da qualidade visual do conjunto de topografia, vegetacao, agua,
solos e rochas que compoem os recursos fısicos da propria area Griffith:83. Na primeira
forma, o alcance e a magnitude de vistas panoramicas dependem, principalmente, da
posicao do observador e, portanto, podem-se distinguir tres categorias de posicao: (a)
posicao inferior, quando o observador encontra-se em um plano inferior de observacao, em
contraste com o restante das regioes adjacentes; (b) posicao normal, quando o observador
encontra-se no mesmo plano de observacao dos elementos da paisagem a sua frente e; (c)
posicao superior, quando o observador encontra-se acima da maior parte da paisagem a
sua frente. Na segunda forma, a analise visual e dada pelos recursos fısicos da area de
interesse, ignorando-se as condicoes panoramicas, considerando somente a qualidade do
conjunto dos elementos que compoem a regiao de interesse, onde topografia, vegetacao,
agua, solos e rochas, quando combinados em uma determinada area dessa regiao, podem
ser classificados pela densidade do contraste em virtude da variedade de elementos. Ou
seja, a densidade do contraste existente em uma determinada quadrıcula consiste na
existencia de diversos elementos de classes distintas e/ou de numerosos geo-objetos de
um mesmo elemento em uma mesma area. Portanto, uma area pode ser classificada
como de baixo, medio ou alto contraste de elementos/geo-objetos), conforme os exemplos
ilustrados na Fig. 3.
21
(a) Baixo contraste degeo-objetos de umamesma classe.
(b) Medio contrastede geo-objetos de umamesma classe.
(c) Alto contraste de geo-objetos de uma mesmaclasse.
(d) Baixo contraste degeo-objetos de diferentesclasses.
(e) Medio contraste degeo-objetos de diferentesclasses.
(f) Alto contraste degeo-objetos de diferentesclasses.
Figura 3: Ilustracoes contendo exemplos de caracterısticas que determinam a classificacao dequalidade atribuıda a uma carta topografica apos o processo de avaliacao.Observe que a densi-dade de elementos pode ser determinada pela quantidade de varios geo-objetos de uma mesmaclasse, como por exemplo as ilustracoes (a), (b) e (c) ou pela quantidade de varios geo-objetosde classes distintas conforme as ilustracoes (d), (e) e (f)
2.2 Caracterısticas especıficas do geo-objeto curva de
nıvel
Curva de nıvel e o nome usado para designar uma linha imaginaria que liga pontos que
possuem a mesma altitude. E um metodo, tradicional para representar o relevo terrestre,
permitindo ao usuario ter um valor aproximado da altitude em qualquer parte da carta
IBGE:10. Uma curva de nıvel e uma curva altimetrica ou linha isoıpsa (liga pontos de
mesma altitude).
A partir da visualizacao de uma curva de nıvel e possıvel identificar se o relevo de uma
determinada area e acidentado, plano, montanhoso, ıngreme etc. Diante dessa afirmacao,
percebe-se que a configuracao das linhas e determinada pelas caracterısticas do relevo da
area mapeada.
As principais caracterısticas das curvas, apresentadas a seguir, podem ser observadas
na ilustracao da Fig. 4.
22
1. As curvas de nıvel tendem a ser quase que paralelas (alinhadas) entre si. Entretanto,
isso normalmente acontece quando o declive do terreno e mais constante.
2. Todos os pontos de uma curva de nıvel se encontram na mesma elevacao.
3. Cada curva de nıvel fecha-se sempre sobre si mesma. No entanto, quando isso nao
acontece e porque o fechamento desta curva se encontra em outra folha topografica.
4. As curvas de nıvel nunca se cruzam, podendo se tocar em saltos d’agua ou despe-
nhadeiros.
Figura 4: As curvas de nıvel sao desenhadas em intervalos regulares, que sao chamados deequidistancia das curvas de nıvel. Na figura acima, a ilustracao possui uma escala 1:50.000, aequidistancia e de 20 metros, e as curvas relacionadas a valores multiplos de 100 sao chamadasde curvas-ındice ou mestra. Estas curvas sao sempre representadas por linhas de cor mais fortepara facilitar a leitura e compreensao da topografia. FONTE: adaptado de (OLIVEIRA, 1993)
Em cartas topograficas digitalizadas, a consistencia da cor que representa as curvas
tende a variar devido ao processo de conversao raster to vector. Ou seja, sua coloracao
pode ser mais forte, sendo com isso mais nıtida, nao tao forte, mas ainda permitindo uma
facil visualizacao e quando mais fraca, perde-se a nitidez em virtude da concentracao de
outros elementos proximos a ela. As ilustracoes da Fig. 5 apresentam essas caracterısticas.
2.3 Formas de vetorizacao em cartas topograficas
Em alguns sistemas CAD comerciais dedicados a geografia, como AutoCAD Map
3DTMe ArcGISTM, a representacao vetorial de um geo-objeto presente em cartas to-
23
(a) Cor mais fraca difi-culta a visualizacao dacurva de nıvel.
(b) Cor mediana permiteuma boa visualizacao dacurva de nıvel.
(c) Cor acentuada facilitaa visualizacao da curva denıvel.
Figura 5: Ilustracoes contendo exemplos de caracterısticas que determinam a facilidade devisualizacao das curvas de nıvel em uma carta topografica digitalizada.
pograficas ou mapas em formato de imagem, pode ser criada atraves de vetorizacao manual
ou entao da vetorizacao semiautomatica.
Em sistemas que possibilitam a vetorizacao manual, como o AutoCAD Map 3DTM,
existem ferramentas que propiciam ao usuario a criacao de uma linha sobre o geo-objeto
selecionado respeitando suas formas (curvas) e seu trajeto. Normalmente, para a criacao
dessa linha, e necessario o uso de “zoom” para a exata visualizacao do geo-objeto, possi-
bilitando assim uma vetorizacao mais segura e diminuindo o risco de erros. Na Fig. 6 e
mostrado um exemplo de vetorizacao de hidrografia representada por uma linha em azul
e curvas de nıvel, em vermelho, realizadas no AutoCAD Map 3DTM.
Figura 6: Vetorizacao manual usando o AutoCAD Map 3D
24
Para (DAVIS Jr., 2001), essa vetorizacao tem se tornado um processo interessante do
ponto de vista economico, devido a diminuicao do custo dos equipamentos e softwares.
Porem, alem de ser propensa a erros, e dispendiosa, pois aumenta drasticamente o tempo
de execucao devido a interferencia humana, impossibilitando assim uma rapida conclusao
do processo.
Normalmente, na vetorizacao semiautomatica, o usuario inicia o processo de vetor-
izacao no CAD adotando os seguintes passos: (1) a marcacao de dois pontos extremos no
geo-objeto desejado, sendo um no inıcio e o outro no final, (2) a execucao do comando
que inicia o processo de vetorizacao, interpretando, por meio da coloracao de seus pixels,
os seus pares de coordenadas espaciais ate encontrar o ponto final. O sucesso dessa ve-
torizacao esta diretamente associado a existencia de padroes bem definidos com relacao
a distribuicao das componentes de cor que formam uma imagem. Um CAD que vetoriza
de forma semiautomatica um geo-objeto em uma imagem em preto e branco nao o faz de
maneira eficiente em uma imagem em nıveis de cinza ou colorida devido a variedade de
cores que representam um mesmo geo-objeto.
Alguns sistemas, como o AutoCAD Map 3DTMou o ArcGISTM, possuem operadores
que propiciam uma vetorizacao de forma semiautomatica de um geo-objeto selecionado,
desde que a imagem possua apenas duas cores. Isso significa que o geo-objeto que esta
sendo vetorizado possui uma unica cor em toda sua extensao. Porem, mesmo possuindo
uma unica cor, pode ocorrer o problema de sobreposicao de geo-objetos causados pela
diversidade de informacoes apresentadas (conforme a ilustracao (a) da Fig. 7). Nesse
caso, o operador que gera a linha para representar o geo-objeto por meio da vetorizacao
nao conseguira determinar qual geo-objeto realmente devera vetorizar, pois nomes, valores
de cotas, linhas representando a malha de coordenadas, curvas de nıvel, hidrografia, enfim
todos os geo-objetos fundem-se formando um unico elemento.
Em imagens em nıveis de cinza ou coloridas, nao existe, nos conjuntos de pixels que
representam as linhas, uma cor unica referenciando o geo-objeto curvas de nıvel. Neste
trabalho, essa variacao de cor sera denominada “informacao difusa”. Pode-se observar
tambem que permanece o problema de sobreposicao de geo-objetos causados pela diver-
sidade de informacoes.
Como ja mencionado, conclui-se que a realizacao do processo de vetorizacao semiau-
tomatica em imagens binarias, em nıveis de cinza ou coloridas nao e muito confiavel, pois
como o objeto que esta sendo criado esta sobreposto ao geo-objeto que esta sendo vetori-
zado, ao encontrar uma sobreposicao de outros geo-objetos, conforme as ilustracoes (b) e
25
(a) Parte de uma carta to-pografica em preto e branco.
(b) Parte de uma carta to-pografica em nıveis de cinza.
(c) Parte de uma carta to-pografica colorida.
Figura 7: Parte de uma carta topografica em tres formatos de cores diferentes, destacando ocruzamento de um geo-objeto curva de nıvel com o geo-objeto hidrografia.
(c) da Fig. 7, ele podera seguir uma outra trajetoria que nao seja a do geo-objeto original-
mente selecionado (conforme a ilustracao da Fig. 8), comprometendo assim a eficiencia e
confiabilidade da ferramenta e exigindo um conhecimento bem maior por parte do usuario
para a tomada de decisao quanto a escolha do geo-objeto correto a ser vetorizado.
Figura 8: Simulacao de um processo de vetorizacao semiautomatica que se desvia do seu cursocorreto ao encontrar um cruzamento de linhas.
Isso significa que, tanto em imagens em nıveis de cinza, como nas coloridas, ainda
nao foi possıvel encontrar um CAD que consiga, de maneira eficiente e a baixo custo
financeiro, executar de modo semiautomatico o processo de vetorizacao, quando, durante
a sua execucao, o geo-objeto que foi selecionado apresenta informacoes diferentes com
relacao a coloracao de seus pixels.
26
3 Modelos de Cores
Um modelo de cor e essencialmente uma representacao tridimensional na qual cada
cor e especificada por um ponto no sistema de coordenadas, e o universo de cores que
podem ser reproduzidos por um modelo e chamado de espaco ou gamute de cores. Alem
disso, nao ha um modelo que descreva de forma independente todos os aspectos refentes
as cores e por isso modelos diferentes sao utilizados para ajudar a descrever as diferentes
caracterısticas da cor que sao percebidas pelo ser humano Pedri:08.
Neste trabalho, omitiremos o estudo detalhado da natureza da luz. Esse estudo iria
nos remeter as equacoes de Maxwell do eletromagnetismo, que se fazem necessarias quando
necessitamos entender a interacao da luz com a materia, bem como os fenomenos fısicos da
optica. Entretanto, estamos interessados apenas no estudo da colorimetria, que consiste
em utilizar modelos matematicos para medir a informacao da cor. Todavia, existem varios
modelos de cores que por sua vez podem ser subdivididos em tres tipos de sistemas: (a)
sistemas padrao, (b) sistemas dos dispositivos e (c) sistemas de interface Gomes:94.
(a) Sistemas Padrao : Tem por objetivo estabelecer os sistemas de cor, a fim de facil-
itar a especificacao de cor de forma independente do dispositivo ou das peculiari-
dades de determinadas aplicacoes. Fazem parte desses sistemas o padrao CIE-
RGB e seu sistema complementar CMY e o padrao CIE-XYZ juntamente com
seus varios sistemas uniformes de cor, entre eles os principais modelos, Luv e Lab.
Vale ressaltar que todos esses padroes e seus respectivos modelos foram definidos
pela CIE, Comissao Internacional de Iluminacao, que e o orgao responsavel pela
padronizacao na area da Colorimetria e Fotometria.
(b) Sistemas dos Dispositivos : Sao sistemas de cor associados aos dispositivos graficos
de entrada, processamento e saıda de cor. Fazem parte desses sistemas o Sistema
de Monitor RGB e o complementar Sistema de Monitor CMY, Sistemas de Vıdeo-
componente, Sistema YPbPr (utilizado pela SONY em sua linha BETACAM), Sis-
tema YCbCr (utilizado como padrao em Sistemas de Vıdeo Digital, principalmente
27
nos padroes JPEG, para compressao de imagens, e MPEG, para compressao de
vıdeo) e os Sistemas YIQ e YUV (utilizados nos Sistemas de Vıdeo Composto).
(c) Sistemas de Interface de Cor : Sao sistemas que tem como objetivo facilitar a
especificacao da informacao da cor por parte do usuario. Nesse caso, esses sis-
temas facilitam a comunicacao entre os sistemas dos diversos dispositivos graficos e
o usuario. Fazem parte desses sistemas os Sistemas HSV, HSL, Munsell e Pantone.
Sao apresentados neste capıtulo apenas o modelo RGB do sistema dos dipositivos
e o modelo HSV pertencente ao sistema de interface de cor, pois esses sao os modelos
discutidos nos trabalhos utilizados como referencia. Maiores detalhes sobre os Sistemas
apresentados podem ser encontrados em (PEDRINI; SCHWARTZ, 2008) e (GOMES; VELHO,
1994).
3.1 Modelo RGB
O Modelo RGB e um sistema aditivo baseado na teoria dos tres estımulos (Tristi-
mulus Color Theory) proposta por Young-Helmholtz. Segundo essa teoria, o olho humano
percebe a cor atraves da estimulacao dos tres pigmentos visuais presentes nos cones da
retina, que possuem picos de sensibilidade aproximadamente nos seguintes comprimentos
de onda: 730 mµ (vermelho), 546 mµ (verde) e 435.8 mµ (azul). Foi definido pela CIE,
em 1931, como um dos modelos basicos de cor.
A representacao do espaco de cores no Sistema de Monitor RGB pode ser represen-
tada como um cubo, conforme ilustracao da Fig. 9, o chamado cubo RGB. Para se obter
uma determinada cor e usado um intervalo pre-especificado, normalmente de 0 a 255,
sendo que a cor preta e obtida pela combinacao (0,0,0), a cor branca (255,255,255), o
vermelho (255,0,0), verde (0,255,0) e o azul (0,0,255). Os demais vertices representam o
complemento de cada cor primaria. Cada ponto no interior do cubo corresponde a uma
cor que pode ser representada pela tripla (R,G,B), com os valores R, G e B variando de 0
a 255. Os tons de cinza sao representados ao longo da diagonal principal do cubo, que vai
da origem (ponto correspondente a cor preta) ate o vertice que corresponde a cor branca.
Cada tom ao longo dessa diagonal e formado por contribuicoes iguais de cada primaria.
Cada pixel tem seu proprio valor RGB representado geralmente por tres bytes, um para
cada componente de cor: vermelho, verde e azul. Se cada componente for armazenado
como um byte, cada um podera representar 256 diferentes intensidades. Isso significa que
28
Figura 9: Representacao do espaco de cores do Modelo RGB e para efeito de ilustracao, aapresentacao das faces contendo as possıveis cores existentes. FONTE: adaptadas de (BHATIA,2008) e (RUSS, 2007).
pode-se trabalhar com mais de 16,7 milhoes de cores. Isso e frequentemente referenciado
como cores reais (true color). O modelo RGB possui uma desvantagem muito forte: ele
nao e adequado para definicao de cores baseando-se no sistema de percepcao visual hu-
mano. Isso significa que nada garante que cores com representacao proxima no espaco
RGB sejam proximas em termos de percepcao visual. Fica difıcil determinar, visualmente,
com exatidao, se uma cor e ou nao a de interesse. Para contornar esse tipo de problema,
houve a necessidade da criacao de Sistemas de Interface de Cor que fossem mais apro-
priados para interface com o usuario, de forma que pudesse ser determinada uma cor de
forma mais intuitiva. As proximas subsecoes apresentarao os modelos mais apropriados
para desempenhar tal tarefa.
3.2 Modelo HSV
O modelo baseado em matiz, saturacao foi apresentado quando havia uma necessidade
de se especificar numericamente as propriedades das cores. Esse modelo mostra as cores
baseadas na ideia de matiz ou H de Hue saturacao ou S deSaturation e valor ou brilho
sendo V de Value. A matiz e relacionada a cor em si e define a tonalidade dominante de
uma area, diferenciando o azul do vermelho, por exemplo. A saturacao mede a pureza
da cor da area. De certa forma, a saturacao e a caracterıstica que diferencia a cor rosa
29
da cor vermelho. Enquanto a cor vermelho e a cor pura, a cor rosa e um vermelho com
alguma quantidade de cor branca. O valor no modelo HSV esta relacionado a luminancia
da cor. A luminancia e a componente da imagem que so contem as informacoes de brilho
de uma imagem. Ou seja, a luminancia varia de 0 (preto) a 1 (branco) ao longo do eixo V
do cone, onde se encontra a escala de cinza. Os matizes puros sao encontrados no plano
onde a luminosidade e igual a 0.5 e a saturacao e igual a 1.
O sistema HSV e representado por coordenadas em um espaco dentro do qual o modelo
definido e um cone em forma hexagonal (hexacone), ou, uma piramide invertida de seis
lados, conforme ilustracao da Fig. 10. O topo do hexacone (na base) corresponde a V =
1, que contem as cores com mais brilho. Obviamente, as cores apresentadas no plano V
= 1 nao possuem todas as percepcoes possıveis de brilho, podendo ser identificadas por
toda a area do hexacone conforme ilustracao da referida Figura.
Figura 10: Representacao do espaco de cores do Modelo HSV, ilustracao de uma das facesdo hexacone e para efeito de ilustracao, a apresentacao das faces contendo as possıveis coresexistentes. FONTE: adaptadas de (BHATIA, 2008) e (RUSS, 2007).
Observando a ilustracao da da Fig. 10, e possıvel identificar que a componente de
matiz e medida por angulos em torno do eixo vertical, onde o R (Red) e 00, o G (Green)
e 1200 e o B (Blue) e 2400. As cores complementares no modelo HSV estao em posicoes
opostas (1800) no cırculo graduado. O valor da saturacao e uma razao variando de 0, no
centro da linha (eixo V), para 1, na base (lado) do triangulo do hexacone. O ponto no
apice e Preto (B de Black) e tem coordenada 0 para V. Nesse ponto, os valores de H e S
sao irrelevantes. O ponto S = 0, V = 1 e Branco (W de White). Valores intermediarios de
V para S = 0 (no centro da linha) sao os tons de cinza (escala cinza: B - W). Quando S
= 0, o valor de H e irrelevante (denominado por convencao de “indefinido”). Quando S e
diferente de 0, H e relevante. Por exemplo, a cor pura vermelho esta no H = 0◦ ou 360◦, S
30
= 1, V = 1. De fato, qualquer cor com V = 1, S = 1 e a cor pura (saturada) usado como
base inicial para fazer a mistura de cores. Adicionar a cor branca corresponde a reduzir
S (sem alterar V). Sombreamentos sao criados mantendo S = 1 e aumentando V. Tons
sao criados pelo decrescimo de S e V. Obviamente, mudar H corresponde a selecionar a
cor pura com a qual deseja criar uma nova cor.
31
4 Revisao da Literatura
4.1 Segmentacao de geo-objetos em documentos car-
tograficos
Na area de processamento digital de imagens com foco no geoprocessamento, a busca
e reconhecimento automatico de geo-objetos contidos em mapas tem sido tema de um
grande numero de publicacoes nos ultimos 40 anos.
De um modo geral, esse conjunto de publicacoes pode ser dividido em tres categorias.
A primeira trata da busca de um processo de automatizacao na conversao dos geo-objetos
contidos nos mapas em papel para o meio digital (raster to vector). A segunda, trata
da busca de metodos que permitam a segmentacao dos geo-objetos e por fim, a terceira,
trata da busca de metodos para reconstruir e vetorizar os geo-objetos, uma vez que esses
ja foram segmentados. Essas categorias foram propostas por (KARIMA; SADHAL; MC-
NEIL, 1985) onde os autores buscaram, por meio de uma extensa pesquisa, estabelecer
uma classificacao das formas em que dados contidos em documentos sao capturados por
ferramentas CAD. Nesse trabalho, os autores utilizaram os geo-objetos curvas de nıvel,
hidrografia, linhas, rodovias, textos, regioes e/ou sımbolos para a realizacao da classi-
ficacao.
A Fig. 11 apresenta a ilustracao grafica da classificacao adotada neste trabalho para
a identificacao dos principais trabalhos utilizados como referencia. Foram analisados
os seguintes aspectos.: Tipos de geo-objetos segmentados, tipos de cartas topograficas
utilizadas e modelos de cores aplicados para encontrar o melhor espaco de cor para a
realizacao da segmentacao.
Em todos os trabalhos pesquisados nesta dissertacao, seus respectivos autores uti-
lizaram dois modelos de cores aplicados como base, a fim de encontrar um espaco para a
identificacao da cor que representa o geo-objeto curva de nıvel, sendo eles o modelo RGB
ou o HSV.
32
Figura 11: Classificacao dos artigos de acordo com as caracterısticas dos geo-objetos utilizadose os modelos de cores aplicados como base a fim de encontrar o melhor espaco de cor paraa realizacao da segmentacao. O numero entre parenteses dentro de cada quadro representa aquantidade de trabalhos publicados acerca da respectiva caracterıstica. A pesquisa foi realizadautilizando a ferramenta de busca Engineering Village (www.engineeringvillage.com) ondeforam inseridas dezenas de combinacoes de termos ligados a segmentacao, extracao e identificacaode geo-objetos e curvas de nıvel em mapas e cartas topograficas. Como resultado, retornaram69 trabalhos de diferentes formatos a partir de 24 fontes diferentes.
4.1.1 O uso do modelo de cor RGB
Propostas de solucao para os problemas apresentados na Secao 1.1 podem ser encon-
tradas na literatura sob varias abordagens. Entretanto, em todas elas, a busca pela seg-
mentacao perfeita utilizando o modelo de cor RGB somente e possıvel se houver a inclusao
de algum procedimento que permita a reconstrucao do geo-objeto apos sua segmentacao,
dado o insucesso de solucionar ao mesmo tempo todos os problemas apresentados na
referida secao.
Para facilitar a identificacao das cores que representam as curvas de nıvel, dada a
descorrelacao dos canais que compoem o modelo de cor RGB, tem sido bastante utilizada
a estrategia de classificacao dos pixels. Nessa estrategia, varios metodos sao adotados,
desde a utilizacao do algoritmo de Watershed para classificar as cores que definem o geo-
objeto por meio da implementacao de um histograma Dupont:99, ate o uso de algoritmos
que utilizam os valores dos pixels por meio de janelas, a fim de calcular a transicao desses
valores para identificar as falsas cores produzidas pelo scanner durante a conversao raster
to vector Khotanzad:03. Apesar desse ultimo metodo apresentar algumas desvantagens,
33
(pois quando ha intersecao ou fusao de geo-objeto essa abordagem torna-se ineficaz pela
identificacao de algumas cores pertecentes ao elemento como falsas) e possıvel melhora-
lo, agregando novas abordagens. Uma delas, por exemplo, e construir uma aplicacao
que permita selecionar partes do geo-objeto extraindo pequenos fragmentos de curva de
nıvel, a fim de encontrar uma media das tonalidades da cor que a compoem. Depois,
utilizando a distancia de Mahalanobis, detectar a menor distancia entre os tres canais de
cores que representam a cor marrom no espaco de cor do modelo RGB e, a partir das
duas etapas anteriores, implementar uma funcionalidade que permita limiarizar as curvas
de nıvel utilizando, por exemplo, um botao de progressao deslizante a fim de segmentar,
em tempo real, o geo-objeto desejado. Esse procedimento poede ser observado em (CHEN;
TANG; YANG, 2008). Outra forma e melhorar o proprio processo de identificacao das
falsas cores combinando seus respectivos pixels com os pixels alocados na mesma posicao
da imagem original, porem, convertendo-os em nıveis de cinza. A ideia basica do uso dessa
combinacao e que as imagens em nıveis de cinza podem ser representadas com 256 nıveis
e isso diminui a distancia entre as cores que representam as curvas de nıvel. Entretanto,
para a execucao desse metodo, existe uma razoavel sequencia de passos e a necessidade de
implementacao de uma variedade de algoritmos, elevando o custo computacional de todo
o processo Chen:06. Todavia, independentemente das abordagens utilizadas, a qualidade
dos resultados obtidos pode ser questionada por parecer que todos os resultados alcancados
dependem da qualidade dos documentos cartograficos utilizados como base.
Nao obstante, e possıvel abordar o problema de segmentacao de uma forma diferente.
Nesse caso, alterando a forma de analisar o histograma implementado no metodo apre-
sentado por Dupont:99, e possıvel visualizar todos os geo-objetos presentes no documento
cartografico com excecao das curvas de nıvel Pezeshk:08. Porem, e necessaria a conversao
do modelo RGB para o modelo CIE Lab,1 a fim de encontrar a menor distancia entre os
valores das cores geradas pelas falsas cores e aquelas que realmente apresentam as curvas
de nıvel. Ao final dessa abordagem, os resultados alcancados nao parecem ser diferentes
(sob o ponto de vista perceptual) dos resultados alcancados com as abordagens anteriores.
Contudo, no que diz respeito a segmentacao, os quatro problemas apresentados na
Secao 1.1 continuam sem solucao e e possıvel perceber ao longo das ultimas quatro decadas
que o foco maior e dado a etapa de reconstrucao das curvas de nıvel apos a segmentacao.
1Considerado um modelo de cor independente (cor absoluta), pois difere dos modelos RGB e CMYK(cores sintetizadas). O os valores aplicados no espaco CIE Lab sao consistentes em qualquer dispositivo(monitores e impressoras). Ou seja, um dado valor cromatico tera o mesmo resultado, nao importandoo dispositivo utilizado. O que nao ocorre com o modelo RGB por depender do Hardware (monitores,cameras), e CMYK por depender, entre outros fatores, do papel, tipo de tinta e tecnologia de impressaoutilizados.
34
Sobre essa etapa, o maior problema e a reconstrucao dos gaps gerados com a segmentacao
das curvas de nıvel. Nesse caso, uma das formas de solucionar esse tipo de problema e
utilizando a Teoria dos Grafos para conectar as linhas com descontinuidades. Normal-
mente, utiliza-se o algoritmo de Backtracking com o intuito de facilitar a busca dos inıcios
e terminos das linhas que representam as curvas de nıvel Sandhya:09.
4.1.2 O uso do modelo de cor HSV
O modelo de cor HSV tambem pode ser utilizado como meio para a realizacao do pro-
cesso de segmentacao das curvas de nıvel. Entretanto, assim como na sub-secao anterior,
a busca por solucoes para os problemas apresentados na Secao 1.1 somente e possıvel com
o auxılio de algum procedimento que realize a reconstrucao do geo-objeto.
O processo mais utilizado para a identificacao das cores que correspondem as cur-
vas de nıvel e, apos a transformacao do modelo de cor RGB para HSV, vincular alguns
intervalos no canal H como equivalentes aos valores encontrados na representacao das
cores que determinam o referido geo-objeto Arri:99, Salva:03, Loh:04, Dongjun:06. Alem
dessa abordagem, a tentativa de reconstrucao das curvas pode ser amparada pelo uso da
Morfologia Matematica. Iniciando o processo com a conversao do modelo de cor RGB
para o HSV, a reconstrucao dos gaps existentes nas curvas pode ser feita a partir da
realizacao de varias dilatacoes usando um elemento estruturante morfologico. Essa es-
trategia mostra nao ser suficiente, pois ha a necessidade de utilizar outros algoritmos, tais
como a Triangulacao de Delaunay e uma adaptacao do filtro da Mediana para auxiliar no
preenchimento desses gaps. Mesmo assim, e possıvel perceber nos resultados alcancados
que as imagens apresentadas possuem varias curvas com gaps que nao puderam ser re-
construıdos Jinyang:04.
A fim de compreender a importancia do tema ao longo das ultimas quatro decadas,
quando (COFER; TOU, 1972) demonstraram sua preocupacao em definir um processo que
facilite a forma de conversao dos arquivos raster to vector, foi realizada nesta pesquisa
uma ordenacao cronologica das referencias bibliograficas utilizadas nesta pesquisa, sendo
possıvel observar que o assunto de nosso interesse e relativamente recente dados os tra-
balhos apresentados por (DUPONT; DESEILLIGNY; GONDRAN, 1999) e (ARRIGHI; SOILLE,
1999), que tratam efetivamente do assunto referente a segmentacao de curvas de nıvel em
cartas topograficas coloridas.
35
5 Metodos
5.1 Relacao do problema da pesquisa com as hipoteses
levantadas
O problema identificado nesta pesquisa pode ser enunciado da seguinte forma: no
processo de segmentacao de um determinado geo-objeto, os modelos de cores utilizados
como base para identifica-los nao permitem a realizacao de uma segmentacao perfeita
sendo sempre necessaria a aplicacao posterior de um processo de reconstrucao nesse geo-
objeto.
Para buscar um conhecimento cientıfico sobre o problema acima, inicialmente, foram
formuladas duas hipoteses: a primeira parte do princıpio de que o problema e causado
pelo modelo de cor utilizado no processo de segmentacao. A segunda parte do princıpio
que o problema e causado pelo tipo1 de carta topografica digitalizada utilizada nesse
mesmo processo. Apesar do modelo de cor e a qualidade da carta topografica estarem
intrinsicamente ligados no processo de segmentacao, se a avaliacao tiver como foco a com-
paracao entre determinados modelos de cores, nao necessariamente importara a qualidade
atribuıda as cartas, mas sim o desempenho desses modelos na segmentacao de uma quan-
tidade relativa de cartas. Por outro lado, se a avaliacao tiver como foco qual tipo de carta
que se comporta melhor em um determinado modelo de cor, entao esta segunda forma
de avaliar abrangera todos os testes que poderao ser realizados a fim de se identificar o
impacto da combinacao modelo de cor e tipo de carta na causa do problema identificado
nesta pesquisa.
Portanto, uma unica hipotese pode englobar as duas hipoteses inicialmente apresen-
tadas e essa nova hipotese pode ser enunciada a partir do seguinte questionamento: se,
independente do modelo de cor utilizado nos trabalhos pesquisados, os resultados apresen-
1Neste trabalho o tipo da carta topografica refere-se a classificacao qualitativa que essa carta podereceber com relacao ao volume de elementos presentes ao longo do documento e/ou a consistencia da cordesses elementos
36
tados nao sao totalmente satisfatorios por nao apresentarem uma segmentacao perfeita,
entao o que pode comprometer os resultados e a consistencia da cor do geo-objeto apresen-
tado e/ou a concentracao de variados geo-objetos ao longo da carta topografica utilizada.
Nesse caso, a hipotese e pertinente, pois na maioria das vezes, um determinado geo-objeto
apresentado em uma carta topografica possui varios tracados inconsistentes, um razoavel
volume de ruıdos em consequencia do processo de digitalizacao, alem de uma grande con-
centracao de elementos presentes em um mesmo espaco do documento. Entretanto, em
todos os trabalhos pesquisados, os resultados apresentados sempre estao amparados em
um fragmento de uma carta topografica onde o geo-objeto de interesse apresenta excelentes
caracterısticas, tais como a firmeza na cor do elemento que foi segmentado, produzindo
um tracado consistente e pouca fusao de elementos. Sendo assim, o objetivo da Secao
5.2 e efetuar deducoes logicas, partindo da hipotese que foi enunciada como premissa e
chegar a uma possıvel falsificacao. Ou seja, uma hipotese nao falseavel e uma hipotese
corroborada e isso significara que o problema apresentado neste trabalho e uma teoria
aceitavel, isto e, uma verdade temporaria. Para que seja realizada uma tentativa desse
falseamento e necessario estabelecer um vınculo entre essa hipotese e os dados adquiridos
com o metodo que sera apresentado na Secao 5.6. Esse processo de falseamento pode ser
realizado por meio da elaboracao de uma questao chave, que nao passa de uma trans-
formacao da hipotese numa pergunta e que pode ser testada por de meio de questoes. As
questoes-teste permitem que se aceite, rejeite ou modifique a hipotese, que se coletem os
fatos e dados necessarios para enderecar cada problema associado a hipotese bem como
investigar a natureza, logica e estrutura propria da hipotese Quintela:10.
5.2 Hipotese, questao-chave e suas questoes-teste
Hipotese
Se, independente do modelo de cor utilizado, os resultados apresentados nao sao to-
talmente satisfatorios por nao apresentarem uma segmentacao perfeita, entao o que pode
comprometer os resultados e a consistencia da cor do geo-objeto apresentado e/ou a con-
centracao de variados geo-objetos ao longo da carta topografica utilizada.
Questao-chave da Hipotese
A consistencia da cor do geo-objeto curva de nıvel e a concentracao de variados tipos
de objetos em um mesmo espaco do documento sao as unicas responsaveis por determinar
37
a qualidade do processo de segmentacao?
Questoes-teste da Hipotese
1. A consistencia da cor da curva de nıvel interfere no processo de segmentacao pro-
duzindo melhores ou piores resultados independente do modelo de cor utilizado?
2. A classificacao da carta (definida pelo nıvel de presenca de variedades de geo-objetos)
interfere no processo de segmentacao produzindo melhores ou piores resultados in-
dependente do modelo de cor utilizado?
3. Um modelo de cor pode se comportar melhor que o outro, obtendo melhores resul-
tados no processo de segmentacao das curvas de nıvel em carta topografica colorida?
5.3 Descricao da amostra
Para a realizacao dos experimentos que tem como objetivo testar os metodos apresen-
tados neste Capıtulo, foram cedidas pelo Laboratorio de Cartografia do Departamento de
Geografia da Pontifıcia Universidade Catolica de Minas Gerais (PUC Minas), 15 cartas
topograficas coloridas de diferentes regioes do Estado de Minas Gerais. Essas cartas foram
produzidas em datas variadas entre o perıodo de 1969 a 1979 e possuem mal estado de
conservacao, estando a maior parte com coloracao amarelada devido ao tempo e a forma
como foram armazenadas antes de serem adquiridas pela instituicao.
5.4 Instrumentos de medida
Para a classificacao das cartas topograficas, utilizou-se como referencial de medida
de qualidade das cartas topograficas coloridas listadas na Secao 2.1, o modelo de analise
visual estabelecido por (GRIFFITH, 1983), uma vez que essas cartas apresentam todos os
elementos necessarios para elaborar um inventario qualitativo da regiao que esse docu-
mento representa. A forma de classificacao e obtida atribuindo uma escala de valores
(de 1 a 5 pontos) para todas as quadrıculas apresentadas que compoem cada uma das
15 cartas topograficas utilizadas no experimento, de acordo com tres categorias distintas:
(a) contexto topografico; (b) tipo de geo-objeto e; (c) numero de combinacoes entre esses
tipos. Ao final desse processo de avaliacao, todos os pontos obtidos em cada quadrıcula
sao somados e esse valor e dividido pelo numero total de quadrıculas que compoem a carta
38
topografica avaliada. Com o resultado obtido e possıvel classifica-la conforme a presenca
de variedades de elementos / geo-objetos (baixa, baixa-media, media, media-alta ou alta).
Para a classificacao do geo-objeto curva de nıvel, utilizou-se como criterio a con-
sistencia das curvas de nıvel ao longo de cada quadrıcula contida no documento car-
tografico. Essa consistencia foi baseada nos aspectos relativos a sua coloracao. A classi-
ficacao foi realizada por meio da selecao com o mouse, a partir da imagem aumentada de
cada carta topografica, de pequenos fragmentos da curva de nıvel onde foram capturados
apenas os pixels da cor que representa o referido geo-objeto (cor marrom). Apos a captura
desses pixels, foi calculada a media de cada canal a partir da soma desses valores e por
fim, os tres valores combinados (R, G e B) foram convertidos para o formato HSV. A clas-
sificacao foi definida como fraca (para os valores do canal V entre 90 a 100), fraca-media
(para os valores do canal V entre 70 a 89), media (para os valores do canal V entre 50 a
69), media-forte (para os valores do canal V entre 30 a 49) ou forte (para os valores do
canal V entre 10 a 29) em virtude da firmeza da cor. Vale ressaltar que essa classificacao
foi realizada de forma visual combinada com a ordenacao dos valores apresentados pelo
canal V, que representa o brilho de cada cor.
Para a validacao das imagens contendo o geo-objeto curva de nıvel vetorizado, utilizou-
se como referencial a Metodologia de Validacao da Vetorizacao elaborada pelo (IBGE,
2009).
5.5 Implementacao do processo de segmentacao
Para a implementacao do processo de segmentacao, foram eleitos, entre os onze artigos
apresentados no Capıtulo 4, os trabalhos de (CHEN; TANG; YANG, 2008) e de (SALVATORE;
GUITTON, 2003) por demonstrarem maior efetividade na segmentacao dos geo-objetos
curvas de nıvel em relacao aos demais trabalhos pesquisados. Cada um utiliza-se de um
modelo de cor diferente e de um determinado metodo para realizar a segmentacao dessas
curvas.
5.5.1 Segmentacao das curvas de nıvel utilizando o espaco decor do modelo RGB
O algoritmo implementado para a segmentacao das curvas de nıvel empregando o
modelo RGB permite selecionar, com o uso do mouse, pequenas partes de uma determi-
nada curva de nıvel. Essa acao tem como objetivo construir um vetor C0 (R0, G0, B0) a
39
partir da captura de um conjunto de pixels que representam a cor marrom. Utilizando o
calculo da media (representada por m) e da matriz de covariancia dos valores que repre-
sentam cada cor das curvas nos canais R, G e B (representada por S) e construıda uma
funcao de densidade de probabilidade Gaussiana (representada pela equacao 5.1) para a
classificacao de todas as variacoes da cor marrom existentes nos conjuntos selecionados.
K(c, V ) =1
(2π)n/2|S|1/2exp
[−1
2(c− m)′S−1(c− m)
](5.1)
Inicialmente, pode ser intuitivo pensar que classificar todos os pixels que representam
a cor marrom utilizando apenas a distancia Euclidiana geraria bons resultados (essa
distancia e representada pela equacao 5.2, onde d2(c, C0) e a distancia entre o pixel c(r, g, b)
e C0).
d2(c, C0) = (r −R0)2 + (g −G0)2 + (b−B0)2 (5.2)
Todavia esse pensamento esta incorreto. As cores que correspondem a curva de nıvel
estao dispostas no espaco RGB numa especie de uma estrutura em um formato elip-
soidal que traspassa os tres vetores do espaco vetorial representados pelos eixos R, G
e B (conforme pode ser exemplificado pela ilustracao da Fig. 12). Ou seja, estao todas
aglomeradas em uma regiao desse espaco sob o referido formato. Com isso, a identificacao
correta desse aglomerado torna-se difıcil, dada a necessidade de definir um limiar T que
separe os dois elementos presentes na carta, isto e, os valores das cores que indicam as
curvas e o fundo da imagem, por causa do aliasing e das falsas cores. Isso significa que,
utilizando o exemplo do elipsoide, o limiar T seria as bordas desse formato elipsoidal e,
obviamente, tendo o aliasing e as falsas cores nessa mesma fronteira, torna-se delicado
separa-los de forma correta.
Portanto, para identificar a distancia dos pixels que possuem apenas as cores proximas
daquelas que compreendem o geo-objeto, e usada a distancia de Mahalanobis (represen-
tada pela equacao 5.3). Com ela e possıvel medir a distancia entre c e m (apresentada
na equacao ) que, nesse caso, define a distancia entre uma cor c o centro dessa cor (a
cor pura que representa o marrom). Ou seja, quando o limiar T correto e encontrado, as
bordas desse elipsoide fictıcio contemplarao em seu interior apenas as cores pertinentes a
cor marrom, bastando agora implementar uma funcao que receba os parametros (m, S, T ),
40
Figura 12: Exemplo do formato da distribuicao das cores que representa as curvas de nıvelno espaco vetorial que corresponde ao espaco de cores do modelo RGB. Fonte: (CHEN; TANG;YANG, 2008)
onde m representa o centro dessa superfıcie e S as bordas do elipsoide.
d2(c,K) =1
2(c− m)′S−1(c− m) (5.3)
Vale ressaltar que existem diferentes tonalidades que representam o fundo da imagem.
Portanto, para que o algoritmo obtenha resultados favoraveis, e necessario selecionar com
o mouse varias pequenas partes de uma determinada curva de nıvel para que seja obtido
um conjunto de exemplos dos valores que representam os contrastes das curvas com o
fundo. A seguir e apresentado o algoritmo implementado para esse metodo.
Algorithm 1 Segmentacao (P,V)
Requer: : Imagem P e Conjunto V = (m, S, T )1: para cada pixel p(x, y) da imagem P faca2: Distancia (x, y) = (c− µ)′Σ−1(c− µ) onde c corresponde a c(r, g, b)3: Limiar (x, y) = T4: fim para5: Cria uma nova imagem P ′ de cor Branca6: Inicializa L = verdadeiro7: enquanto L faca8: L = falso9: para cada pixel p′(x, y) da imagem P ′ faca
10: se Distancia (x, y) < Limiar (x, y) entao11: p′(x, y) = cor Preto12: L = verdadeiro13: fim se14: fim para15: fim enquantoGarante: Imagem binaria P ′
41
Para que o Algoritmo 1 funcione, o usuario deve selecionar com o mouse, a partir
da imagem ampliada, pequenos fragmentos da curva de nıvel, buscando apenas os pixels
pertencentes a curva de nıvel. A funcao p(x, y) apresentada no algoritmo representa esta
acao. Depois, o Algoritmo 1 procura as distancias dos pixels relativos a coloracao de inte-
resse. Nesse caso, essa medida consiste na distancia de Mahalanobis conforme a equacao
5.3. Ela e calculada considerando a dispersao dos dados, ou seja, e calculada sempre
entre um ponto medio e uma amostra. Para cada uma dessas classes, ela utiliza um vetor
de medias (nesse caso, o vetor e construıdo calculando-se a media de todos os valores de
cada canal de cor dos pixels capturados) e a partir dessas medias, a matriz de covariancia.
Com isso, e possıvel encontrar a distancia entre o centro da cor marrom e todas aquelas
proximas dessa tonalidade. A funcao Distancia(x, y) apresentada no Algoritmo recebe
o valor que e calculado pela distancia de Mahalanobis e Limiar(x, y) recebe o valor do
Limiar necessario para o funcionamento correto do processo de segmentacao.
5.5.2 Segmentacao das curvas de nıvel utilizando o espaco decor do modelo HSV
Apesar da transformacao do modelo RGB para o modelo HSV nao ser linear, o algo-
ritmo necessario para a transformacao desse espaco de cor e facilmente implementado. Os
valores dos canais R, G e B sao dimensionados em vetores de [0,255] enquanto os valores
do modelo HSV aparecem nas seguintes gamas: o H em graus de [0, 360], onde: [0,60]
vermelhos, [61,120] amarelos, [121, 180] verdes, [181, 240] cianos, [241, 300] azuis e de
[301, 360] magentas. Os canais S e V foram implementados na gama [0, 100]. O canal V
recebe o maior dos valores identificados no canais do RGB, o canal S recebe a gama de
valores RGB em relacao a V e, o H depende do RGB em funcao dos maiores valores de
um de seus canais. Caso contrario, se os valores desses canais forem iguais, entao a cor e
indefinida. Essa conversao pode ser melhor compreendida observando o Algoritmo 2, que
foi implementado para essa finalidade.
Apos a realizacao da conversao, o objetivo passa a ser encontrar a cor marrom que
representa as curvas de nıvel localizadas dentro desse novo espaco de cor. Por meio
de alguns experimentos, foi possıvel observar que, quando o canal V ≤ 25, as cores
identificadas sao pretas ou proximas dessa cor e as cores com S ≤ 20 e V ≥ 60 sao
brancas. Em uma carta topografica digitalizada, ≈ 80% dos pixels representam as cores
pretas ou brancas ou muito claras. Com isso, foi construıdo um histograma da matiz
desses pixels restantes e foi detectado que os valores encontrados para a cor marrom no
42
Algorithm 2 Converte RGBparaHSV (P)
Requer: : Pixel P (x, y)1: P {Pixel representado por P (x, y). Cada pixel P , possui P.Red, P.Green e P.Blue }2: max = maximo(P.Red, P.Green, P.Blue)3: min = minimo(P.Red, P.Green, P.Blue)4: V = max5: S = (max−min)/max6: S = (V −min)/V7: se P.Red == P.Green == P.Blue entao8: retorne indefinido {Nao ha cor}9: fim se
Garante: Pixel P ′(x, y) {Pixel representado por P (x, y). Cada pixel P ′, possui P ′.H,P ′.S e P ′.V }
canal H estao concentradas entre 50 a 75 referindo-se as curvas de nıvel.
5.6 Coleta dos dados
O diagrama ilustrado na Fig. 13 apresenta as etapas necessarias para a realizacao
da coleta de dados que auxiliara na realizacao da tentativa de falseamento da questao
chave apresentada nesta dissertacao e que, posteriomente, sera discutida no Capıtulo 7.
Essa coleta foi realizada por meio dos resultados produzidos ao final de cada uma dessas
etapas.
Para a Etapa 1 (Selecao), foram selecionadas 15 cartas topograficas em escala 1:100.000
coloridas digitalizadas com a mesma resolucao (Tabela 1). Todas essas cartas foram con-
vertidas em imagens utilizando um scanner profissional de alta resolucao (scanner de
tambor) para largura maxima da mıdia: 106,7 cm e precisao de linhas: +/- 0,3% (eixo
Y), +/- 0,1% (eixo X).
Para a Etapa 2 (Classificacao das cartas), foram analisadas as 783 quadrıculas conti-
das em cada uma das 15 cartas topograficas, perfazendo um total de 11.745 quadrıculas
avaliadas. A classificacao foi realizada conforme o metodo proposto por (GRIFFITH, 1983)
e apresentado na Secao 5.4. Na Etapa 3 (Classificacao do geo-objeto curva de nıvel), a
classificacao foi definida a partir da estrutura das curvas de nivel, onde foram avaliadas
as caracterısticas da cor. Quanto ao processo da Etapa 4 (Vetorizacao das cartas sele-
cionadas), foram gerados 15 arquivos no formato DXF a partir do software ArcGISTM.
Esses arquivos foram convertidos em imagens no formato JPEG para serem utilizados
na Etapa 6. Vale ressaltar que os processos de classificacao e de vetorizacao de todas as
43
Figura 13: Diagrama contendo as etapas necessarias para a realizacao da coleta de dados.
cartas selecionadas foram realizados sob a supervisao do Laboratorio de Cartografia da
PUC Minas2
No processo de segmentacao da Etapa 5, foram geradas 30 imagens das 15 cartas
topograficas selecionadas, sendo 15 imagens provenientes da operacao de segmentacao
utilizando o modelo de cor RGB a partir do algoritmo proposto por (CHEN; TANG; YANG,
2008) e 15 imagens provenientes da operacao de segmentacao utilizando o modelo de cor
HSV a partir do algoritmo proposto por (SALVATORE; GUITTON, 2003).
Para a identificacao dos valores relativos a recuperacao do geo-objeto curvas de nıvel a
partir do uso dos espacos de cores RGB e HSV, e apresentado pela Etapa 6 (Identificacao
dos ındices de Precisao, Acertividade e Media Harmonica ) um conjunto de procedimen-
tos que possibilitaram a avaliacao da relevancia dos dados retornados no processo de
segmentacao. Nessa etapa, as imagens resultantes do processo de segmentacao sao com-
binadas com suas respectivas imagens vetorizadas, sendo ambas imagens binarias. Ou
seja, cada par de imagens binarias proveniente dos modelos RGB e HSV possui uma im-
2O trabalho foi supervisionado pelo Cartografo Eng. Dartagnan Lino Viana - Especialista em Geo-processamento - responsavel pelo Laboratorio de Cartografia da PUC Minas.
44
Item Regiao Medidas Escala Nr. deQuadrıculas
DPI
1 Buritis 257.9 x 306.5 cm2 Carmo Paranaıba 251.9 x 306.2 cm3 Curvelo 253.2 x 308.3 cm4 Lagamar 251.9 x 306.1 cm5 Manhuacu 248.4 x 308.3 cm6 Mariana 249.9 x 309.2 cm7 Miraporanga 254.1 x 307.7 cm8 Monte Carmelo 250.0 x 305.4 cm 1:100.000 27 x 29 = 783 729 Morada Nova 249.3 x 304.0 cm10 Morro da Garca 241.8 x 293.8 cm11 Patos de Minas 249.3 x 304.5 cm12 Presidente Olegario 247.9 x 305.7 cm13 Raul Soares 237.5 x 291.7 cm14 Serra Selada 237.5 x 296.9 cm15 Serro 249.6 x 305.9 cm
Tabela 1: Caracterısticas basicas das imagens das cartas topograficas coloridas utilizadas noexperimento. Apesar de diferentes medidas e escalas, todas possuem a mesma resolucao
agem binaria ja vetorizada do geo-objeto que se deseja segmentar. A partir da operacao
logica AND, onde e realizado o E logico entre cada pixel correspondente das duas imagens
(segmentada e vetorizada), as imagens sao combinadas produzindo uma nova imagem con-
tendo apenas os pixels que sao comuns entre elas. Com essa operacao e possıvel comparar
a imagem binaria gerada pelo processo de segmentacao a imagem binaria vetorizada, que
contem o conjunto de pixels que idealmente deveria ser segmentado. Com isso e possıvel
obter tres ındices de avaliacao: precisao, acertividade e media harmonica.
A precisao e a fracao dos pixels segmentados pelo algoritmo que possuem corres-
pondencia na carta vetorizada. Nesse processo destaca-se uma caracterıstica importante
das imagens segmentadas: as imagens podem conter, alem do geo-objeto curva de nıvel,
outros geo-objetos que foram segmentados por possuırem os mesmos tons de cores. A
essa similaridade, denominamos falso-positivo. Entretanto, e importante observar nessas
imagens resultantes que, apesar de haver geo-objetos segmentados diferentes das curvas,
a maior parte dos pixels que compoem essas imagens constituem as curvas de nıvel. Essa
quantidade maior de pixels que representam o geo-objeto curva de nıvel supostamente
permitiria elevar o percentual de precisao nesta pesquisa. Todavia, pelo fato das curvas
segmentadas possuırem mais de um pixel para representarem sua espessura, diferente
das curvas vetorizadas que necessitam apenas de um pixel para representar essa mesma
espessura, essa relacao tende a produzir baixos ındices de precisao do conjunto de imagens
segmentadas.
45
Precisao =area imagem segmentada ∩ area imagem vetorizada
area imagem segmentada(5.4)
Nesse caso, a equacao 5.4 representa a razao do numero de pixels recuperados por
meio da combinacao da imagem segmentada e imagem vetorizada sobre o total de pixels
contidos na imagem segmentada. Essa razao mede o sucesso do metodo em nao recuperar
pixels que nao sejam relevantes de acordo com a necessidade de realizar a vetorizacao
automatica.
A Acertividade e a fracao dos pixels da carta vetorizada que foram segmentadas
pelo algoritmo. A acertividade mede o sucesso do metodo em recuperar os pixels que
representam a curva de nıvel. Nesse processo, a principal caracterıstica observada e da
imagem resultante do processo de segmentacao segmentar o que deveria ser segmentado.
A equacao 5.5 representa a razao do numero de pixels recuperados por meio da combinacao
da imagem segmentada e imagem vetorizada sobre o total de pixels contidos na imagem
contendo o objeto vetorizado.
Acertividade =area imagem segmentada ∩ area imagem vetorizada
area imagem vetorizada(5.5)
A media harmonica e uma medida que calcula a media harmonica ponderada dos
valores da acertividade e precisao. Dessa forma, o valor calculado por essa media indica
se um grupo de pixels contem todos os elementos que compoem a curva de nıvel e apenas
esses elementos. O valor da media harmonica de um grupo de pixels que compoem um
conjunto de curvas de nıvel pode ser calculado pela equacao 7.2
Media Harmonica =2× precisao× acertividade
precisao + acertividade(5.6)
Essa medida assume valores no intervalo [0, 1]. O valor 0 indica que nenhum pixel que
faz parte do conjunto de pixels que compoem as curvas de nıvel foi segmentado e o valor
1 indica que todos os pixels que compoem as curvas de nıvel foram segmentados. Assim,
a segmentacao ideal deve retornar um valor igual a 1.
46
6 Apresentacao dos Resultados
6.1 Apresentacao dos resultados obtidos
Neste capıtulo estao descritos os resultados dos experimentos realizados para avaliar o
metodo apresentado na Secao 5.6. O referido metodo foi dividido em 6 etapas, iniciando-
se com a selecao das cartas topograficas coloridas (1a Etapa), passando pela etapa de
classificacao dessas cartas (2a Etapa), classificacao das cores que representam as curvas de
nıvel (3a Etapa), vetorizacao das curvas de nıvel apresentadas em cada uma das 15 cartas
topograficas selecionadas (4a Etapa), operacao de segmentacao utilizando os modelos de
cores RGB e HSV (5a Etapa) e por fim, a 6a Etapa. A ultima etapa e responsavel por
identificar os ındices de Precisao, Acertividade e a Media Harmonica gerados a partir
de variadas operacoes, com o objetivo de produzir os resultados conclusivos que serao
apresentados ao final desta dissertacao.
Sobre a Etapa 2, os resultados relativos a classificacao das cartas topograficas estao
apresentados na 6a coluna da Tabela 2. Esses resultados foram avaliados de acordo com
o modelo de analise visual estabelecido por (GRIFFITH, 1983). Para a Etapa 3, os resul-
tados obtidos no processo de classificacao do geo-objeto curva de nıvel estao apresentados
7a coluna da mesma Tabela. Ainda nessa Tabela, as cores apresentadas na 8a coluna
representam as cores das curvas de nıvel existentes em cada uma das cartas topograficas
listadas na 2a coluna, juntamente com seus respectivos valores representados pelos canais
de cores do modelo HSV.
Na Etapa 4 (Vetorizacao das cartas selecionadas) foram produzidas 15 imagens binarias
contendo o elemento curva de nıvel vetorizado, onde os vetores representando o geo-objeto
curva de nıvel foram representados pela cor preta.
A Etapa 5 foi realizada por meio da execucao de duas funcionalidades implementadas
utilizando os modelos de cores RGB e HSV (ilustracoes das Fig. 14 e 15). Essa execucao
utilizou como base 15 cartas topograficas coloridas representando variadas regioes do Es-
47
Classificacao da cores de acordo com as caracterısticas do geo-objetoitem Carta topografica Canal
HueCanalSa-tura-tion
Canalvalue
Concen-tracao deelementos(2a Etapa)
Classifica-cao daCurva denıvel (3a
Etapa)
Cor dacurva denıvel
1 Carmo do Paranaıba 24 74 79 Baixa-media fraca-media
2 Presid. Olegario 27 37 77 Baixa-media fraca-media
3 Patos de Minas 27 43 73 Baixa fraca-media
4 Serro 26 42 65 Media-alta media
5 Manhuacu 30 37 63 Media media
6 Morada Nova 29 34 57 Baixa-media media
7 Morro da Garca 24 47 49 Media media-forte
8 Lagamar 26 45 46 Alta media-forte
9 Mariana 20 36 43 Media-alta media-forte
10 Curvelo 32 25 43 Media-alta media-forte
11 Buritis 32 27 43 Alta media-forte
12 Monte Carmelo 35 19 37 Media-alta media-forte
13 Miraporanga 32 29 36 Media-alta media-forte
14 Raul Soares 36 39 33 Media media-forte
15 Serra Selada 36 27 28 Alta forte
Tabela 2: Resultados alcancados ao final das Etapas 2 e 3, classificacao das cartas topograficae geo-objetos respectivamente.
48
tado de Minas Gerais conforme apresentadas na Secao 5.6. Essas cartas foram classificadas
de acordo com a quantidade de geo-objetos apresentados dentro de uma quadrıcula. A
area dessa quadrıcula foi delimitada pela malha de coordenadas do referido documento
geografico. No Apendice ?? sao apresentadas amostras de fragmentos das imagens seg-
mentadas de cada carta topografica, selecionadas a partir do uso dos modelos de cores
RGB e HSV. Nao obstante, sao apresentadas tambem as mesmas imagens, porem, vetor-
izadas.
Figura 14: Interface da aplicacao implementada para a segmentacao utilizando o modelo RGB.Note que a ilustracao apresenta duas imagens contendo o mesmo fragmento de uma carta to-pografica. A imagem da esquerda, apresenta o fragmento da carta original. A da direita,apresenta as curvas de nıvel que foram segmentadas.
O limiar necessario para segmentar o geo-objeto utilizando o modelo de cor RGB e
obtido interativamente por meio de uma “barra deslizante”localizada na interface desen-
volvida a partir do algoritmo 1, apresentado na Sub-secao 5.5.1. Nesse modelo de cor,
o limiar e representado diretamente pelo valor obtido com a distancia de Mahalanobis.
Ao deslizar essa “barra”, e produzido um esmaecimento da imagem ate surgirem apenas
as curvas de nıvel. Ou seja, o limiar de identificacao das segmentacao das curvas esta
associado ao valor da menor correlacao entre os canais de cores que definem a cor da
49
curva de nıvel. Portanto, cada carta topografica possuira um limiar otimo especıfico. A
ilustracao da Fig. 14 apresenta a interface do Algoritmo 1.
Figura 15: Interface implementada para execucao do processo de segmentacao utilizando omodelo de cor HSV. Note que a ilustracao apresenta duas imagens contendo o mesmo fragmentode uma carta topografica. A imagem da esquerda, apresenta o fragmento da carta original. Ada direita, apresenta as curvas de nıvel que foram segmentadas.
Quanto ao limiar utilizado para o processo de segmentacao utilizando o modelo de
cor HSV, ele tambem e obtido interativamente por meio de seis “barras deslizantes”lo-
calizadas na interface desenvolvida a partir do algoritmo 2 apresentado na Secao 5.5.2.
Cada par de barras controla o limiar mınimo e maximo para cada canal de cor (Hue,
Saturation e Value), tendo o primeiro par uma escala de 0 a 360 e os demais de 0 a
100. Ao manipular as barras deslizantes, o software produz o esmaecimento da imagem
resultante permitindo ao usuario identificar, a partir de sua percepcao visual, o melhor
resultado obtido com o processo de segmentacao das curvas de nıvel. A ilustracao da
Fig. 15 apresenta a interface construıda para a identificacao dos referidos valores. Vale
ressaltar que os dois algoritmos implementados podem ser utilizados para a segmentacao
de qualquer geo-objeto de interesse.
Os valores dos limiares identificados para a realizacao da segmentacao das curvas de
50
nıvel nas cartas topograficas podem ser observados na Tabela 3. Na 3a coluna da referida
Tabela, sao apresentados os valores identificados a partir do uso do modelo de cor RGB
e da 4a a 9a coluna da mesma Tabela sao apresentados os valores utilizados para cada
canal do modelo de cor HSV a partir de valores minimo e maximo. Vale ressaltar que a
Tabela 3 apresenta uma parcial dos dados coletados durante o experimento e os valores
apresentados foram selecionados em virtude das maiores medias harmonicas alcancadas
pelos referidos modelos. Especificamente sob o Modelo HSV, foram avaliadas as medias
alcancadas com a manipulacao de cada um dos tres canais, sobressaindo-se as medias
harmonicas obtidas na manipulacao do canal Saturation.
As colunas 10a, 11a, 12a, e 13a da Tabela 3 apresentam, respectivamente, a quantidade
total de pixels existentes em cada imagem e subsequentemente a quantidade de pixels
que foram segmentados a partir dessa imagem, a quantidade de pixels que compoem a
imagem contendo o geo-objeto vetorizado e por fim, a quantidade de pixels que compoem
a imagem classificada como relevante apos a realizacao da operacao AND entre as imagens
segmentadas e sua respectiva imagem vetorizada. Com a combinacao desses valores, foi
possıvel identificar a precisao, acertividade e a media harmonica alcancada para cada
carta topografica.
Figura 16: Interface da aplicacao implementada para realizacao da operacao logica AND entreuma imagem contendo o geo-objeto curva de nıvel segmentado (1a imagem menor a esquerda)e sua respectiva imagem mestre contendo o mesmo geo-objeto vetorizado (2a imagem menor aesquerda). A imagem maior a direita, representa o resultado da operacao contendo apenas ospixels comuns entre as duas imagens.
Com relacao a Etapa 6 (Coleta de dados), as colunas 14a, 15a e 16a da Tabela 3
51
apresentam os valores que indicam, respectivamente, a precisao, a acertividade e a media
harmonica alcancada para cada carta topografica por meio dos dois modelos de cores
utilizados. As primeiras 15 linhas da referida Tabela apresentam os valores obtidos a
partir do modelo RGB, e as restantes representam os valores obtidos a partir do modelo
de cor HSV. Esses valores foram alcancados a partir do Limiar definido para cada Modelo
de Cor. A ilustracao apresentada na Fig. 16 apresenta a interface implementada para
a realizacao da operacao logica AND utilizada como base para a identificacao dos pixels
relevantes para a identificacao da precisao, acertividade e media harmonica.
Para a identificacao dos valores referentes a esses tres ındices, cada carta produziu
uma nova imagem a partir de cada limiar obtido pelos dois modelos. Na utilizacao do Mo-
delo RGB, o limiar foi definido a partir da menor para a maior Distancia de Mahalanobis
identificada. Em media, foram produzidas 590 imagens para cada carta topografica. Na
utilizacao do Modelo HSV, o limiar foi definido a partir da manipulacao dos valores relati-
vos a cada um de seus canais. Esse procedimento produziu um conjunto de 1.120 imagens
para cada carta topografica. Esses conjuntos foram obtidos da seguinte forma:
• Para o canal Hue, inicialmente foram alterados o valor mınimo do canal movendo
a barra de progressao do valor mınimo (0) ate o valor maximo (360). Ou seja,
([0, 360] , [1, 360] , . . . , [360, 360]) a fim de reduzir o espaco de cores deste canal. A
seguir, o mesmo procedimento foi realizado, porem no sentido inverso
([0, 360] , [0, 359] , . . . , [0, 0]).
• Para os canais Saturation e Value, os procedimentos foram os mesmos daqueles rea-
lizados para o canal Hue. Entretanto, para esses canais, o espaco foi delimitado
entre 0 a 100.
52
Parcia
ld
os
resu
ltados
cole
tad
os
du
rante
oexp
erim
ento
item
Cart
aT
op
ogra
fica
Dis
t.M
a-
hala
nob
is
Hu
e
(min
)
Hu
e
(max)
Sat.
(min
)
Sat.
(max)
Val.
(min
)
Val.
(max)
Qtd
e
Pxl
Tota
l
Qtd
e
Pxl
Seg
-
men
-
tad
o
Qtd
e
Pxl
Vet
or-
izad
o
Qtd
e
Pxl
Rel
e-
vante
Pre
ci-
sao
Ace
r-
tivi-
dad
e
Med
ia
Har-
mon
ica
(max)
1B
uri
tis
70
00
00
0246015
47415
11340
8173
0,1
70,7
20,2
8
2C
arm
oP
ara
naib
a27
00
00
00
239120
81508
18592
14357
0,1
80,7
70,2
9
3C
urv
elo
18
00
00
00
237144
60046
13316
9766
0,1
60,7
30,2
7
4L
agam
ar
833
00
00
00
239604
239604
24031
24031
0,1
01,0
00,1
8
5M
an
huacu
80
00
00
0232804
96491
32936
21802
0,2
30,6
60,3
4
6M
ari
an
a13
00
00
00
240075
102091
28060
22525
0,2
20,8
00,3
5
7M
irap
ora
nga
12
00
00
00
251196
43682
10016
7392
0,1
70,7
40,2
8
8M
onte
Carm
elo
14
00
00
00
239590
74040
15604
11950
0,1
60,7
70,2
7
9M
ora
da
Nova
44
00
00
00
242048
58100
11308
8202
0,1
40,7
30,2
4
10
Morr
od
aG
arc
a20
00
00
00
215748
52689
7166
4663
0,0
90,6
50,1
6
11
Pato
sd
eM
inas
20
00
00
00
237650
31546
7432
5777
0,1
80,7
80,3
0
12
Pre
sid
.O
legari
o13
00
00
00
240099
34636
11658
5962
0,1
70,5
10,2
6
13
Rau
lS
oare
s16
00
00
00
210672
114216
26073
20744
0,1
80,8
00,3
0
14
Ser
raS
elad
a417
00
00
00
215760
215760
20893
20893
0,1
01,0
00,1
8
15
Ser
ro13
00
00
00
242554
71353
17743
12864
0,1
80,7
30,2
9
16
Bu
riti
s0
0360
33
100
0100
246015
13703
11340
6092
0,4
40,5
40,4
9
17
Carm
oP
ara
naib
a0
0360
14
100
0100
239120
49940
18592
12195
0,2
40,6
60,3
6
18
Cu
rvel
o0
0360
0100
065
237144
32499
13316
8134
0,2
50,6
10,3
6
19
Lagam
ar
00
360
43
100
0100
239604
38237
24031
16351
0,4
30,6
80,5
3
20
Man
huacu
00
360
0100
092
232804
71162
32936
25439
0,3
60,7
70,4
9
21
Mari
an
a0
0360
26
100
0100
240075
41388
28060
17642
0,4
30,6
30,5
1
22
Mir
ap
ora
nga
00
360
26
100
0100
251196
16296
10016
6128
0,3
80,6
10,4
7
23
Monte
Carm
elo
00
360
0100
065
239590
40783
15604
11434
0,2
80,7
30,4
1
24
Mora
da
Nova
00
360
11
100
0100
242048
28460
11308
6697
0,2
40,5
90,3
4
25
Morr
od
aG
arc
a0
0360
26
100
0100
215748
12771
7166
4564
0,3
60,6
40,4
6
26
Pato
sd
eM
inas
00
360
18
100
0100
237650
20128
7432
5656
0,2
80,7
60,4
1
27
Pre
sid
.O
legari
o0
0360
13
100
0100
240099
20666
11658
6398
0,3
10,5
50,4
0
28
Rau
lS
oare
s0
0360
0100
081
210672
40307
26073
17647
0,4
40,6
80,5
3
29
Ser
raS
elad
a0
0360
20
100
0100
215760
34714
20893
12686
0,3
70,6
10,4
6
30
Ser
ro0
0360
23
100
0100
242554
28677
17743
10214
0,3
60,5
80,4
4
Tab
ela
3:R
esul
tado
sob
tido
sco
mo
uso
doM
etod
opr
opos
tona
Seca
o5.
6.
53
7 Interpretacao dos Resultados,Conclusoes e Recomendacoes
7.1 Avaliacao das questoes-teste da hipotese
O metodo apresentado nesta dissertacao esta fudamentado no Metodo Hipotetico-
Dedutivo de (POPPER, 2000) que possui em sua base a elaboracao de hipoteses e sua
refutacao ou corroboracao por meio de tentativas de falseamento. A partir da combinacao
dos dados coletados com os resultados adquiridos ao final de cada etapa do diagrama
apresentado na Secao 5.6, foi possıvel estabelecer um vınculo entre esses dados e a hipotese
formulada na Secao 5.1, a fim de realizar uma tentativa de falsear as respectivas questoes
testes dessa hipotese. Desse modo, nesta dissertacao, a hipotese apresentada sera plausıvel
se a sua questao chave for validada por meio de todas as questoes-teste. Abaixo, seguem
as avaliacoes pertinentes a essas questoes.
Hipotese
Se, independente do modelo de cor utilizado, os resultados apresentados nao sao to-
talmente satisfatorios por nao apresentarem uma segmentacao perfeita, entao o que pode
comprometer os resultados e a consistencia da cor do geo-objeto apresentado e/ou a con-
centracao de variados geo-objetos ao longo da carta topografica utilizada.
Questao chave
A consistencia da cor do geo-objeto curva de nıvel e a concentracao de variados tipos
de objetos em um mesmo espaco do documento sao as unicas responsaveis por determinar
a qualidade do processo de segmentacao?
54
Questao-teste 1
A consistencia da cor da curva de nıvel interfere no processo de segmentacao pro-
duzindo melhores ou piores resultados independente do modelo de cor utilizado?
Independente do modelo de cor utilizado no processo de segmentacao, os resultados
alcancados serao diferenciados em funcao da consistencia da cor que representa o geo-
objeto segmentado. Apesar do geo-objeto curva de nıvel possuir a cor marrom como
padrao para sua representacao, nas 15 cartas selecionadas, todas possuem um tom diferen-
te da referida cor. Isso pode ser observado na Tabela 2, apresentada no Capıtulo anterior.
Nos experimentos realizados, cada carta obteve uma faixa de limiares diferente quando o
processo de segmentacao alcancou a maior media harmonica. Nesse caso, se os limiares
fossem os mesmos para cada modelo de cor, seria possıvel concluir que, independente dessa
consistencia, cada modelo reconheceria a cor marrom como unica e nao por seus tons, o
que nao e verdade. Entretanto, as condicoes relativas ao resultado no que se referem a
melhores ou piores respostas de segmentacao em funcao dos modelos de cores utilizados,
observa-se que o modelo RGB apresenta uma estabilidade das medias harmonicas ao
longo de uma determinada faixa do Limiar, ou seja, dada a classificacao ordenada de
fraca para forte consistencia da cor, a maior media obtida para uma determinada carta
mantem-se inalterada ao longo de uma faixa do limiar. Entretanto, isso nao acontece
quando o modelo HSV e empregado para as mesmas cartas. Esse comportamento pode
ser melhor compreendido por meio dos graficos da Fig. 17. Observe na ilustracao (a) que
a linha de tendencia que define o percurso evolutivo dos tamanhos dos intervalos mantem-
se relativamente constante, ao contrario da ilustracao (b) que representa os intervalos de
estabilidade das medias harmonicas do modelo HSV. Portanto, e possıvel concluir que,
inicialmente, a consistencia da cor interfere no processo de segmentacao.
Questao-teste 2
A classificacao da carta (definida pelo nıvel de presenca de variedades de geo-objetos)
interfere no processo de segmentacao produzindo melhores ou piores resultados indepen-
dente do modelo de cor utilizado?
Existe uma forte relacao, nao necessariamente de causa e efeito, entre a concentracao
de elementos em uma carta topografica colorida e os resultado do processo de segmentacao.
Cada carta topografica utilizada obteve um resultado diferente, inclusive em cada modelo
55
(a) Grafico apresentando o comportamento da estabilidade da media harmonica nas cartas topograficas como uso do modelo RGB
(b) Grafico apresentando o comportamento da estabilidade da media harmonica nas cartas topograficas como uso do modelo HSV
Figura 17: Grafico contendo o comportamento da estabilidade das medias ao longo do pro-cesso de segmentacao das cartas topograficas coloridas. Observe a linha de tendencia tracadademonstrando o percurso evolutivo dessa estabilidade. Para a ilustracao (a), a linha mantem-seequilibrada na horizontal demonstrando a estabilidade. Na ilustracao (b) a linha de tendenciamantem-se ascendente desde o inıcio do percurso.
56
Classificacao das cartas e as medias harmonicas obtidas para cada modelo de cor
item Carta topografica Concentracao
de elementos
Caracterıs-
tica Con-
sistencia da
Cor
Media
Harmonica
RGB
(maior
valor
obtido)
Media
Harmonica
HSV
(maior
valor
obtido)
Estabili-
dade RGB
(Tamanho
do inter-
valo de
limiares)
Estabili-
dade RGB
(Tamanho
do inter-
valo de
limiares)
1 Patos de Minas Baixa Fraca-media 0,30 0,41 1 3
2 Presid. Olegario Baixa-media Fraca-media 0,26 0,40 2 2
3 Carmo Paranaıba Baixa-media Fraca-media 0,29 0,36 8 1
4 Morada Nova Baixa-media Media 0,24 0,34 16 2
5 Manhuacu Media Media 0,34 0,49 1 5
6 Serro Media-alta Media 0,29 0,44 5 2
7 Morro da Garca Media Media-forte 0,16 0,46 10 5
8 Raul Soares Media Media-forte 0,30 0,53 6 3
9 Curvelo Media-alta Media-forte 0,27 0,36 7 1
10 Monte Carmelo Media-alta Media-forte 0,27 0,41 9 9
11 Miraporanga Media-alta Media-forte 0,28 0,47 5 2
12 Mariana Media-alta Media-forte 0,35 0,51 6 3
13 Lagamar Alta Media-forte 0,18 0,53 5 1
14 Buritis Alta Media-forte 0,28 0,49 4 5
15 Serra Selada Alta Forte 0,18 0,46 5 2
Tabela 4: A definicao do Limiar adequado a segmentacao do geo-objeto curva de nıvel foiidentificado por meio das maiores Medias Harmonicas obtidas junto aos modelos de cores RGB eHSV empregados nas 15 cartas topograficas coloridas. A 7a e 8a colunas da Tabela 4 apresentamessas medias e o tamanho do intervalo em que essas medias se mantiveram ao longo do processode segmentacao utilizando os dois modelos.
de cor utilizado.
Na Tabela 4 a seis primeiras colunas apresentam, respectivamente, as cartas utilizadas,
a classificacao dada a concentracao de elementos, a classificacao dada a consistencia da
cor atribuıda a curva de nıvel e as medias obtidas a partir do calculo da precisao e ac-
ertividade identificada. Observe que as cartas topograficas estao ordenadas em funcao da
concentracao de elementos e da consistencia da cor da curva de nıvel. Apesar dessa or-
denacao nao proporcionar uma facil avaliacao visual acerca do comportamento das medias
atribuıdas a cada classificacao, e possıvel identifica-las por meio dos graficos apresentados
nas ilustracoes (a) e (b) da Fig. 18. Esses graficos apresentam o comportamento das
medias harmonicas para cada tipo de modelo de cor durante o processo de segmentacao
das curvas de nıvel.
Observe a linha de tendencia tracada demonstrando o percurso evolutivo dessas
medias. Para a ilustracao (a), a linha de tendencia possui descendencia, o que demonstra
a instabilidade do modelo RGB ao tratar cartas topograficas com grande concentracao
de geo-objetos combinadas com cores mais escuras. Com um comportamento contrario,
57
(a) Grafico apresentando o comportamento das medias harmonicas obtidas pelo modelo RGB ao longo doprocesso de segmentacao.
(b) Grafico apresentando o comportamento das medias harmonicas obtidas pelo modelo HSV ao longo doprocesso de segmentacao.
Figura 18: Grafico contendo o comportamento das Medias Harmonicas ao longo do processode segmentacao das cartas topograficas coloridas.
58
a ilustracao (b), representando o modelo HSV, possui uma linha de tendencia ascen-
dente desde o inıcio, demonstrando um melhor desempenho para cartas topograficas com
alta concentracao de geo-objetos e combinadas com cores mais escuras. Portanto, a classi-
ficacao da carta interfere no processo de segmentacao, produzindo resultados diferenciados
para cada modelo de cor utilizado.
Questao-teste 3
Um modelo de cor pode se comportar melhor que o outro obtendo melhores resultados
no processo de segmentacao das curvas de nıvel em carta topografica colorida?
As medias harmonicas podem sinalizar um determinado comportamento em funcao
da concentracao de elementos e da consistencia das cores que representam as curvas de
nıvel. Apesar das linhas de tendencia tracadas nos graficos ilustrados nas Fig. 17 e
18 expressarem um comportamento diferente em cada modelo, e possıvel questionar se
essas medias realmente sao confiaveis ao ponto de permitir uma conclusao mais segura
sobre a qualidade dos modelos de cores no processo de segmentacao, da relevancia das
caracterısticas de concentracao dos geo-objetos e do impacto causado em detrimento da
consistencia da cor da curva de nıvel ao longo de uma carta topografica colorida. Contudo,
o uso do teste de diferenca entre as medias harmonicas de cada modelo de cor pode eliminar
duvidas sobre esse comportamento, uma vez que essas medias referem-se a dois modelos
de cores independentes. Nesse caso, para obtencao de uma analise mais segura, sera
empregado o metodo de Teste de Hipotese para verificar se o comportamento demonstrado
nos graficos ilustrados na Fig. 18 e compatıvel com os resultados obtidos pelo referido
metodo.
Nesse caso, o interesse do emprego desse teste e verificar se um modelo de cor con-
tribuiu na segmentacao de uma determinada carta ou de um conjunto delas. Ou seja,
deseja-se verificar se a media obtida com um determinado modelo de cor e menor ou
maior que o outro modelo, permitindo identificar se um modelo possui a capacidade de
segmentar melhor que o outro em funcao de uma determinada classificacao da carta ou
da consistencia da cor. Portanto, para que possamos verificar esse comportamento, sera
aplicado um teste de diferenca entre medias populacionais para dados pareados, uma vez
que estamos tratando da mesma populacao, porem utilizando dois modelos de cores difer-
entes. Nesse caso, a partir dos valores apresentados nas colunas Media Harmonica RGB
e Media Harmonica HSV da Tabela 4, queremos verificar se a media atribuıda ao Modelo
59
RGB e menor do que a media do Modelo HSV. Para isso, a equacao 7.1 servira para a
definicao da hipoteses H0, que significa nao haver diferenca entre os Modelos de Cores
RGB e HSV no processo de segmentacao, ou seja, as medias dos dois modelos apos a
aplicacao do teste sao iguais.
H0 : µd = 0
onde µd = µRGB − µHSV
H1 : µd < 0
Entretanto, e necessario estabelecer um nıvel de confianca ou significancia a fim de
rejeitar a hipotese nula (H0), quando ela for verdadeira. Para este problema, este nıvel
foi definido em 5% (α = 0, 05 onde 1−α = 0, 975). Uma vez que a populacao e represen-
tada por 15 cartas topograficas, foi utilizada a variavel Tn−1 da distribuicao t de Student
(conforme a equacao 7.1).
Tn−1 =d
(Sd/√n)T15−1
(7.1)
Esse teste deve ser definido como um teste unilateral a esquerda (com 5% de sig-
nificancia), e a variavel de teste Tn−1 de 15 amostras permite definir um valor crıtico
(obtido da tabela da distribuicao t de Student) de 2,13. Portanto, para valores maiores
de -2,13 aceitaremos H0 (ou seja, o uso dos dois modelos independe do resultado obtido
no processo de segmentacao, dada que a diferenca entre as medias e nula).
d =
∑di
n(7.2)
No entanto, se Tn−1 for menor do que -2,13 rejeitaremos H0 (a media harmonica do
Modelo HSV aumentou demais em relacao a media harmonica do Modelo RGB para que
a diferenca seja devida apenas ao acaso). Vale ressaltar que ha uma chance de 5% de
que venhamos a rejeitar H0 sendo ela verdadeira. Procedendo aos calculos, a equacao 7.2
representa o calculo da media das medias harmonicas para cada modelo de cor, a equacao
7.3 calcula o valor da diferenca entre as medias e com o resultado dessas duas equacoes
e possıvel estabelecer o valor final de -8,42 por meio da equacao 7.1 a fim de rejeitar a
hipotese H0 a 5% de significancia.
60
sd =
√∑d2
i −[(∑di)
2 /n]
n− 1(7.3)
Portanto, conforme demonstrado na equacao 7.4, pelo Teste de Hipotese e possıvel
concluir com 95% de confianca (ou com uma chance de erro de 5%) que a utilizacao
do modelo HSV no processo de segmentacao de curvas de nıvel em cartas topograficas
coloridas classificadas com alta concentracao de elementos e com forte consistencia na cor
e mais eficaz que o modelo RGB.
¯Tn−1 = T9 = −8, 42 < Tn−1, crıtico = T9;0,05 = −T9;0,095 = −2, 13 (7.4)
7.2 Consideracoes Finais
De acordo com os dados apresentados na Tabela 3, O Modelo HSV se mostra mais
eficaz na segmentacao do geo-objeto curva de nıvel. E possıvel observar que os valores
obtidos na media harmonica sao maiores que aqueles alcancados pelo Modelo RGB. En-
tretanto, a regularidade com que se mantem essa media e inferior a regularidade das
medias obtidas pelo Modelo RGB. O grafico ilustrado na Fig. 19 apresenta como exemplo
a superioridade do Modelo HSV na segmentacao da carta topografica do Municıpio de
Raul Soares - MG. Observe no referido grafico que nas linhas tracadas ha uma parte mais
grossa que representa a area onde esta localizada a media harmonica. Nesses tracados, o
comprimento dessa linha e maior no tracado que representa o Modelo RGB. Vale ressaltar
que a linha que representa o Modelo HSV refere-se ao limiar alcancado com a manipulacao
do canal Saturation.
E importante observar alem de todos os resultados apresentados nesta dissertacao
que se o Modelo RGB possui uma descorrelacao entre suas cores primarias, dificultando
a identificacao de uma determinada cor de interesse, entao o modelo HSV seria a me-
lhor opcao para ser utilizado no processo de segmentacao, pois as componentes H, S e V
sao mais correlacionadas. Entretanto, o Modelo RGB, apesar de apresentar essa descor-
relacao, se combinado com metodos que permitem calcular a distancia entre seus canais
de cores tende a facilitar encontrar o geo-objeto curva de nıvel. Ou seja, o que define
a eficacia no processo de segmentacao utilizando o Modelo RGB e o algoritmo utilizado
como suporte para facilitar o reconhecimento de uma determinada cor de interesse, en-
61
Figura 19: Grafico demonstrando o comportamento dos Modelos RGB e HSV no processo desegmentacao das curvas de nıvel da carta topografica do Municıpio de Raul Soares - MG
quanto o que define a eficacia do Modelo HSV no processo de segmentacao sao os valores
que deverao ser estabelecidos nos canais H, S e V a fim de encontrar essa mesma cor.
Portanto, se nao houver um algoritmo que solucione o problema da descorrelacao dos
canais que compoem o Modelo de Cor RGB, independente do tipo da carta utilizada, o
Modelo HSV ira produzir melhores resultados no processo de segmentacao. Entao, especi-
ficamente nesse caso, a resposta corrobora a essa questao-teste. Caso contrario, os dois
serao igualmente adequados ao processo de segmentacao se desconsiderarmos a qualidade
da carta.
Alem disso, algumas cartas nao obtiveram resultados significativos quando segmen-
tadas utilizando o Modelo de Cor RGB. Especificamente as cartas topograficas do Mu-
nicıpio de Serra Selada - MG e do Municıpio de Lagamar - MG nao foram segmentadas
corretamente. Ambas foram classificadas como “Alta concentracao de elementos”e o algo-
ritmo empregado para reconhecer as cores que representam as curvas de nıvel nao logrou
sucesso. Entretanto, outra carta com a mesma classificacao, a do Municıpio de Buritis
- MG, obteve resultados diferentes. Sugere-se que a causa da disparidade dos resultados
entre as tres cartas com a mesma classificacao deve-se a forma como as curvas de nıvel
estao dispostas ao longo do documento cartografico. Observe nos fragmentos apresenta-
62
dos nas ilustracoes da Fig. 20 que ha notada diferenca entre os espacos entre as curvas
de nıvel da carta de Buritis e das demais. Nao obstante, a proximidade das curvas e o
baixo contraste desses elementos com o fundo da imagem causam uma grande confusao
na identificacao do que e ou nao o geo-objeto que se pretende segmentar. A prova disso
esta nas cartas de Serra Selada e Lagamar. Observe nas ilustracoes (d) e (f) da mesma
Figura, que o objeto segmentado foi todo o conjunto, ou seja, fundo e demais geo-objetos.
(a) Fragmento da carta to-pografica do Municıpio deSerra Selada - MG
(b) Fragmento da carta to-pografica do Municıpio deBuritis - MG
(c) Fragmento da carta to-pografica do Municıpio deLagamar - MG
(d) Fragmento da mesmaarea da carta de Serra Se-lada - MG segmentada peloModelo de Cor RGB
(e) Fragmento da mesmaarea da carta de Buritis -MG segmentada pelo Mo-delo de Cor RGB
(f) Fragmento da mesmaarea da carta de Lagamar- MG segmentada pelo Mo-delo de Cor RGB
Figura 20: Resultados obtidos com processo de segmentacao utilizando o Modelo de Cor RGB
Portanto, o Modelo HSV pode ser melhor utilizado pois permite encontrar o geo-objeto
de interesse sem a necessidade de combina-lo com outros metodos o que nao acontece com
o Modelo RGB. Entretanto, como as caracterısticas de consistencia do geo-objeto e de
concentracao de elementos nao podem ser separadas para uma avaliacao global da carta,
pois as duas fazem parte do mesmo documento, a decisao de qual modelo e o mais ade-
quado somente sera possıvel se houver alguma ferramenta que realize segmentacoes em
cartas topograficas coloridas e essa possuir a opcao de qual modelo utilizar.
Conforme estabelecido no inıcio desta Secao, a hipotese sera considerada plausıvel caso
todas as questoes chaves forem corroboradas por meio da validacao das questoes-teste.
Nesse caso, as questoes-testes 1, 2 e 3 foram corroboradas, concluındo que a hipotese de
que o que compromete os resultados da segmentacao e a consistencia da cor do geo-objeto
63
curva de nıvel e/ou a concentracao de variados geo-objetos ao longo da carta topografica
utilizada e plausıvel.
7.3 Limitacoes do metodo e recomendacoes
Nesta dissertacao, o uso do metodo apresentado na Secao 5.6 mostrou-se eficaz no
levantamento dos dados necessarios para a execucao do experimento. No entanto, a
pesquisa tem limitacoes que devem ser esclarecidas. Nao se pode garantir que os dados
obtidos reflitam a realidade devido a quantidade de pixels que compoem a curva de nıvel
da carta original e a quantidade de pixels contidos na imagem com o mesmo geo-objeto
vetorizado. A diferenca entre ambas e relativamente grande, se observarmos que para o
geo-objeto vetorizado basta um unico pixel de espessura para representa-lo, enquanto que
essa espessura e bem maior no objeto original. Portanto, existe um numero razoavel de
falsos-negativos nas imagens segmentadas. Ou seja, varios pixels que compoem as curvas
nao sao tratados como relevantes pois na operacao logica AND e o objeto vetorizado quem
determina quais sao os pixels comuns entre ele o geo-objeto original. Portanto, seria
recomendavel em trabalhos futuros o desenvolvimento de uma ferramenta que permita
filtrar (segmentar) de alguma forma os verdadeiros pixels que compoem a curva de nıvel
original, a fim de gerar uma nova imagem e essa ser usada na referida operacao logica.
Alem disso, e recomendavel como trabalhos futuros uma forma de automatizar o processo
de qualificacao das cartas topograficas propostas por (GRIFFITH, 1983). O processo,
apesar de se mostrar eficaz, e bastante oneroso, pois a quantidade de quadrıculas existentes
em uma unica carta e bastante elevada, gerando um trabalho dispendioso e obviamente
propenso a erros. Portanto, um metodo que permita localizar as referidas quadrıculas,
e identificar, selecionar, segmentar e contabilizar a quantidade de geo-objetos existentes
ness,e espaco pode trazer uma eficiencia consideravel no processo de classificacao de cartas
topograficas.
No mais, espera-se ter podido contribuir com as comunidades academica e cientıfica
na expansao do conhecimento cientıfico e para o desenvolvimento do segmento de solucoes
no processamento digital de imagens, principalmente na segmentacao de geo-objetos em
documentos cartograficos coloridos.
64
Referencias
ARRIGHI, P.; SOILLE, P. From scanned topographic maps to digital elevation models.In: International Symposium on Imaging Applications in Geology. [S.l.]: Reprinted fromthe Proceedings of Geovision 99, 1999. p. 1.
BHATIA, P. K. Computer Graphics. 2. ed. [S.l.]: I.k. International Pvt. Ltd, 2008. 400 p.ISBN 9788189866730.
CARTOGRAFIA., S. de Planejamento da Presidencia IBGE Diretoria de Geodesia e.Carta topografica de Manhuacu - MG - Brasil. Folha SF-23-X-B-III-4, MI-2476/4, escala1:50.000. 1979.
CHEN, H.; TANG, X.; YANG, Y. Recognition of contour line from scanned militarytopographic maps. IEEE International Conference on Information and Automation,ICIA 2008, p. 873–878, June 2008.
CHIANG, Y.-Y. et al. Automatic and accurate extraction of road intersections fromraster maps. Geoinformatica, Kluwer Academic Publishers, Hingham, MA, USA, v. 13,n. 2, p. 121–157, 2009. ISSN 1384-6175.
COFER, R. H.; TOU, J. T. Automated map reading and analysis by computer. In:AFIPS ’72 (Fall, part I): Proceedings of the December 5-7, 1972, fall joint computerconference, part I. New York, NY, USA: ACM, 1972. p. 135–145.
DUPONT, F.; DESEILLIGNY, M.; GONDRAN, M. DTM extraction from topographicmaps. IEEE Fifth International Conference on Document Analysis and Recognition -ICDAR ’99, p. 475–478, September 1999.
GOMES, J.; VELHO, L. Computacao Grafica: Imagens. 1. ed. Rio de Janeiro - RJ:IMPA / SBPM, 1994. 421 p. ISBN 85-244-0088-9.
GREENLEE, D. D. Raster and vector processing for scanned linework. Auto-Carto 8 -International Symposium on Computer-Assisted Cartography, v. 53, n. 10, p. 640–649,1987.
GRIFFITH, J. j. Analise dos recursos visuais do parque nacional do caparao. RevistaFloresta, v. 14, n. 2, p. 15 – 21, 1983.
IBGE. Avaliando os requisitos dos dados vetoriais para sig - conectividade, fechamentode poligonos e parametros de vetorizacao. In: IBGE - INSTITUTO BRASILEIRODE GEOGRAFIA E ESTATıSTICA - GEOCIeNCIAS - CARTOGRAFIA. Manualde Validacao da Vetorizacao. Brasılia, 2009. cap. Execucao da Validacao. Disponıvelem: <http://www.ibge.gov.br/home/geociencias% -/cartografia/validacao\ da\ vetori-.shtm>. Acesso em: 3 dez. 2009.
65
JAIN, A. K. Fundamentals of Digital Image Processing. 1. ed. Englewood Cliffs, NJ:Prentice-Hall Inc., 1989. 571 p. ISBN 0-13-336165-9.
KARIMA, M.; SADHAL, K. S.; MCNEIL, T. . From paper drawings to computer-aideddesign. IEEE Computer Graphics and Applications, v. 5, n. 2, p. 27–39, February 1985.
MARCU, G.; ABE, S. Color clusterization using modified hsl space. Fourth ColorImaging Conference: Color Science, Systems, and Applications Scottsdale, Arizona, p.151–155, November 1995.
DAVIS Jr., C. A. Geometria de triangulos e polıgonos. In: InfoGeo. [S.l.: s.n.], 2001.v. 3, n. 20, p. 26–28.
OLIVEIRA, C. de. Curso de Cartografia Moderna. 2. ed. Sao Paulo: IBGE, 1993. 152 p.
PEDRINI, H.; SCHWARTZ, W. R. Analise de Imagens Digitais : Princıpios,algoritmos e aplicacoes. 1. ed. Sao Paulo - SP: Thomson Learning, 2008. 508 p. ISBN978-85-221-0595-3.
POPPER, K. R. A Logica da Pesquisa Cientıfica. 6. ed. Sao Paulo, SP: Editora Cultrix,2000. 568 p. ISBN 8853160236x.
POUDEROUX, J.; SPINELLO, S. Global contour lines reconstruction in topographicmaps. IEEE Ninth International Conference on Document Analysis and Recognition -ICDAR 2007, n. 2, p. 779–783, September 2007.
RUSS, J. C. The Image Processing Handbook. 5. ed. [S.l.]: CRC Handbook Published inCooperation with IEEE Press, 2007. 817 p. ISBN 978-0849325168.
SALVATORE, S.; GUITTON, P. Contour line recognition from scanned topographicmaps. WSCG (Winter School of Computer Graphics), v. 12, n. 1-3, p. 627–637, feb 2003.Disponıvel em: <http://iparla.labri.fr/publications/2004/SG04>.
Recommended