6
Avaliação do Potencial da Representação Polinomial Cúbica de Hermite na Classificação de Formas Agostinho de Medeiros Brito Júnior) Cl ésio Luis Tozzi' Ana Maria Goulart de Azevedo Tozz i 1 )UNICAMP/FEE/DCA e x. Postal 610 I, 13083-970 Campinas, SP. Brasil [email protected] "UNICAMP/IB Cx. Postal 6109. 13083-970 Campinas. SP. Brasil Abstract: This papel' evaluates the shape discriminatory potential of the geometry vectors in the Hermite Cubic Polinomial Representation. This potential is analyzed considering the classification of two species of legume by the shape of leaf secondary veins. Resumo : Este trabalho avalia o potencial discriminatório dos vetores da Representação Polinomial Cúbica de Hennite na classificação de formas, Este potencial é analisado com base na classificação de duas espécies de leguminosas pela forma das nervuras secundárias de suas folhas. 1. Introdução Tamanho, forma, cor, textura e posição são alguns dos fatores utilizados no reconhecimento de objetos. Experimentos psicológicos, entretanto, indicam que o ser humano está apto a reconhecer objetos considerando unicamente a sua forma, o que toma este o elemento mais importante no processo de visão e reconhecimento [N iklas (1994)]. Embora a forma apresente este pape l preponderante no processo de reconhecimento, a descrição e a comparação de formas não são tarefas simples. '. Recentemente, com a disponibilidade de meios eletrônicos de aquisição de dados, um grande número de trabalhos que tratam do recon hecimento e classificação baseado em formas tem sido apresentado na literatura. Estes trabalhos, em sua maioria, empregam descrição de formas realizada a partir de medidas de comprimento, largura, área ou de relações entre estas medidas, que são tratadas como variáveis contínuas. Este tipo de abordagem, entretanto, apresenta dificu ldades originadas pelo fato de que as relações 40 consideradas para descrição da forma podem apresentar uma alta correlação com variáveis que definem o tamanho. De fato, as variáveis medidas devem ser interpretadas mais realisticamente como uma mistura (combinações) de forma e tamanho e neste caso métodos para análise de sistemas multivariáveis devem ser empregados na separação - destes elementos [Sundberg (1989)] . Para muitas áreas de aplicação a descrição e comparação de forma assume importância essencial. No caso específico da biol ogia , a similaridade de formas (shape) há muito tempo tem sido aceita como elemento fundamental na sistemática animal e vegetal. Todavia, se a descrição de formas nos termos quantitativos acima considerados é uma fonte relevante de informação para testes de homologia é ainda uma que stão controversa [Zelditch et a lI. (1995)]. Os métodos quantitativos de descrição não permitem determinar onde a diferença entre formas está localizada, nem permitem determinar a extensão das regiões que diferem entre si. O que se compara, neste caso , é uma mera lista de medidas ou coeficientes. Esta restrição ao em prego da forma como característica sistemática só poderá ser removida se

Avaliação do Potencial da Representação Polinomial Cúbica ... · Avaliação do Potencial da Representação Polinomial Cúbica de Hermite na Classificação de Formas Agostin

  • Upload
    lylien

  • View
    233

  • Download
    0

Embed Size (px)

Citation preview

Avaliação do Potencial da Representação PolinomialCúbica de Hermite na Classificação de Formas

Agostinho de Medeiros Brito Júnior)Cl ésio Luis Tozzi'

Ana Maria Goulart de Azevedo Tozzi1

)UNICAMP/FEE /DCAe x. Postal 610 I, 13083-970 Campinas, SP. Brasil

[email protected]

"UNICAMP/IBCx. Postal 6109 . 13083-970 Campinas. SP. Brasil

Abstract: Th is papel' evaluates the shape discriminatory potential of the geometry vectors in the HermiteCubic Polinomial Representation . This potentia l is analyzed considering the classification of two speciesof legume by the shape of leaf secondary veins .

Resumo: Este trabalho avalia o potencial discriminatório dos vetores da Representação Polinomial Cúbicade Hennite na classificação de formas , Este potencial é analisado com base na classificação de duasespécies de leguminosas pela forma das nervuras secundárias de suas folhas.

1. Introdução

Tamanho, forma , cor, textura e posição são a lgunsdos fatores utilizados no reconhecimento de objetos.Experimentos psicológicos, entretanto, indicam que oser humano está apto a reconhecer objetosconsiderando unicamente a sua forma , o que tomaeste o elemento mais importante no processo de visãoe reconhecimento [N iklas (1994)].

Embora a forma apresente este pape lpreponderante no processo de reconhecimento, adescrição e a comparação de formas não são tarefassimples. '.

Recentemente, com a disponibilidade de meioseletrônicos de aquisição de dados, um grande númerode trabalhos que tratam do recon hecimento eclassificação baseado em formas tem sidoapresentado na literatura. Estes trabalhos, em suamaioria, empregam descrição de formas realizada apartir de medidas de comprimento, largura, área ou derelações entre estas medidas, que são tratadas comovariáveis contínuas.

Este tipo de abordagem, entretanto, apresentadificu ldades originadas pelo fato de que as relações

40

consideradas para descrição da forma podemapresentar uma alta correlação com variáveis quedefinem o tamanho. De fato, as variáveis medidasdevem ser interpretadas mais realis ticamente comouma mistura (combinações) de forma e tamanho eneste caso métodos para análise de sistemasmultivariáveis devem ser empregados na separação- destes elementos [Sundberg (1989)] .

Para muitas áreas de aplicação a descrição ecomparação de forma assume importânc ia essencial.No caso específico da biologia , a similaridade deformas (shape) há muito tempo tem sido aceita comoelemento fundamental na sistemática animal evegetal. Todavia, se a desc rição de formas nos termosquantitativos acima considerados é uma fonterelevante de informação para testes de homologia éainda uma questão controversa [Zeld itch et a lI.(1995)]. Os métodos quantitativos de descrição nãopermitem determinar onde a diferença entre formasestá localizada, nem permitem determinar a extensãodas regiões que diferem entre si . O que se compara,neste caso , é uma mera lista de medidas oucoeficientes.

Esta restrição ao em prego da forma comocaracterística sistemática só poderá ser removida se

2.2 Representação na forma de Hermite

2. Técnicas de aproximação de curvas

Uma representação mais compacta das equações2.1 é obtida utilizando-se uma representação matricialda forma

(2.3)

(2.4)

(2.2)Q(t) = rconde

T=[eetl]e

a x a y

c= b x by= [cx Cy ]Cx c y

dx dy

As equações polinomiais cúbicas que defmem umacurva paramétrica genérica Q(t) são do tipo:

jX(f) = axt 3 +bxt2 +cxt+dx (2.1)y(f)=ayt

3 +byl 2 +cyl+dy '

Como já observado na introdução a representação dascurvas será feita através de equações cúbicasparamétricas na forma de Hermite. A opção pelarepresentação por funções paramétricas de terceirograu se deu pela flexibilidade no controle da forma,dacurva. Funções de grau inferior não permitem umajuste adequado da forma, enquanto funções de grausuperior, além de proporcionarem ondulaçõesindesejadas na forma da curva, requerem um custocomputacional maior.

2.1 Representação ,

Para uma curva representada na forma de Hermite osegmento polinomial é deteiminado pelos valores dosseus pontos inicial e fmal, Pie P], e dos vetorestangentes àcurva nestes pontos, RI e R], onde tassume valores no intervalo [0,1]. Estes vetores sãodenominados vetores de geometria da curva e estãorepresentados na figura 2.1.

Os vetores de podem ser expressosem função do vetor de posição Q(t)" como descrevemas equações 2.5.

(a)

Dentre estes descritores, o que tem apresentadomaior aplicação tanto em biologia como em outrasáreas de conhecimento é o Descritor de Fourier[Persoon e Fu (1986), Maze (1982)], que é aplicadoprincipalmente a formas ou curvas fechadas, emborasua aplicação possa ser estendida para curvas abertas.O custo computacional na determinação doscoeficientes é relativamente alto e para efeitos dediscriminação um número .grande de coeficientespode eventualmente ser necessário.

Dentro deste contexto, tendo como objetivo abusca de descritores globais alternativos de menorcusto computacional, é que se realiza neste trabalhouma avaliação do potencial discriminatório associadoaos elementos da representação polinomial deHermite (vetores tangentes nos pontos inicial e fmalda curva e posições destes pontos) .

Para avaliação do potencial discriminatório dodescritor foi tomado como exemplo a classificação,com base na forma das nervuras foliolaressecundárias , de duas espécies aparentadas deleguminosas (Lonchocarpus subglauscescensMart. exBenth e L. muehlbergianus Hassl.), que apresentamgrande semelhança vegetativa nas formas de suasnervuras e de seu contorno (fig. 1.1).

Este artigo está organizado na seguinte forma:na seção 2 é apresentada uma revisão sobre arepresentação polinomial de Hermite; na seção 3 édiscutido o ajuste polinomial de curvas pelo métododos mínimos quadrados; na seção 4 a metodologiapara aquisição dos dados utilizados na avaliação dodescritor é apresentada, na seção 5 é feita aapresentação e análise dos resultados obtidos, e naseção 6 são apresentadas as conclusões finais.

uma descrição global e não ambígua for disponível. Édentro desta visão que tem sido considerado ediscutido por diversos autores p uso de descritoresglobais de forma, destacando-se dentre eles: ângulotangente e curvatura, momentos, Descritores deFourier.

(b)

Figura 1.1: Folíolos de Lonchocarpus muehlbergianusHassl.(a) e de L. subglaucescens Mart. ex Benth (b).

r, = [PIX p/y ]= Q(O) (2.5 a)

= [P2X P2Y]= Q(1) (2.5 b)

RI = flx r/y]= Q'(O) (2.5 c)

R2 =r2X r2y ]=Q'(l) (2.5 d)

41

L- ... x

3.1 Ajuste polinomial para uma funçãoexplícita

O ajuste polinomial consiste em encontrar umconjunto de coeficientes b, que minimize a função demérito e é feito a partir de um conjunto de N pontoscom coordenadas (x; v) , i=:/ ,...,N, amostrados sobre acurva. O valor ajustado y, relativo a x, é dado pelaequação 3. I.

Dada uma curva real, o que se procura neste contextoé a determinação dos parâmetros da matriz degeometria que a representa. Duas formas paradeterminação destes parâmetros podem serconsideradas. A primeira delas consiste no ajusteiterativo dos módulos e direções dos vetores degeometria, até a obtenção da aproximação desejadapara a curva real. Esta abordagem não é recomendadapois exige um trabalho exaustivo para o ajuste edepende da experiência de quem o realiza. Nasegunda forma, é feita uma amostragem de pontossobre a curva e os vetores de geometria obtidosatravés da minimização do erro entre a curva real e acurva modelada. Esta última abordagem, por ser amais apropriada e conceitualmente mais elegante, foiempregada neste trabalho e os aspectos relacionados asua implementação são apresentados na seqüência.

O ajuste da curva a ser modelada é feito atravésdo método dos mínimos quadrados [Press et aI.(1992)], sendo os seus parâmetros ideais obtidosatravés da minimização de uma função de mérito.Neste caso, esta função é uma medida de erro entre acurva modelada e a curva real.

3. Ajuste polinomial pelo método dosmínimos quadrados

(2.9)

(2.7)

(2.6)o]c

r121 3 -31] +/

1-213 +31]

B" = I

l/ 3 _- 2 12 + 1

13 _1 2

r; p,yl

Gur.. P2y

=R,x Ri\"s., R2.,· .J

Definindoa matriz de geometria

Q(t)=[x(t) y (t )] = T .C = Bu· Cu (2.8)

y

onde os elementos da matriz

Figura 2.1: Curva de Hermite com os Vetores deGeometria PI, P2, RI e R2.

são denominados funções de b/ending de Hennite(fig. 2.2) e ponderam a influência de cada elementoda matriz G" ao longo da curva Q(I) .

onde

é possível mostrar que o vetor de posição Qtt) podeser escrito na forma

e a função de méritoç = F(b I.b2, ... , bl' ) como o erroquadráticoS'

o valor mínimo para a expressão do erro quadrático éobtido pela determinação das derivadas parciais daequação 3.3 em relação a cada elemento ' b, eigualando os resultados a zero. Na forma matricial,esta condição é expressa pela.equação

o.

O.f(t)

O.

o.

tFigura 2.2: Funções de b/ending de Hermiteassociadas aos elementos do vetor de geometria GH .

Definindo o erro

e i = y , - Yi

N

ç=Iel = ele, +eje] + ···+e", eNi='

(3 .2)

(3.3)

42

3.2 Ajuste de curvas para um modelo -----oparamétrico

Para uma representação polinomial paramétrica aabordagem apresentada no item 3.1 deve sermodificada de modo que as equações paramétricasx(t) e y (t) sejam dependentes e ajustemadequadamente a curva no plano xy .Conseqüentemente, os ajustes das duas curvas (t,x(t))e (t,y(t)) deverão ser efetuados iterati vamente.

Além disso , para o caso 90modelo polinomialde Hermite, o método dos mínimos quadrados deveser modificado de modo a introduzir restriçõesgarantindo que os pontos inicial e final da curvamod elada coincidam com os pontos inicia l e final dacurva real, respectivamente.

Para o ajuste das curvas param étricas x(t) e y(t) énecessá rio que o parâmetro t seja estabelecido. Osvalores ideais de ti associados a cada ponto amostrado[x; yJ são determinados pelo algoritmo de otimizaçãoproposto por [Plass e Stone (198 3)], que minimiza oerro entre a curva modelada e os pontos amostrados.

O algoritmo utiliza inicialmente umadistribuição uniforme para os valores dos parâmetro ti .e ajusta as curvas xlt) e y/t) pelo métodos dosmínimos quadrados. Em cada iteração seguinte sãocalculados, pelo método de Newton-Raphson [Presset a I. (1992)], -os novos valores de t i (eq. 3.7) quemin imizam o quadrado da distânc ia (eq. 3.6) de cadaponto amostrado à curva modelada. Com estes novosvalores de t i , o método dos mínimos quadrados éutilizado para o ajuste das novas curvas (t,x(t)) e(t,y(t)) , sendo este processo de ajuste repetido até queo critério de convergência seja satisfeito.

d/ = (c;- i(t)Y +(y; - y(t)Y

ti.II+,<t. ; - -x(t )]+ - y(t )] }/

{(t)[Xi - x(t) ]- [x(t)r+y(t )[Yi - y(t)]- [Y(t)ry

x

4.2 Fase 2 - Modelagem' das curvas eobtenção dos descritoresPara o ajuste das curvas foram estabelecidos sistemasreferenciais para cada nervura, como mostra a figura4.2.

y

Figura 4.1: Imagem de um folíolo com a marcaçãodos pontos amostrados

Apesar da marcação apresentada na figura 4.1,na prática, foram considerados na modelagemsomente pontos amostrados até a terça parte daprojeção de cada nervura secundária sobre o eixohorizontal, visto que a representação de Hermite nãoconsegue modelar o comportamento de algumasnervuras na região mais próxima à borda do folíolosem comprometer o restante da curva.

Os dados utilizados para descrição da forma dasnervuras foram adquiridos manualmente. Não houvepreocupação com o automatização do processo deaquisição visto que o objetivo primordial destetrabalho é a avaliação da capacidade de discriminaçãode formas do descritor cons iderado.

A aquisição foi feita conforme as fases a seguir.

4.1 Fase 1- de dadosNesta fase foi colocada sobre a imagem do folíolouma reta que aproxima sua nervura principal. Estareta é usada como referência para determinação datransformação de rotação que alinha o eixo principaldo folíolo com o eixo horizontal do dispositivo deexibição. Os pontos foram então marcados sobre asnervuras, tal como observado na figura 4 .1.

Figura 4.2: Colocação dos sistemas referenciais sobreas nervuras do folíolo .

4. Utilização do polinômio de Hermite nadescrição da nervura foliolar secundária

(3.6)

(3 .7)

N

k j = L Yx/; =/

s" bo k"s" +' b, k,S"+2 b2 k2 (3.4)

s2" b" k"

e.\'

s. = 'x jI L.,. -'

;=/

So S, s2

S, S2 s;

s2 S, S, -I

SI' S" +' S" +2

onde :

onde ti,1I é o valor de ti para a n-ésima iteração durantea passagem pelo método de Newton-Raphson. De modo a manter consistência entre os

sistemas referenciais de todas as nervu ras secundárias

43

e possibilitar a análise dos dados modelados, os eixoshorizontais dos sistemas referenciais estabelecidosforam tomados coincidentes com a nervura principaldo folíolo, tendo o sentido base ápice, e os eixosverticais de cada nervura o sentido nervura principalborda lateral correspondente. A origem dos eixos ,

para cada nervura modelada, foi colocada no ponto deinserção da nervura secundária analisada.

confiança de 95% para as médias e para as variâncias[Box e Hunter (1978)] foi calculado, pelo método deBayes, o ponto de separação entre classes na reta deprojeção.

Nas figuras 5.1 a 5.4 são apresentados osgráficos obtidos para os dados projetadosconsiderando as proposições I a 4.

Além disso, foi feita a escolha de uma nervurarepresentativa para o folíolo com base no vetor degeometria RI' Uma transformação da forma

(4.1)

foi realizada e o valor de eI calculado para todas ascurvas do folíolo. A nervura que fornece o valormediano para eI no foliolo foi considerada a nervurarepresentativa.

A análise do desempenho discriminatório foirealizada com base nas probabilidades declassificação errada, isto é, nas probabilidades de umfolíolo pertencente à espécie A ser classificado comosendo pertencente à espécie B e vice-versa. Taisprobabilidades foram calculadas a partir dasestimativas da média e variância do conjunto dosdados projetados, considerando também intervalos deconfiança de 95%.

0.6Lmuehlbergianus oL.subg laucescens t-

lim iar de separação - -

oo

o----- ---- --- - -- -- - - - - ------

0.4

o .. .. .... .. .... ".... -t- .. .. .. .... "" .... .. .... ..·0.2 .. " + .. "-t- """ " ..""·0.4

10 15 20 25 30 35 40Número da amostra

Probabilidade de classificarão errada (%)Esp écie A Lmuehlbergianus LsubglaucescensEspécie B Lsubglaucescens L.muehlbergianusCasoI 3,19 % 1,95 %2 3,23% 1,97 %3 3,81 % 2,52 %4 4,29 % 2,45%

Figura 5.1: Valores das projeções para R" Rze Pz.

Para todas as proposições foi possível aseparação das espécies,. Para as proposições 1 a 3,embora os erros máximos de classificação tenhamsido menores que os' obtidos na proposição 4, adiferença entre os mesmos não foi significativa. Osvetores de geometria Rz e Pz por si só nãopossibilitam a discriminação das amostras. Embora ovetor RI, isoladamente, possa separar as espécies comerro inferior a 5%, é claro da análise da tabela 5.1 asuperioridade discriminatória quando todo o conjuntodos vetores de geometria é considerado.

Tabela 5.1: Erros máximos de classificação.

(5.1)

Para estudar o potencial dos elementos da forma deHermite como discriminadores, foram analisadas 76amostras de folíolos, sendo 38 amostras da espécieLonchocarpus subglaucescens e 38 de L.muehlbergianus. Em todos os casos a aquisição dosdados foi realizada no terceiro par de fol íolos, comodescrito na seção 4.

Calculados os vetores de geometria, com basena nervura representativa do folíolo, foi analisado opotencial de discriminação do descritor considerandoos casos:

I. Somente os vetores de geometria RI e Rze Pz.2. Somente os vetores de geometria RI e Rz.3. Somente os vetores de geometria RI e Pz .4. Somente o vetor de geometria RI .

O critério separador de classes utilizado foi odiscriminante linear de Fisher associado à teoria deBayes [Schalkoff (1992)]. O método de . Fisherdetermina uma reta no espaço n-dimensional cujaorientação assegura que o conjunto dos dadosprojetados ortogonalmente na mesma tenham amáxima separação possível. Tal orientação écalculada maximizando uma função que relaciona asmédias' e variâncias projetadas das amostras, tal comomostra a equação 5.1.

Para cada conjunto de dados projetados na retacorrespondente às classes consideradas foi assumidadistribuição normal N(f.!;.(JJ. Utilizando intervalos de

S. Resultados obtidos e discussões

44

classificada poroutros caracteres

previamentecom base em

Box, G. E. P. e Hunter, 1. S., Statistics forExperimenters: an Introduction to Design, DataAnalysis, and Model Building, John Wiley &Sons, 1978.

Maze, 1. "A Comment Upon the Uses of FourierMethods in Systematics" , Systematic Zoology,VaI. 31, Num. 1, pp. 85-92, 1982.

Niklas , K. 1., Plant Allometry: The Scaling of Formand Process, Chicago: The University ofChicago, 1994.

Referências

Foi considerada a distribuição normal para osparâmetros analisados, visto ser esta a abordagemusual quando se trata de caracteristicas naturais.Todavia, no caso em que a distribuição não possa serconsiderada normal, o uso de métodos nãoparamétricos para classificação pode ser considerado,não inviabilizando a abordagem apresentada.

Dada a flexibilidade na modelagem da curva e omodo simples pelo qual os descritores podem serobtidos, a baixa dimensionalidade do descritor e oreduzido custo computacional associado a sua análise,é possível afirmar que o uso da representação deHermite é uma boa opção para caracterização decurvas abertas quando um processo classificatório estáassociado .

conhecida etaxonomistas,taxanômicos.

40

.. I-.."

ooo

.. .... ..".. ....I-

-t-

..

..

.. ..

.. ..r I-

L.muehlbe rg ianus oLsubglaucescens +

limiar de separa ção - -o oo o oo 0 0 0 0

o o o oo

0 0

L.mueh lberg ianu s oL.subglau cescens t-

o o Limiar de - -

0 ° o 00 0° 0 oo

-t-...."

.. .."..

r

I-

..

o o oo 00o

t-

o

rr

o

L.muehlberg iapus oL.subglaucescens +Reta disc9rflinante - -,

o o o o oo o o 00

r+t- +++ t-.. ..

..

.. ..

__ _ _ ___ _____ 2 _

o-- -- - - - - - - - - - - - -- - - - -- - --- -

O 10 15 20 25 30 35Numero da amostra

O

0.2 o

0.4

2.5

0.5

0.3 o

000.4 0 0 0

0.1

0.2

o r r

-0.1 ..-0.2

-0.4

..

Figura 5.3: Valores das projeções para RI e P2.

o 10 15 20 25 30 35 40Numer o da amostra

0.6

Figura 5.2: Valores das projeções para RI> R2•

-t-

6. Conclusões

Figura 5.4: Componentes do vetor de geometria RI'

0.50 .2 0.4 0.6 0 .8 1 1.2 1.4 1.6 1.8

Rl x

Os resultados obtidos mostram que a representaçãopolinomial de Hermite possui capacidade derepresentação global e potencial de discriminação deformas. O descritor foi testado com dados reaismostrando que o problema de separação envolvendoduas classes de curvas similares foi resolvidoadequadamente.

A eficácia do descritor foi demonstrada pelabaixa taxa de erro obtida na classificação da amostra

Persoon, E. e Fu, K., Shape Discrimination UsingFourier Descriptors, IEEE Trans. on PatternAnalysis and Machine Intelligence, Vol. 8, num.3, pp. 388-397, 1986.

Plass, M. e Stone, M., Curve-Fitting with PiecewiseParametric Cubics, Computer Graphics, Vol.17, Num . 3, pp. 229-239, 1983.

Press, W. H., Teukolsky, S. A., Vetterling, W. T. eFlannery, B. P. F., Numerical Recipes in C,Cambridge Press, 1992.

Schalkoff, R., Pattern Recognition, John Wiley &Sons, 1992.

Sundberg, P., Shape and Size-constrained PrincipalComponent Analysis, Systematic Zoology, VoI.38, Num . 2, pp.166-168, 1989.

Zelditch, M. L., Fink, W. L. e Swiderski, D. L.,Morphometrics, Homology , and Phylogenetics:Quantified Characters as Synapomorphies,Systematic Biology, Vol. 44, Num . 2, pp. 179-189,1995.

oo

..-t-

,...."'0 o

+- ,I o o+- t- +r1'- t- '" I

t+ :;..;:1- .. .,"" '1 o+t-t //0 01,

o

..

, ó

1.5

45