Upload
sara-cortez
View
6
Download
0
Embed Size (px)
DESCRIPTION
sasd
Citation preview
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Mtodo Kernel: Estimao de Densidades e Classificao dePadres
Marcelo Rodrigo Portela Ferreira
Departamento de Estatstica, UFPB
Centro de Informtica, UFPE
15 de abril de 2009
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Estrutura da Apresentao
1 Motivao2 Estimao de Densidades pelo Mtodo Kernel
(i) Caso Univariado(ii) Caso Multivariado
3 Anlise Discriminante Kernel4 Experimentos5 Concluses
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Kernel (1)
NO o ncleo celular
NO o ncleo de um sistema operacional
NO o ncleo/espao nulo de uma matriz A : {x : Ax = 0}
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Kernel (2)
Uma funo K : Rp R tal queK(x) 0Rp
K(x)dx = 1K simtrica em torno de 0
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Motivao
Na metodologia clssica, faz-se alguma suposio sobre a forma funcionalparamtrica dos dados
Com uma forma paramtrica imposta, tudo que resta estimar osparmetros atravs dos dados (Mxima verossimilhana, por exemplo)
Muitas vezes, a suposio acerca da forma funcional paramtrica pode sermuito restritiva ou, em alguns casos, inadequada
Abordagens no-paramtricas permitem-nos lidar com um nmero maiorde situaes
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Estimao de Densidades pelo Mtodo Kernel
A funo densidade de probabilidade um conceito fundamental emestatstica
Uma varivel aleatria X com funo de distribuio F ditaabsolutamente contnua se existir uma funo no negativa f tal queF (x) = P (X x) = x f(t)dt, x R. Neste caso, dizemos que f afuno densidade de probabilidade de X e deve satisfazer
+ f(x)dx = 1
Especificar a funo densidade de X nos fornece uma descrio natural dasua distribuio, e permite que probabilidades associadas a X possam serencontradas atravs da relao
P (a < X < b) =
ba
f(x)dx, para todo a < b.
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Nosso foco: estimao de funes densidade atravs do mtodo kernel
Outros tipos de estimadores no-paramtricos de funes densidadeincluem: histogramas, polgonos de frequncia, splines, estimadoresbaseados em sries ortogonais e estimadores baseados em verossimilhanapenalizada (Silverman 1986; Scott 1992; Simonoff 1996)
O estimador kernel pode ser pensado como uma generalizao dohistograma
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Histogramas
Mtodo no-paramtrico mais antigo de estimao de densidades
Dada uma origem x0 e um comprimento de intervalo h, definimos osretngulos do histograma como sendo os intervalos[x0 + (r 1)h, x0 + rh) para valores inteiros positivos e negativos de rEmpiricamente a idia e contar o nmero de observaes que estocontidas em cada intervalo
Sem perda de generalidade, seja o intervalo [h/2, h/2). A probabilidadede uma observao pertencer ao intervalo [h/2, h/2) dada porP (X [h/2, h/2)) = h/2h/2 f(x)dx, onde f a densidade de XUma aproximao natural para a probabilidade acima P (X [h/2, h/2)) 1
n#{Xi [h/2, h/2)}
Dessa forma, uma estimativa para f seria
f(x) =1
nh#{Xi [h/2, h/2)}, x [h/2, h/2)
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Este estimador no contnuo e depende fortemente da escolha de h,conhecido como parmetro de suavizao
Variando o valor de h obtemos diferentes formas de fh(x). Nos extremos,digamos, quando h 0, temos uma representao muito ruidosa dosdados. Na situao oposta, quando h, temos uma representaomuito suave dos dados
A idia do histograma serve como base para um estimador de densidadesmais geral conhecido como estimador naive (Silverman 1986). Seja Xuma v.a. com densidade f . Ento,
f(x) = limh0
1
2hP (x h < X < x+ h)
Para h fixo, podemos estimar P (x h < X < x+ h) pela proporo deobservaes da amostra pertencentes ao intervalo (x h, x+ h). Dessemodo, um estimador natural de f , escolhendo h pequeno,
f(x) =1
2nh#{Xi (x h, x+ h)}
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Para expressar este estimador de forma mais clara, seja a funo peso w:
w(x) =
{12
se |x| < 10 caso contrrio.
(1)
Ento, fcil ver que uma estimativa para f neste caso dada por
f(x) =1
n
ni=1
1
hw
(xXi
h
)(2)
A partir de (1) podemos notar que o estimador (2) construdocolocando-se um retngulo de largura 2h e altura (2nh)1 em cadaobservao e ento somando para obter a estimativa fNo difcil notar que f no uma funo contnua e tem derivada nulaem todos os pontos exceto nos pontos de salto X hO estimador de densidades baseado em uma funo kernel obtidosubstituindo a funo peso w por uma funo no-negativa k, denominadafuno kernel, satisfazendo a condio
K(x)dx = 1
Usualmente, mas no sempre, K ser uma funo densidade deprobabilidade simtrica (Por exemplo, a funo densidade de probabilidadenormal)
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Estimao de Densidades Univaridas pelo Mtodo Kernel
No caso univariado o estimador kernel para uma amostra aleatriaX1, . . . , Xn retirada de uma distribuio com densidade comum f , podeser definido como
f(x;h) =1
nh
ni=1
K
(xXi
h
)=
1
n
ni=1
Kh (xXi) , (3)
onde h o parmetro de suavizao, positivo e no-aleatrio, e K afuno kernel, no-negativa, satisfazendo a condio
+ K(x)dx = 1
A relao entre K e Kh dada por Kh(t) = h1K(h1t)
Em cada ponto, uma funo kernel dimensionada Kh com massa deprobabilidade n1 colocada. Estas so ento somadas para fornecer acurva composta
A escolha da funo kernel no crucial para a performance do mtodo, e mais razovel escolher um kernel que auxilie na eficincia computacional(Silverman 1986; Epanechnikov 1969)
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Tabela: Funes kernel comumente utilizadas com dados univariados
Funo kernel Forma analtica, K(x)
Retangular 12para |x| < 1, 0 caso contrrio
Triangular 1 |x| para |x| < 1, 0 caso contrrio
Biweight 1516(1 x2)2 para |x| < 1, 0 caso contrrio
Normal 12pi
exp(x2
2
)Epanechnikov 3
4
(1 x2/5)/5 para |x| < 5, 0 caso contrrio
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Figura: Estimativa da densidade univariada pelo mtodo kernel. Linha slida:densidade estimada; Linhas tracejadas: funes kernel individuais. A amostra composta pelos valores X1 = 1.0, X2 = 0.8, X3 = 0.6, X4 = 0.5, X5 = 1.2.Funo kernel: gaussiana
2 1 0 1 2
0.0
0.1
0.2
0.3
0.4
0.5
0.6
x
dens
idad
e es
timad
a
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Estimao de Densidades Multivaridas pelo Mtodo Kernel
A extenso para dados multivariados direta, com o estimador dedensidades p-dimensional, para uma amostra aleatria X 1, X 2, . . . , X nretirada de uma densidade comum f , definido por
f(x) = 1nhpn
i=1
K
(1
h(x X i)
), (4)
onde x = (x1, x2, . . . , xp) e X i = (Xi1, Xi2, . . . , Xip), i = 1, 2, . . . , nA funo kernel multivariada K(x) agora uma funo definida no espaop-dimensional, satisfazendo
RpK(x)dx = 1
Usualmente K ser uma funo densidade de probabilidade unimodalradialmente simtrica
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Exemplos de funes kernel multivariadas so a distribuio normal padromultivariada
K(x) = (2pi)p/2 exp(12xx),
e a funo kernel Bartlett-Epanechnikov
K(x) ={
(1xx)(p+2)2cp para |x| < 10 caso contrrio,
onde
cp =pip/2
((p/2) + 1)
o volume de uma esfera unitria p-dimensional
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
O uso de um nico parmetro de suavizao em (4) implica que a funokernel colocada em cada ponto dimensionada igualmente em todas asdirees e isso pode ser inadequado em muitas situaes
Uma forma da estimativa da funo de densidade de probabilidadecomumente utilizada a soma do produto de funes kernel (sem,contudo, a implicao de independncia entre as variveis)
f(x) = 1n 1h1 hpn
i=1
pj=1
Kj
(xj Xij
hj
), (5)
onde existem diferentes parmetros de suavizao associados com cadavarivel. Pode-se assumir algum kernel univariado para os Kj ,j = 1, . . . , p. Usualmente, a mesma forma assumida para todos os Kj .
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Uma forma geral para o estimador de densidades multivariado, para umaamostra aleatria X 1, X 2, . . . , X n, retirada de uma densidade comum f , dada por
f(x) = f(x;H) = 1nn
i=1
KH(x Xi), (6)onde KH = |H|1/2K(H1/2x) a funo kernel dimensionada e H uma matrix no-aleatria, simtrica, positiva-definida, denominada matrizsuavizao
A idia bsica do caso univariado, de colocar uma funo kernel commassa de probabilidade n1, tambm vlida no caso multivariado
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Figura: Estimativa da densidade bivariada pelo mtodo kernel. Linha slida: curvas denvel da densidade estimada; Linhas tracejadas: curvas de nvel das funes kernelindividuais; Amostra: X 1 = (7, 3), X 2 = (2, 4), X 3 = (4, 4), X 4 = (5, 2),X 5 = (5.5, 6.5); Funo kernel: gaussiana; Matriz de suavizao: H =
[1 0.7
0.7 1
]
x
y
0 2 4 6 8 10
02
46
810
x
y
0 2 4 6 8 10
02
46
810
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Escolha do Parmetro de Suavizao
O critrio de erro mais amplamente utilizado nesta rea de pesquisa o(Erro Quadrtico Integrado Mdio) (EQIM) (Rosenblatt 1956), definidocomo
EQIM(f(;H)) = E{
Rp
[f(x;H) f(x)]2dx}
(7)
Nosso objetivo encontrar H tal que o EQIM seja minimizado, ou seja,
HEQIM = arg minHH
EQIM(f(;H)), (8)
onde H o espao das matrizes simtricas, positivas-definidas dedimenso (p p)Contudo, o EQIM apresenta forma fechada apenas se f uma mistura dedistribuies normais e K a funo kernel normal, e dessa forma,encontrar HEQIM , em geral, extremamente difcil(Wand and Jones 1995)
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
O Erro Quadrtico Integrado Mdio Assinttico (EQIMA) umaaproximao assinttica do EQIM. Uma expresso para o EQIMA,derivada por (Wand and Jones 1995),
EQIMA(f(;H)) = 1nR(K)|H|1/2 + 1
42(K)
2
Rp
tr2(HD2f(x))dx,(9)
onde R(v) =Rp
v(x)2 para alguma funo integrvel quadrada v;2(K)Ip = Rp
xxK(x), com 2(K)
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
A expresso (10) chamada de seletor do parmetro de suavizao
Existem diversas metodologias que podem ser utilizadas para selecionar oparmetro de suavizao atravs de (10), dentre as quais, um mtodoconhecido como plug-in e o mtodo de mnimos quadrados por validaocruzada (LSCV, sigla em ingls)
Um estudo detalhado sobre mtodos de seleo do parmatro desuavizao pode ser encontrado em (Duong 2004)
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Anlise Discriminante No-paramtrica
De acordo com a regra de Bayes, ns alocamos uma observao para aclasse com maior probabilidade a posteriori:
x alocado para a classe j se j = arg maxj{1,...,J}pijfj(x).As probabilidades a priori pij , quando desconhecidas, podem ser estimadasusando pij = nj/n, j = 1, . . . , J , com
Jj=1 nj = n
Na metodologia paramtrica so feitas suposies sobre as densidades fj .
Usualmente, supe-se que os dados seguem distribuio normal,entretanto, esta suposio pode ser muito restritiva ou at mesmoinadequada
Na anlise discriminante no-paramtrica ns relaxamos essa suposiopara, dessa forma, poder lidar com casos mais complexos
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
2 0 2 4
2
02
4
x
y
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
5 0 5 10
5
05
x
y
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
A abordagem kernel para anlise discriminante estimar a densidade fj decada classe j e alocar uma observao de acordo com a regra:
x alocado para a classe j se j = arg maxj{1,...,J} pij fj(x),onde fj(x) a estimativa da densidade pelo mtodo kernel correspondentea j-sima classe
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
2 0 2 4
2
02
4
x
y
25
25
50
50 75
75
25
25
50
50
75
75
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
5 0 5 10
5
05
x
y
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Suporte Computacional: R
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Gratuito (disponvel em http://www.R-project.org)
Cdigo aberto
ColaborativoCentenas de pacotes implementados
AER: Applied Econometrics with RAMORE: A MORE flexibly neural networks packageAdMit: Adaptive Mixture of Student-t distributionsarules: Mining Association Rules and Frequent Itemsetsanapuce: Tools for microarray data analysisbetareg: Beta Regressionboot: Bootstrap R FunctionsBayesTree: Bayesian Methods for Tree Based Modelsclass: Functions for ClassificationclusterGeneration: Random cluster generation (with specified degree ofseparation)experiment: R package for designing and analyzing randomizedexperimentsFactoMiner: Factor Analysis and Data Mining with Rforeign: Read Data Stored by Minitab, S, SAS, SPSS, Stata, Systat,dBase, ...geoR: Analysis of geostatistical data
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
HiddenMarkov: Hidden Markov Models
intervals: Tools for working with points and intervals
JGR: Java Gui for R
kernlab: Kernel-based Machine Learning Lab
ks: Kernel density estimate for multivariate data
lodplot: Plot a genome scan
mcmc: Markov Chain Monte Carlo
nnet: Feed-forward Neural Networks and Multinomial Log-Linear Models
outliers: Tests for outliers
polspline: Polynomial spline routines
qcc: Quality Control Charts
ROCR: Visualizing the performance of scoring classifiers
survival: Survival analysis, including penalised likelihood
tree: Classification and regression trees
urca: Unit root and cointegration tests for time series data
VaR: Value at Risk estimation
e a lista cresce a cada dia...
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
ks: Kernel density estimate for multivariate data
> ## bivariate example
> data(unicef)
> H.scv fhat plot(fhat, drawpoints=TRUE, drawlabels=FALSE, col=3, lwd=2)
50 100 150 200 250 300
4045
5055
6065
70
Under5
Ave
life
exp
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
> plot(fhat, display="persp", border=NA, col="grey96",
+ shade=0.75)
Under5
Ave life exp
Density function
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
> plot(fhat, display="image", col=rev(heat.colors(100)))
100 0 100 200 300 400
3040
5060
7080
Under5
Ave
life
exp
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Uma funo particularmente til do pacote ks a rmvnorm.mixt com a qualpodemos gerar dados oriundos de misturas de distribuies gaussianasmultivariadas.> mus Sigmas props x plot(x, xlab = "x", ylab = "y")
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
2 1 0 1 2
4
3
2
1
01
2
x
y
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
> mus Sigmas props x plot(x, xlab = "x", ylab = "y")
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
3 2 1 0 1 2 3
01
23
x
y
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Experimentos Numricos
Foram gerados dados simulando problemas com duas classes em seiscenrios distintos
Amostras de treinamento de tamanhos 50, 100, 500 e 1000, gerados apartir de distribuies normais ou de misturas de distribuies normais
Amostras de teste independentes, fixas, de tamanho 1000
1000 rplicas de Monte Carlo
Foram comparados os mtodos discriminante linear, quadrtico e kernel
Mtrica de comparao: taxa de erro no conjunto de teste
Todos os resultados foram obtidos atravs da linguagem R
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Voltando...
Cenrios Distribuio
A 1 : f1 N
([1
1
];
[49
1445
1445
49
]); 2 : f2 N
([1
1
];
[49
0
0 49
])
B 1 : f1 N
([1
1
];
[23
15
15
13
]); 2 : f2 N
([1
12
];
[23
15
15
13
])
C 1 : f1 N
([112
];
[23
15
15
49
]); 2 : f2 N
([1
12
];
[23
15
15
49
])
D1 : f1
12
N
([32
32
];
[45
12
12
45
])+ 1
2N
([1212
];
[45
12
12
45
]);
2 : f2 12
N
([3232
];
[45
12
12
45
])+ 1
2N
([12
12
];
[45
12
12
45
])
E1 : f1
12
N
([320
];
[112
14
14
1
])+ 1
2N
([320
];
[112
14
14
1
]);
2 : f2 N
([0
0
];
[49
15
15
49
])
F1 : f1
12
N
([320
];
[210
14
14
310
])+ 1
2N
([320
];
[310
14
14
310
]);
2 : f2 N
([0
0
];
[45
25
25
1
])
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
A
X1
X 2
3 2 1 0 1 2 3
3
2
1
01
23
B
X1
X 2
3 2 1 0 1 2 3
3
2
1
01
23
C
X1
X 2
3 2 1 0 1 2 3
3
2
1
01
23
D
X1
X 2
3 2 1 0 1 2 3
3
2
1
01
23
E
X1
X 2
3 2 1 0 1 2 3
3
2
1
01
23
F
X1X 2
3 2 1 0 1 2 3
3
2
1
01
23
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
3 2 1 0 1 2 3
3
2
1
01
23
4
X1
X 2
12
6 4 2 0 2 4
4
20
24
6X1
X 2
12
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Tabela: Resultados para os cenrios A, B e C
Cenrio Mtodo Estatsticas n = 50 n = 100 n = 500 n = 1000
A
LDAMdia 0,6233 0,5664 0,5033 0,5039
D. P. 0,3017 0,2440 0,1081 0,0717
QDAMdia 0,3746 0,3381 0,3117 0,3025
D. P. 0,1790 0,0926 0,0451 0,0206
KDAMdia 1,8073 0,6713 0,3413 0,3244
D. P. 3,6037 1,0796 0,0962 0,0655
B
LDAMdia 1,0867 0,9642 0,9050 0,9088
D. P. 0,2814 0,1514 0,0736 0,0706
QDAMdia 1,3149 1,0702 0,9087 0,9052
D. P. 0,4757 0,2514 0,0746 0,0687
KDAMdia 1,5593 1,2551 0,9925 0,9410
D. P. 0,6088 0,3606 0,1576 0,1185
C
LDAMdia 4,8170 4,6447 4,5223 4,5146
D. P. 0,4767 0,3727 0,2348 0,1913
QDAMdia 4,9875 4,7300 4,5377 4,5195
D. P. 0,6089 0,4236 0,2559 0,2101
KDAMdia 2,5351 2,2039 1,8838 1,8341
D. P. 1,0339 0,7230 0,3798 0,2880
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Tabela: Resultados para os cenrios D, E e F
Cenrio Mtodo Estatsticas n = 50 n = 100 n = 500 n = 1000
D
LDAMdia 43.3035 44.5808 46.3690 46.6073
D. P. 2.6130 2.0645 0.5990 0.3108
QDAMdia 43.1092 44.0681 46.0483 46.4462
D. P. 2.6529 1.9639 0.7543 0.4151
KDAMdia 24.7502 19.9339 16.3670 16.1180
D. P. 6.4371 3.3978 0.6678 0.5049
E
LDAMdia 47.8123 48.3086 49.2980 49.5784
D. P. 3.2952 2.4899 1.4873 1.2574
QDAMdia 12.3440 10.0298 7.9060 7.7968
D. P. 4.0999 2.4674 0.6965 0.4928
KDAMdia 10.4084 7.5744 5.9294 5.9421
D. P. 3.8523 2.0576 0.5980 0.4642
F
LDAMdia 48.8693 49.1778 49.6406 49.6833
D. P. 2.4543 1.9858 1.1794 1.0829
QDAMdia 23.3331 21.6190 20.0978 19.8070
D. P. 4.6566 3.7946 2.1063 1.6127
KDAMdia 17.8189 15.4789 13.5814 13.1674
D. P. 2.8313 1.5302 0.5391 0.3796
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Concluses
Desempenho superior do mtodo kernel em situaes complexas (cenriosD, E e F)
Desempenho similar aos mtodos linear e quadrtico em situaes debaixa complexidade (cenrios A, B e C)
Teoria bastante desenvolvida e consolidada
Implementaes em linguagem R
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo Motivao Estimao de Densidades Anlise Discriminante Experimentos Concluses Referncias
Referncias Bibliogrficas
Duong, T. (2004).Bandwidth selectors for multivariate kernel density estimation.Ph. D. thesis, University of Western Australia, School of Mathematics and Statistics.
Epanechnikov, V. A. (1969).Non-parametric estimation of a multivariate probability density.Theory of Probability and its Applications 14, 153158.
Rosenblatt, M. (1956).Remarks on some nonparametrics estimates of a density function.The Annals of Mathematical Statistics. 27, 832837.
Scott, D. W. (1992).Multivariate Density Estimation: Theory, Practice, and Visualization.New York: John Wiley & Sons.
Silverman, B. W. (1986).Density Estimation for Statistics and Data Analysis.London: Chapman & Hall.
Simonoff, J. S. (1996).Smoothing Methods in Statistics.New York: Springer-Verlag.
Wand, M. P. and M. C. Jones (1995).Kernel Smoothing.London: Chapman & Hall.
Ferreira, M. R. P. DE - UFPB / CIn - UFPE
Mtodo Kernel: Estimao de Densidades e Classificao de Padres
Introduo
Motivao
Estimao de Densidades
Anlise Discriminante
Experimentos
Concluses
Referncias