Upload
vunhi
View
217
Download
0
Embed Size (px)
Citation preview
Análise de Correspondência Múltipla em Dados
Meteorológicos na Região de Belém
Hugo S. Moreira, Pedro H. A. Veríssimo, Noemy P. de Souza,
Valquíria G. Macedo, Brígida R. P. da Rocha Universidade Federal do Pará – Faculdade de Engenharia Elétrica
66075-110, Campus do Guamá, Belém, PA E-mail: [email protected], verí[email protected], [email protected],
[email protected], [email protected]
Palavras – Chave: Métodos Estocásticos e Estatísticos; Análise de Correspondência Múltipla; Campo
Elétrico.
Resumo: A dinâmica da atmosfera é evidentemente bastante complexa, pois muitos são os processos
físicos de macro e micro escalas e as variáveis meteorológicas envolvidos nos fenômenos
atmosféricos. As tempestades com descargas elétricas destacam-se, dentre estes fenômenos, pelas
consequências danosas causadas aos seres humanos, direta ou indiretamente.
Uma análise rápida da associação do campo elétrico com precipitação de chuva, vento,
temperatura e pressão pode ser feita utilizando-se o método de Análise de Correspondência Múltipla
(ACM), que permite visualizar graficamente o grau de associação entre um grupo de variáveis, tendo
como base uma tabela de contingência que possui dados referentes às ocorrências de cada fenômeno
e a relação entre as linhas e colunas da mesma.
1 Introdução:
A Análise de Correspondência (AC) é uma técnica de análise de dados usada para analisar duas ou
mais entradas em forma de tabelas, considerando que há alguma correspondência entre as linhas e as
colunas [1]. O objetivo da AC é obter um gráfico em que esteja representada a relação entre as
entradas de acordo com a disposição das mesmas no gráfico e as distâncias entre si. Essa
representação é gerada a partir de uma tabela de contingência [2].
A partir desta técnica é possível notar com maior facilidade a disposição e as relações entre
subdivisões da entrada de linha e da entrada de coluna, e se tal relação existe ou não. É também
possível simplificar a análise de dados complexos, que sem tal técnica seria muito mais trabalhoso
obter as mesmas conclusões.
É possível utilizar a AC de duas maneiras diferentes, pela análise simples (ACS) e pela múltipla
(ACM). A única diferença entre ambas consiste no número de variáveis que podem ser analisadas.
Enquanto a ACS analisa apenas duas variáveis, a ACM consegue analisar mais de duas variáveis ao
mesmo tempo.
2 Metodologia:
O objetivo principal deste trabalho foi correlacionar dados reais de descargas elétricas atmosféricas
e dados reais de índice pluviométrico, vento, temperatura e pressão cedidos pelo DTCEA-PA e
INMET, na elaboração de um estudo preliminar visando ao desenvolvimento de um sistema de
previsão de descargas elétricas atmosféricas a partir da observação da variação das grandezas acima
citadas, utilizando técnicas de análise exploratória de dados.
Foi realizada a Análise de Correspondência Múltipla nos dados obtidos no dia 24 de Junho de 2011
da região de Belém – PA, considerando o cruzamento de campo elétrico, subdividido em três
categorias (C1 entre 0 e 3 kV/m, C2 entre 3 e 6 kV/m e C3 entre 6 e 15 kV/m), com precipitação,
temperatura, pressão e vento, sendo estas subdivididas em duas categorias cada com suas respectivas
siglas, de acordo com a Tabela 1.
139
ISSN 2317-3297
Precipitação (mm) Temperatura (°C) Pressão (hPa) Vento (m/s)
Sim
(PS)
Não
(PN)
<26
(T<)
≥26
(T>)
<1009
(P<)
≥1009
(P>)
Sim
(VS)
Não
(VN)
Campo Elétrico
(kV/m)
C1 0 3 18 13 24 7 6 25 27 4 124
C2 3 6 5 0 1 4 5 0 5 0 20
C3 6 15 8 0 6 2 8 0 8 0 32
31 13 31 13 19 25 40 4 176
Tabela 1 – Tabela de Contingência.
Através do software MATLAB, que é um software de alto desempenho, foi desenvolvido um
programa para Análise de Correspondência, o qual converteu a matriz de dados não negativos em um
tipo particular de representação gráfica em que as linhas e colunas da matriz são simultaneamente
representadas em dimensão reduzida, isto é, por pontos no gráfico. Este método permite estudar as
relações e semelhanças existentes entre as categorias de linhas e entre as categorias de colunas da
tabela de contingência.
Figura 1 – Gráfico de ACM entre Campo Elétrico, Precipitação, Temperatura, Pressão e Vento.
3 Conclusões: De acordo com a Figura 1, nota-se que os pontos PN (sem precipitação), P> (pressão maior do que
1009hPa), e VN (sem vento) estão situados nas mesmas coordenadas. Isso implica que nesse dia
(24/06/2011) a tendência de ocorrência de uma dessas variáveis se apresentou junto com as
ocorrências das outras duas.
Pode-se observar também certa proximidade de C1 com PN, P>, VN e T<, assim como a
proximidade de C2 e C3 com PS, P<, VS e T>. Portanto, neste dia, houve relação de menor variação
do campo elétrico durante as seguintes características: sem precipitação, pressão maior ou igual que
1009 hPa, sem vento, e temperatura menor que 26ºC e maior variação do campo elétrico durante as
seguintes características: com precipitação, pressão menor que 1009 hPa, com vento, e temperatura
maior ou igual que 26ºC.
140
ISSN 2317-3297
4 Agradecimentos:
Ao INMET por disponibilizar os dados de precipitação utilizados neste trabalho.
Ao CENSIPAM / SIPAM, que mediante parceria com a UFPA, cede os dados do DTCEA-PA e
espaço em suas instalações para o desenvolvimento desta e de outras pesquisas.
Os bolsistas Hugo S. Moreira, Pedro Henrique A. Veríssimo e Noemy P. de Souza agradecem ao
Conselho Nacional de Desenvolvimento Científico e Tecnológico pelo apoio financeiro recebido em
forma de bolsa de Iniciação Científica.
5 Referências:
[1] A. B. C. Czermainski, “Análise de Correspondência”, Seminário, Piracicaba-SP, Julho, 2004,
disponível em <http://www.lce.esalq.usp.br/tadeu/anabeatriz.pdf>, acessado em 11/04/2012.
[2] S. A. Mingoti, “Análise de Dados Através de Métodos de Estatística Multivariada: Uma
Abordagem Aplicada”, Editora UFMG 2007.
141
ISSN 2317-3297