3
Análise de Correspondência Múltipla em Dados Meteorológicos na Região de Belém Hugo S. Moreira, Pedro H. A. Veríssimo, Noemy P. de Souza, Valquíria G. Macedo, Brígida R. P. da Rocha Universidade Federal do Pará Faculdade de Engenharia Elétrica 66075-110, Campus do Guamá, Belém, PA E-mail: [email protected], verí[email protected], [email protected], [email protected], [email protected] Palavras Chave: Métodos Estocásticos e Estatísticos; Análise de Correspondência Múltipla; Campo Elétrico. Resumo: A dinâmica da atmosfera é evidentemente bastante complexa, pois muitos são os processos físicos de macro e micro escalas e as variáveis meteorológicas envolvidos nos fenômenos atmosféricos. As tempestades com descargas elétricas destacam-se, dentre estes fenômenos, pelas consequências danosas causadas aos seres humanos, direta ou indiretamente. Uma análise rápida da associação do campo elétrico com precipitação de chuva, vento, temperatura e pressão pode ser feita utilizando-se o método de Análise de Correspondência Múltipla (ACM), que permite visualizar graficamente o grau de associação entre um grupo de variáveis, tendo como base uma tabela de contingência que possui dados referentes às ocorrências de cada fenômeno e a relação entre as linhas e colunas da mesma. 1 Introdução: A Análise de Correspondência (AC) é uma técnica de análise de dados usada para analisar duas ou mais entradas em forma de tabelas, considerando que há alguma correspondência entre as linhas e as colunas [1]. O objetivo da AC é obter um gráfico em que esteja representada a relação entre as entradas de acordo com a disposição das mesmas no gráfico e as distâncias entre si. Essa representação é gerada a partir de uma tabela de contingência [2]. A partir desta técnica é possível notar com maior facilidade a disposição e as relações entre subdivisões da entrada de linha e da entrada de coluna, e se tal relação existe ou não. É também possível simplificar a análise de dados complexos, que sem tal técnica seria muito mais trabalhoso obter as mesmas conclusões. É possível utilizar a AC de duas maneiras diferentes, pela análise simples (ACS) e pela múltipla (ACM). A única diferença entre ambas consiste no número de variáveis que podem ser analisadas. Enquanto a ACS analisa apenas duas variáveis, a ACM consegue analisar mais de duas variáveis ao mesmo tempo. 2 Metodologia: O objetivo principal deste trabalho foi correlacionar dados reais de descargas elétricas atmosféricas e dados reais de índice pluviométrico, vento, temperatura e pressão cedidos pelo DTCEA-PA e INMET, na elaboração de um estudo preliminar visando ao desenvolvimento de um sistema de previsão de descargas elétricas atmosféricas a partir da observação da variação das grandezas acima citadas, utilizando técnicas de análise exploratória de dados. Foi realizada a Análise de Correspondência Múltipla nos dados obtidos no dia 24 de Junho de 2011 da região de Belém PA, considerando o cruzamento de campo elétrico, subdividido em três categorias (C1 entre 0 e 3 kV/m, C2 entre 3 e 6 kV/m e C3 entre 6 e 15 kV/m), com precipitação, temperatura, pressão e vento, sendo estas subdivididas em duas categorias cada com suas respectivas siglas, de acordo com a Tabela 1. 139 ISSN 2317-3297

Análise de Correspondência Múltipla em Dados ... · Resumo: A dinâmica da atmosfera é evidentemente ... escalas e as variáveis meteorológicas envolvidos nos fenômenos

  • Upload
    vunhi

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Análise de Correspondência Múltipla em Dados

Meteorológicos na Região de Belém

Hugo S. Moreira, Pedro H. A. Veríssimo, Noemy P. de Souza,

Valquíria G. Macedo, Brígida R. P. da Rocha Universidade Federal do Pará – Faculdade de Engenharia Elétrica

66075-110, Campus do Guamá, Belém, PA E-mail: [email protected], verí[email protected], [email protected],

[email protected], [email protected]

Palavras – Chave: Métodos Estocásticos e Estatísticos; Análise de Correspondência Múltipla; Campo

Elétrico.

Resumo: A dinâmica da atmosfera é evidentemente bastante complexa, pois muitos são os processos

físicos de macro e micro escalas e as variáveis meteorológicas envolvidos nos fenômenos

atmosféricos. As tempestades com descargas elétricas destacam-se, dentre estes fenômenos, pelas

consequências danosas causadas aos seres humanos, direta ou indiretamente.

Uma análise rápida da associação do campo elétrico com precipitação de chuva, vento,

temperatura e pressão pode ser feita utilizando-se o método de Análise de Correspondência Múltipla

(ACM), que permite visualizar graficamente o grau de associação entre um grupo de variáveis, tendo

como base uma tabela de contingência que possui dados referentes às ocorrências de cada fenômeno

e a relação entre as linhas e colunas da mesma.

1 Introdução:

A Análise de Correspondência (AC) é uma técnica de análise de dados usada para analisar duas ou

mais entradas em forma de tabelas, considerando que há alguma correspondência entre as linhas e as

colunas [1]. O objetivo da AC é obter um gráfico em que esteja representada a relação entre as

entradas de acordo com a disposição das mesmas no gráfico e as distâncias entre si. Essa

representação é gerada a partir de uma tabela de contingência [2].

A partir desta técnica é possível notar com maior facilidade a disposição e as relações entre

subdivisões da entrada de linha e da entrada de coluna, e se tal relação existe ou não. É também

possível simplificar a análise de dados complexos, que sem tal técnica seria muito mais trabalhoso

obter as mesmas conclusões.

É possível utilizar a AC de duas maneiras diferentes, pela análise simples (ACS) e pela múltipla

(ACM). A única diferença entre ambas consiste no número de variáveis que podem ser analisadas.

Enquanto a ACS analisa apenas duas variáveis, a ACM consegue analisar mais de duas variáveis ao

mesmo tempo.

2 Metodologia:

O objetivo principal deste trabalho foi correlacionar dados reais de descargas elétricas atmosféricas

e dados reais de índice pluviométrico, vento, temperatura e pressão cedidos pelo DTCEA-PA e

INMET, na elaboração de um estudo preliminar visando ao desenvolvimento de um sistema de

previsão de descargas elétricas atmosféricas a partir da observação da variação das grandezas acima

citadas, utilizando técnicas de análise exploratória de dados.

Foi realizada a Análise de Correspondência Múltipla nos dados obtidos no dia 24 de Junho de 2011

da região de Belém – PA, considerando o cruzamento de campo elétrico, subdividido em três

categorias (C1 entre 0 e 3 kV/m, C2 entre 3 e 6 kV/m e C3 entre 6 e 15 kV/m), com precipitação,

temperatura, pressão e vento, sendo estas subdivididas em duas categorias cada com suas respectivas

siglas, de acordo com a Tabela 1.

139

ISSN 2317-3297

Precipitação (mm) Temperatura (°C) Pressão (hPa) Vento (m/s)

Sim

(PS)

Não

(PN)

<26

(T<)

≥26

(T>)

<1009

(P<)

≥1009

(P>)

Sim

(VS)

Não

(VN)

Campo Elétrico

(kV/m)

C1 0 3 18 13 24 7 6 25 27 4 124

C2 3 6 5 0 1 4 5 0 5 0 20

C3 6 15 8 0 6 2 8 0 8 0 32

31 13 31 13 19 25 40 4 176

Tabela 1 – Tabela de Contingência.

Através do software MATLAB, que é um software de alto desempenho, foi desenvolvido um

programa para Análise de Correspondência, o qual converteu a matriz de dados não negativos em um

tipo particular de representação gráfica em que as linhas e colunas da matriz são simultaneamente

representadas em dimensão reduzida, isto é, por pontos no gráfico. Este método permite estudar as

relações e semelhanças existentes entre as categorias de linhas e entre as categorias de colunas da

tabela de contingência.

Figura 1 – Gráfico de ACM entre Campo Elétrico, Precipitação, Temperatura, Pressão e Vento.

3 Conclusões: De acordo com a Figura 1, nota-se que os pontos PN (sem precipitação), P> (pressão maior do que

1009hPa), e VN (sem vento) estão situados nas mesmas coordenadas. Isso implica que nesse dia

(24/06/2011) a tendência de ocorrência de uma dessas variáveis se apresentou junto com as

ocorrências das outras duas.

Pode-se observar também certa proximidade de C1 com PN, P>, VN e T<, assim como a

proximidade de C2 e C3 com PS, P<, VS e T>. Portanto, neste dia, houve relação de menor variação

do campo elétrico durante as seguintes características: sem precipitação, pressão maior ou igual que

1009 hPa, sem vento, e temperatura menor que 26ºC e maior variação do campo elétrico durante as

seguintes características: com precipitação, pressão menor que 1009 hPa, com vento, e temperatura

maior ou igual que 26ºC.

140

ISSN 2317-3297

4 Agradecimentos:

Ao INMET por disponibilizar os dados de precipitação utilizados neste trabalho.

Ao CENSIPAM / SIPAM, que mediante parceria com a UFPA, cede os dados do DTCEA-PA e

espaço em suas instalações para o desenvolvimento desta e de outras pesquisas.

Os bolsistas Hugo S. Moreira, Pedro Henrique A. Veríssimo e Noemy P. de Souza agradecem ao

Conselho Nacional de Desenvolvimento Científico e Tecnológico pelo apoio financeiro recebido em

forma de bolsa de Iniciação Científica.

5 Referências:

[1] A. B. C. Czermainski, “Análise de Correspondência”, Seminário, Piracicaba-SP, Julho, 2004,

disponível em <http://www.lce.esalq.usp.br/tadeu/anabeatriz.pdf>, acessado em 11/04/2012.

[2] S. A. Mingoti, “Análise de Dados Através de Métodos de Estatística Multivariada: Uma

Abordagem Aplicada”, Editora UFMG 2007.

141

ISSN 2317-3297