12
AGRENER GD 2015 10º Congresso sobre Geração Distribuída e Energia no Meio Rural 11 a 13 de novembro de 2015 Universidade de São Paulo – USP – São Paulo PREVISÃO DO CONSUMO DE ENERGIA ELÉTRICA NA CIDADE DE SALVADOR BA UTILIZANDO REGRESSÃO LINEAR Helder Henri Silva e Caldas 1 , Dr. Walter Accioly Costa Porto 2 1 Instituto Federal de Educação, Ciência e Tecnologia da Bahia IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015 2 Instituto Federal de Educação, Ciência e Tecnologia da Bahia IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015 [email protected] Resumo Este trabalho apresenta como objeto de estudo um modelo para prognóstico do consumo por energia elétrica em Salvador - BA, sob forma de função linear, a partir de dados estatísticos temporais coletados que induzem variações consideráveis na demanda. O principal objetivo é prover as empresas que atuam nas áreas de interesse, com uma ferramenta confiável de previsão do consumo, garantindo assim, o nível de excelência e dinamismo no atendimento de cargas futuras. Utilizou-se uma metodologia para a mensuração destes, que levou em conta dados relevantes que influenciam o valor da demanda por eletricidade como: A temperatura compensada média mensal, o índice pluviométrico e o número de clientes da COELBA (Companhia de Eletricidade do Estado da Bahia). Para o tratamento estatístico de dados, contou-se com a Regressão Linear Múltipla, a partir do método dos mínimos quadrados para determinação dos coeficientes de regressão, sendo analisado também seu grau de confiabilidade. Os resultados demonstram, de forma conclusiva, a montagem de uma equação linear que descreve a demanda mensal por eletricidade no município, trazendo o perfil de contribuição de cada variável, em especial a temperatura, que obteve peso maior na modelagem. Palavras-chave: Consumo, demanda, eletricidade, previsão, regressão.

PREVISÃO DO CONSUMO DE ENERGIA ELÉTRICA NA … · Tabela 2 - Análise de Variação da Regressão Múltipla Sem Intercepto Fonte de Variação Graus de Liberdade Soma Quadrática

Embed Size (px)

Citation preview

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

PREVISÃO DO CONSUMO DE ENERGIA ELÉTRICA NA CIDADE DE

SALVADOR – BA UTILIZANDO REGRESSÃO LINEAR

Helder Henri Silva e Caldas1, Dr. Walter Accioly Costa Porto2

1 Instituto Federal de Educação, Ciência e Tecnologia da Bahia – IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015

2 Instituto Federal de Educação, Ciência e Tecnologia da Bahia – IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015

[email protected]

Resumo

Este trabalho apresenta como objeto de estudo um modelo para prognóstico do consumo

por energia elétrica em Salvador - BA, sob forma de função linear, a partir de dados

estatísticos temporais coletados que induzem variações consideráveis na demanda. O

principal objetivo é prover as empresas que atuam nas áreas de interesse, com uma

ferramenta confiável de previsão do consumo, garantindo assim, o nível de excelência e

dinamismo no atendimento de cargas futuras. Utilizou-se uma metodologia para a

mensuração destes, que levou em conta dados relevantes que influenciam o valor da

demanda por eletricidade como: A temperatura compensada média mensal, o índice

pluviométrico e o número de clientes da COELBA (Companhia de Eletricidade do Estado da

Bahia). Para o tratamento estatístico de dados, contou-se com a Regressão Linear Múltipla,

a partir do método dos mínimos quadrados para determinação dos coeficientes de

regressão, sendo analisado também seu grau de confiabilidade. Os resultados demonstram,

de forma conclusiva, a montagem de uma equação linear que descreve a demanda mensal

por eletricidade no município, trazendo o perfil de contribuição de cada variável, em especial

a temperatura, que obteve peso maior na modelagem.

Palavras-chave: Consumo, demanda, eletricidade, previsão, regressão.

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

Abstract

This paper has as object of study a behavior of consumption for electricity in Salvador - BA,

in the form of linear function, from temporal statistical data collected that induce considerable

variations in demand. The main objective is to provide for companies that are operating in

areas of system power, with a reliable tool of consumption forecast, thus ensuring the level of

excellence and dynamism in supplying future charge in distribution system. Was used a

methodology for measuring , which took into account relevant data that have influence on the

value of demand for electricity as: Compensated average monthly temperature, rainfall index

and number of COELBA’s customers (State Electricity Company Bahia). For the statistical

treatment of data, counted with the Multiple Linear Regression from the least squares

method to determine the regression coefficients also being analyzed their degree of

reliability. The results evidence, in a conclusively way, the assembly of a linear equation

describing the monthly demand for electricity in the city, bringing the contribution of each

variable profile, especially the temperature, which obtained the highest weight in modeling.

Keywords: Consumption, demand, electricity, forecast, linear regression.

1. INTRODUÇÃO

A eletricidade é, sem dúvida, um dos bens essenciais e agente facilitador à vida

moderna. Com isso, se tornou a maneira mais eficaz de obter, por meio de transformações,

outras formas de energia como a luminosa (luz), térmica (calor) e motriz (força). Ela está

presente em praticamente todos os momentos do nosso dia a dia, quando acendemos uma

lâmpada ou guardamos um alimento na geladeira para conservá-lo, entre tantos outros.

Há sempre um risco associado ao desequilíbrio entre oferta e demanda por energia

elétrica, pois existem vários fatores externos, impossíveis de controlar como as de causas

climáticas (temperatura, precipitação, umidade e frio) que alteram de forma significativa as

necessidades no consumo de energia elétrica.

Santos e Caldas (2012) frisa a importância de se elaborar um bom planejamento de

expansão da capacidade produtiva e da infraestrutura necessária de geração, transmissão e

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

distribuição, pois, demonstra-se vital para o desenvolvimento sólido do país. E está

intimamente ligada também à escassez e à necessidade de geração.

O presente trabalho visa identificar fatores importantes que contribuem para o

aumento ou diminuição do consumo, como a precipitação, temperatura e o número de

clientes, estudando como tais variações quantitativas afetam a demanda por energia

elétrica.

2. REGRESSÃO LINEAR

Pretende-se estabelecer uma equação matemática que represente o fenômeno em

questão. O comportamento pode ser apresentado de várias formas (linear, quadrático,

cúbico ou logarítmico). No presente estudo será considerado o modelo linear, pois é o mais

simples, e foi capaz, de maneira significativa, de justificar a relação entre as variáveis

envolvidas. Logo, pode-se considerar que a relação da resposta às variáveis de predição

são funções lineares e devendo surgir uma reta estimada para o modelo final. Então um

passo crucial é a estimativa dos parâmetros, os chamados coeficientes de regressão.

3. REGRESSÃO LINEAR MÚLTIPLA

O modelo em questão deve levar em consideração mais de uma variável

independente. Por esta razão, será utilizado um modelo de regressão múltipla. Tratando-se

especificamente desta aplicação iremos considerar linear, logo, teremos uma regressão

linear múltipla.

Para Hair et al (2005), a regressão múltipla é uma técnica estatística que pode ser

usada para analisar a relação entre uma única variável dependente (critério) e várias

variáveis independentes (preditoras). O objetivo da análise de regressão linear múltipla é

usar as variáveis independentes cujos valores são conhecidos para prever o valor da

variável dependente selecionada pelo pesquisador.

Com base nesta relação matemática, a regressão apresenta uma explicação algébrica

para a modificação da variável dependente através das respectivas variações das variáveis

independentes. Devendo-se formular um método para previsão de algo que se deseja

controlar.

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

3.1 Resumo dos Resultados

No presente estudo, foram utilizados resultados oriundos das tabelas com

estatísticas de regressão geradas pelo programa Microsoft Excel® 2010. Conforme traz

Rencher e Schaalje (2005), são elas:

• R – Múltiplo: Deve apresentar o coeficiente de correlação dos intervalos do conjunto

de dados entre duas ou mais variáveis explicativas, determinando o poder de relação

entre essas duas propriedades;

• R – Quadrado: Deve apresentar o quadrado do coeficiente de correlação do

momento do produto de Pearson através do referido conjunto de dados;

• R – Quadrado Ajustado: Tem significado semelhante ao R – Quadrado, porém é

ajustado levando-se em consideração o número de variáveis independentes;

• Erro Padrão: É o desvio padrão do modelo, determinado pela raiz quadrada da

variância. Deve refletir a variação da precisão de acordo com o tamanho da amostra.

• Valor-P: Indica o grau de influência sobre a variável dependente;

• F-Significância: Determina a existência de uma relação linear entre a variável

resposta e o(s) regressor(es);

• Colinearidade: Define o grau de dependência entre variáveis independentes, como

uma pode ser determinada em função da outra.

4. METODOLOGIA

A partir da coleta de dados, foi utilizado o software Excel®, versão 2010, para

obtenção da equação do Modelo de Regressão Linear e os parâmetros para estimação da

qualidade da previsão do consumo de energia elétrica municipal.

Foram coletados os dados mensais do consumo de energia elétrica na cidade de

Salvador e seu respectivo número de clientes junto a COELBA. Os outros dados

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

meteorológicos, índice pluviométrico mensal e a temperatura compensada média mensal,

foram extraídos do INPE (Instituto Nacional de Pesquisas Espaciais).

O período de coleta de dados se deu de janeiro de 2010 a dezembro de 2014,

utilizando dados atuais, com uma amostra bastante significativa, 60 dados, para cada

variável dita independente. Para Hair et al (2005), uma amostra com nível mínimo estaria

em torno de cinco pra um, e o nível desejável está em torno de 20 dados para cada variável

independente, confirmando que a dimensão amostral é suficiente.

As primeiras variáveis explicadoras são o índice pluviométrico mensal no determinado

local de medição e a temperatura compensada média mensal. Foram utilizados os dados da

estação SALVADOR ONDINA - BA (OMM: 83229), colhidos em 17 de março de 2015.

A terceira variável explicativa é o número de clientes que a COELBA fornece energia.

É visível a dependência da quantidade de energia consumida ao universo de clientes a que

se destina, porém existem classes de consumidores que demandam uma maior quantidade,

e por isso mais significativos, do que outros clientes com potência instalada menor.

5. RESULTADOS

Foi verificada a qualidade da Regressão Linear Múltipla com as variáveis

independentes referidas anteriormente. Espera-se obter valores de coeficiente com um nível

de precisão maior considerando o intercepto nulo. Logo, como resultado da regressão tem-

se as tabelas abaixo extraídas do software Excel®:

Tabela 1 - Estatísticas da Regressão Múltipla Sem Intercepto

R múltiplo 0,999023816

R-Quadrado 0,998048586

R-quadrado

ajustado 0,980436255

Erro padrão 14,19188392

Observações 60

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

Tabela 2 - Análise de Variação da Regressão Múltipla Sem Intercepto

Fonte de Variação

Graus de

Liberdade

Soma

Quadrática

Média

Quadrática F0 F de significância

Regressão 3 5871609,136 1957203 9717,52 4,96994x10-76

Resíduo 57 11480,34545 201,4095

Total 60 5883089,482

Tabela 3 - Coeficientes da Regressão Múltipla Sem Intercepto

Coeficientes Erro padrão valor-P

Inferior

98,0% Superior 98,0%

Interseção 0 #N/D #N/D #N/D #N/D

Número de Clientes

(mil) 0,1388914 0,0294126 1,56 x10-05

0,068490 0,209292644

Precipitação Total

Mensal (mm) 0,0267864 0,0169127 0,01187 -0,013695 0,067268284

Temp. Compensada

Média (ºC) 6,5365518 1,1787053 7,87x10-7

3,715241 9,357862724

Tabela 4 - Matriz de Correlação da Regressão Múltipla Sem Intercepto

Número de

Clientes (mil)

Precipitação Total

Mensal (mm)

Temp. Compensada

Média (ºC)

Número de Clientes (mil) 1

Precipitação Total Mensal

(mm) -0,1118324 1

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

Temp. Compensada Média

Mensal (ºC) -0,187661788 -0,328670993 1

Apesar de ter-se obtido um R-Quadrado muito alto, não devemos considera-lo sozinho

para fins de atestado de qualidade da regressão, conforme analisa Gujatari e Porter (2008).

De forma empírica, não se pode avaliar a capacidade explicativa da modelagem apenas por

um grau de R-Quadrado maior ou menor. No entanto, o tamanho do R-Quadrado pode

servir como um indicador para avaliar em que medida a relação entre as variáveis pode ser

descrita por uma função linear. Para suprir esta deficiência, foram adotadas medidas

complementares de verificação e validação tendo em vista que os dados foram simulados

para atender a todos os pressupostos do Método dos Quadrados Ordinários.

A equação que deve representar a Regressão Linear Múltipla sem o intercepto é:

1 1 2 2 3 3

1 2 30,13889149 0,02678645 6,53655189 (1)

Y x x x

Y x x x

Sendo,

Y = Demanda Total Consumida (Giga Watts hora);

= Ponto de Interseção da equação estimado;

1x = Variável independente número de Clientes (mil);

1 = Regressor estimado referente ao número de clientes estimado;

2x = Variável independente precipitação total mensal (mm);

2 = Regressor estimado referente à precipitação total mensal estimada;

3x = Variável independente temperatura compensada média mensal (ºC);

3 = Regressor estimado referente à temperatura compensada média mensal estimada;

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

E a equação de previsão da demanda por eletricidade em Salvador pode ser descrita

a partir da equação abaixo:

( ) 0,13889149 ( ) 0,02678645 ( ) 6,53655189 (º )Consumo GWh Clientes mil Pluviometria mm Temperatura C

5.1 Erro Padrão

Tabela 5 - Erro Percentual do Modelo

Média do Consumo Mensal

(GWh)

Erro Padrão (GWh) Erro Percentual

312,62 14,19188392 4,54 %

Como apresentado na Tabela 5, o presente modelo traz um pequeno erro percentual.

Isto demonstra que os valores previstos para o consumo de energia na cidade de Salvador

podem distanciar-se apenas 4,54% de seu valor real, retratando um desvio mínimo frente ao

montante de fato consumido.

5.2 Intervalos de Confiança

A tabela 3 traz como resultado, com 98% de certeza, que as variáveis independentes estão

contidas nos seus respectivos intervalos de confiança.

5.3 Teste de Significância

Considerando cada variável dita explicativa, seus Valores-P podem ser verificados

como aceitáveis, comparando com o alfa=0,02 (98% de confiança), que é o nível de

significância definido no problema, então, conclui-se que os Valores-P são menores que alfa

para todas as variáveis analisadas, considerando a Tabela 3, portanto, tem influência

relevante sobre o Consumo de Energia Elétrica na cidade de Salvador.

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

5.4 Teste de Linearidade

O resultado estatístico F deve garantir um nível de linearidade ao problema, conforme

a Tabela 2. O teste F de significância para esta equação pode ser definido:

0

764,96994 9717,52 (210 )

SignificânciaF F

Logo, para a regressão múltipla, este teste indica que há uma relação linear forte entre

a variável resposta e os estimadores. Podendo ser comprovada também, conforme figura 1,

retirada dos resultados provenientes da regressão pelo software Excel®.

Figura 1 - Tendência Linear da Regressão Múltipla

5.5 Análise de Coeficientes

É importante observar a correspondência entre o sinal dos coeficientes e a relação

teoricamente esperada, em que medida os resultados oferecem evidências em favor das

hipóteses de trabalho. As hipóteses naturais são os coeficientes β1, β2 e β3, exercerem um

efeito positivo sobre o consumo.

A variável Número de Clientes assume valor aproximado de 0,139, significando que,

com o acréscimo de mil clientes na rede da COELBA, haverá um incremento de 0,139 GWh

no consumo, mantendo tudo o mais constante. A conclusão é reforçada pela estimativa do

0

200

400

0 20 40 60 80 100 120Co

nsu

mo

(GW

h)

Percentil da amostra

Probabilidade Normal da Equação

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

erro associada ao ponto. Novamente, trazendo o Valor-P, pode-se inferir que a

probabilidade de se estar errado ao rejeitar esta variável é mínima, da ordem de 51,56 10x .

Logo, há fortes evidências sugerindo que o efeito positivo teoricamente esperado de 1

sobre Y pode ser corroborado.

Já a segunda variável explicativa, Precipitação total mensal, assume valor 0,027.

Neste caso, com as demais variáveis constantes, podemos dizer que o aumento de uma

unidade em 2 produz um aumento de 0,027 GWh na variável dependente Y. O Valor-P

neste caso, (0,01187), é bem próximo ao valor de referência alfa=0,02 o que poderia indicar

certa probabilidade de ter significância baixa ao modelo. Porém a partir das demais análises

feitas, pode-se considera-la como uma variável explicativa importante.

Por fim, a variável Temperatura Compensada Média Mensal sugere um acréscimo de

6,536 GWh para cada variação unitária. Apresentando assim, uma forte relação com o

consumo como foi esperado já que a temperatura motiva maciçamente o aumento de cargas

de refrigeração no sistema elétrico, compondo papel crucial no modelo.

5.6 Teste de Resíduos

A análise de resíduos verifica se o modelo é apropriado. Como se trata de uma

regressão múltipla, os resíduos das variáveis devem ser analisados de forma separada para

indicar a qualidade. As figuras foram extraídas dos resultados do software Excel®.

Figura 2 - Resíduos do Número de Clientes da Regressão Múltipla

-50

0

50

950,00 1000,00 1050,00 1100,00Re

síd

uo

s

Número de Clientes (mil)

Número de Clientes (mil)

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

Figura 3 - Resíduos da Precipitação Total Mensal da Regressão Múltipla

Figura 4 - Resíduos da Temperatura Compensada Média Mensal da Regressão Múltipla

Os resíduos desta regressão apresentam-se como variáveis aleatórias, onde os

pontos são distribuídos em torno da reta que passa pela origem sem nenhum padrão

definido, conforme as figuras 2, 3 e 4, garantindo o critério da heteroscedasticidade.

6. CONCLUSÃO

Conjecturando os resultados anteriores, podemos deduzir que estes dados são

suficientes para mostrar que o modelo de Regressão Múltipla sem intercepto com três

variáveis preditoras contribui para a adequação de um ótimo modelo de previsão e

demonstrando-se sólido com o que é esperado, podendo prever o consumo municipal com

uma boa qualidade.

-100

0

100

0,00 200,00 400,00 600,00Re

síd

uo

s

Precipitação Total Mensal (mm)

Precipitação Total Mensal (mm)

-100

0

100

0,00 10,00 20,00 30,00Res

ídu

os

Temp. Compensada Média (ºC)

Temp. Compensada Média (ºC)

AGRENER GD 2015

10º Congresso sobre Geração Distribuída e Energia no Meio Rural

11 a 13 de novembro de 2015

Universidade de São Paulo – USP – São Paulo

Pode-se verificar também, que a equação do modelo atende todas as avaliações

necessárias e assim é traduzida como um conjunto de hipóteses para a estimação da

variável dependente. Então, o modelo de regressão linear múltipla fica como contribuição

necessária e importante para o planejamento energético da cidade de Salvador.

Por fim, este trabalho deve contribuir significativamente para o planejamento

energético municipal, oferecendo métodos matemáticos e utilizando pressupostos

estatísticos para a previsão. Assim as empresas do setor elétrico podem se antever a

acréscimos no consumo e dimensionar melhor as redes de distribuição para melhor atender

seus respectivos clientes.

7. REFERÊNCIAS BIBLIOGRÁFICAS

GUJARATI, DAMODAR N.; PORTER, DAWN C.. Econometria Básica. 5ª Edição, São

Paulo: McGraw-Hill, 2008.

HAIR JR., J.F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C.. Análise

Multivariada de Dados. 5ª Edição – Porto Alegre: Bookman, 2005.

RENCHER, C.ALVIM; SCHAALJE, G. BRUCE. Linear Models in Statistics. 2ª Edição.

John Wiley & Sons, Inc., 2008.

SANTOS, EUCYMARA F. NUNES; CALDAS, ALEXANDRE A. SILVA. Previsão do

Consumo de Energia Elétrica em Petrolina – PE. Revista Brasileira de Energia, Volume 18,

N. 01, p.129-141, 2012.