ESCUELA POLITÉCNICA NACIONAL · Geo-procesamiento de información con coordenada UTM ..... 41 2.2.3.2. Generación de rutas de lectura ... 2.5.2. Simulación de saturación por capacidad

ESCUELA POLITÉCNICA NACIONAL

FACULTAD DE INGENIERÍA ELÉCTRICA Y

ELECTRÓNICA

PROYECCIÓN ESPACIAL DE LA DEMANDA ELÉCTRICA A

MEDIANO PLAZO EN EMPRESAS DE DISTRIBUCIÓN EN EL

ECUADOR

TESIS DE GRADO PREVIO A LA OBTENCIÓN DEL TÍTULO DE MAGÍSTER EN

INGENIERÍA ELÉCTRICA EN DISTRIBUCIÓN

RICARDO ALEJANDRO DÁVILA ARIAS

ricardo.davila@en,edu,ec

DIRECTOR:

DR. FABIÁN ERNESTO PÉREZ YAULI

[email protected]

Quito, enero 2019

II

AVAL

Certifico que el presente trabajo fue desarrollado por Ricardo Alejandro Dávila Arias,

bajo mi supervisión.

DR. FABIÁN ERNESTO PÉREZ YAULI

DIRECTOR DEL TRABAJO DE TITULACIÓN

III

DECLARACIÓN DE AUTORÍA

Yo Ricardo Alejandro Dávila Arias, declaro bajo juramento que el trabajo aquí descrito

es de mi autoría; que no ha sido previamente presentada para ningún grado o

calificación profesional; y, que he consultado las referencias bibliográficas que se

incluyen en este documento.

A través de la presente declaración cedo mis derechos de propiedad intelectual

correspondientes a este trabajo, a la Escuela Politécnica Nacional, según lo

establecido por la Ley de Propiedad Intelectual, por su Reglamento y por la

normatividad institucional vigente.

Ricardo Alejandro Dávila Arias

IV

DEDICATORIA

El presente trabajo está dedicado a la memoria de mi padre, Jaime Alberto Atahualpa

Dávila Boada, por su amor, cariño y las enseñanzas que me convirtieron en la persona

que soy el día de hoy.

V

AGRADECIMIENTO

En primer lugar agradezco a Dios, por su amor incondicional, a mi esposa por su

apoyo y comprensión durante mis años de estudio y a mi madre por el cariño y los

consejos brindados.

VI

ÍNDICE DE CONTENIDO

1 INTRODUCCIÓN ............................................................................................................................. 1

1.1. PREGUNTA DE INVESTIGACIÓN ............................................................................................................ 2

1.2. OBJETIVO GENERAL .......................................................................................................................... 2

1.3. OBJETIVOS ESPECÍFICOS .................................................................................................................... 2

1.4. ALCANCE ........................................................................................................................................ 3

1.5. MARCO TEÓRICO ............................................................................................................................. 3

1.5.1. Información de bases de datos eléctricos........................................................................... 3 1.5.1.1. Métodos de validación de información ........................................................................................ 4 1.5.1.2. Corrección de datos eléctricos atípicos ........................................................................................ 7

1.5.2. Modelamiento espacial de demanda eléctrica .................................................................. 8 1.5.2.1. Modelamiento espacial de demanda con software de análisis técnico ....................................... 8 1.5.2.2. Modelamiento de demanda por micro-áreas .............................................................................. 9

1.5.3. Análisis de conglomerados en entidades geo-referenciales ............................................. 10 1.5.3.1. Correlación de variables ............................................................................................................. 11 1.5.3.2. Análisis de regresión geográficamente ponderada .................................................................... 14

1.5.4. Métodos de proyección de demanda ............................................................................... 16 1.5.4.1. Métodos de tendencia ............................................................................................................... 16 1.5.4.2. Métodos simulativos .................................................................................................................. 16 1.5.4.3. Métodos Híbridos ....................................................................................................................... 16 1.5.4.4. Método de series de tiempo ...................................................................................................... 17 1.5.4.5. Método de ajuste logístico ......................................................................................................... 20 1.5.4.6. Método de saturación del uso del suelo .................................................................................... 22 1.5.4.7. Método de capacidad de carga del ambiente ............................................................................ 27

1.5.5. Criterios de validación ...................................................................................................... 31 1.5.5.1. Criterio R2 ................................................................................................................................... 31 1.5.5.2. Raíz del error cuadrático medio RMSE ....................................................................................... 31 1.5.5.3. Porcentaje de error medio absoluto MAPE ................................................................................ 32 1.5.5.4. Criterio de información Akaike AIC ............................................................................................ 32

1.5.6. Revisión del estado del arte.............................................................................................. 33

2 METODOLOGÍA ............................................................................................................................ 35

2.1. DESCRIPCIÓN DEL ÁREA DE ESTUDIO ................................................................................................... 35

2.2. MANEJO DE INFORMACIÓN DE BASES DE DATOS ELÉCTRICOS ................................................................... 37

2.2.1. Información histórica de demanda eléctrica en redes primarias ..................................... 38

2.2.2. Información topológica de redes primarias ..................................................................... 39

2.2.3. Información de consumos geo-referenciados .................................................................. 41 2.2.3.1. Geo-procesamiento de información con coordenada UTM ....................................................... 41 2.2.3.2. Generación de rutas de lectura .................................................................................................. 41 2.2.3.3. Verificación de la correcta ubicación de usuarios ...................................................................... 42 2.2.3.4. Validación de las coordenadas UTM de los usuarios con la secuencia de lectura. .................... 42 2.2.3.5. Generación de base de datos geo-referenciada de consumos .................................................. 43

2.2.4. Validación de demandas históricas .................................................................................. 44

2.2.5. Corrección de demandas históricas .................................................................................. 45

2.2.6. Información de datos eléctricos relevantes ...................................................................... 47

2.2.7. Información socio-económica .......................................................................................... 47

2.3. GENERACIÓN DE ESTADÍSTICA GEO-REFERENCIADA ................................................................................ 48

2.3.1. Grilla de micro-áreas existente en la EEQ ........................................................................ 49

2.3.2. Determinación de demandas mensuales por micro-área................................................. 49 2.3.2.1. Intersección geo-espacial de datos de demanda eléctrica ......................................................... 50

VII

2.3.3. Relacionamiento de datos eléctricos y socio-económicos por micro-área ....................... 52 2.3.3.1. Intersección geo-espacial de datos socioeconómicos ................................................................ 52

2.4. ANÁLISIS DE CONGLOMERADOS DE MICRO-ÁREAS ................................................................................. 54

2.4.1. Análisis de correlación entre variables de las micro-áreas ............................................... 54

2.4.2. Análisis de regresión geográficamente ponderada en ArcGIS ......................................... 56

2.4.3. Definición de conglomerados geográficamente ponderados ........................................... 58

2.5. SIMULACIÓN DE SATURACIÓN DE DEMANDA ........................................................................................ 59

2.5.1. Simulación de saturación de uso del suelo ....................................................................... 60

2.5.2. Simulación de saturación por capacidad de carga del ambiente ..................................... 62

2.6. PROYECCIÓN ESPACIAL DE DEMANDA CON UN MÉTODO JERÁRQUICO ........................................................ 64

2.6.1. Agregación de demanda de las micro-áreas .................................................................... 64

2.6.2. Proyección de demanda por conglomerados ................................................................... 64

2.6.3. Ajuste de previsión de carga con optimización multiobjetivo .......................................... 67 2.6.3.1. Minimización de la incompatibilidad de demanda histórica ...................................................... 68 2.6.3.2. Minimización del desajuste de demanda futura ........................................................................ 69 2.6.3.3. Límite de la pendiente ................................................................................................................ 69 2.6.3.4. Límite de la rampa de tiempo .................................................................................................... 69 2.6.3.5. Función de optimización ............................................................................................................ 70

2.6.4. Algoritmo de proyección jerárquico ................................................................................. 70 2.6.4.1. Bloque de carga de datos. .......................................................................................................... 71 2.6.4.2. Bloque Proyección tendencial de conglomerados. .................................................................... 71 2.6.4.3. Bloque de optimización multiobjetivo. ...................................................................................... 72 2.6.4.4. Generación de resultados preliminares ..................................................................................... 72

2.6.5. Inclusión geo-espacial de cargas especiales futuras ........................................................ 72

2.6.6. Elección del modelo de proyección ................................................................................... 74

2.7. PROYECCIÓN DE DEMANDAS EN GRANDES ZONAS DE SERVICIO ................................................................. 75

2.7.1. Definición de grandes zonas de servicio ........................................................................... 76

2.7.2. Previsión de demanda por agregación de micro-áreas .................................................... 78

2.8. PROYECCIÓN DE DEMANDA PARA EL ÁREA DE COBERTURA DE SUBESTACIONES DE DISTRIBUCIÓN .................... 79

2.8.1. Definición de cobertura de servicio de las subestaciones de distribución ........................ 79

2.8.2. Previsión de demanda por agregación de micro-áreas .................................................... 80

2.9. AJUSTE DE DATOS DE PREVISIÓN EN NIVELES DE COBERTURA ................................................................... 81

2.9.1. Ajuste de proyección a nivel de cobertura de zonas operativas ....................................... 82

2.9.2. Ajuste de proyección a nivel de cobertura de subestaciones ........................................... 83

3 RESULTADOS Y DISCUSIÓN .......................................................................................................... 84

3.1. RESULTADOS ................................................................................................................................. 84

3.1.1. Análisis espacial de variables eléctricas y socioeconómicas ............................................ 84 3.1.1.1. Análisis de demanda histórica .................................................................................................... 84 3.1.1.2. Datos de comercialización de energía eléctrica ......................................................................... 90 3.1.1.3. Datos espaciales socio-económicos ........................................................................................... 93 3.1.1.4. Peso en la demanda de las zonas en la EEQ. .............................................................................. 96

3.1.2. Previsión de demanda por micro-áreas ............................................................................ 98

3.1.3. Previsión de demanda para zonas operativas ................................................................ 100

3.1.4. Previsión de demanda para áreas de cobertura de subestaciones de distribución ........ 107

3.1.5. Previsión de demanda en el corto, mediano y largo plazo del sistema de distribución de

medio voltaje de la EEQ ................................................................................................................... 111

3.2. DISCUSIÓN ................................................................................................................................. 113

3.2.1. Contrastación de resultados con la medición del año 2017 ........................................... 113

3.2.2. Comparación de resultados de corto, mediano y largo plazo ........................................ 114

3.2.3. Análisis de resultados finales ......................................................................................... 114

VIII

3.2.3.1. Caso 1. Obras necesarias para abastecer los crecimientos de demanda geo-espacial ............ 115 3.2.3.2. Caso 2. Obras necesarias para solventar la sobrecarga del sistema de 46kV ........................... 117 3.2.3.3. Caso 3. Obras necesarias para mejorar la calidad de producto en el sistema.......................... 118 3.2.3.4. Obras de expansión del sistema de distribución en MV .......................................................... 119

4 CONCLUSIONES ......................................................................................................................... 122

5 REFERENCIAS BIBLIOGRÁFICAS .................................................................................................. 128

6 ANEXOS ..................................................................................................................................... 131

IX

RESUMEN

En la actualidad las empresas distribuidoras del país realizan la planificación del

sistema eléctrico enfocándose a solventar los problemas de carga en redes de

subtransmisión, para lo cual utilizan proyecciones de demanda tendenciales a nivel del

sistema total de la empresa, dejando de observar el comportamiento geo-espacial de

la demanda, impidiendo determinar las zonas dentro del área de servicio donde la

densificación de la demanda eléctrica se acerca a niveles críticos.

Este problema se resuelve utilizando metodologías de proyección espacial, las cuales

deben partir de una estadística geo-referenciada sólida y validada. Dentro de las

técnicas de proyección espacial existentes, las que presenten mayores ventajas son

aquellas que utilizan métodos híbridos, de los cuales para el presente trabajo se utiliza

un método jerárquico, que utiliza la saturación del uso del suelo y la capacidad de

carga del ambiente para la etapa simulativa y optimización multiobjetivo para la

realizar el ajuste logístico en la etapa tendencial.

Dentro del algoritmo desarrollado para la aplicación de la metodología descrita, se

incluyen módulos de ajuste de la previsión de demanda para niveles de cobertura de

subestaciones y grandes zonas operativas, que vincula el comportamiento histórico

con la proyección de demanda obtenida.

A partir de los resultados obtenidos con la aplicación de la metodología propuesta al

caso de la Empresa Eléctrica Quito, es posible conseguir un ahorro de 41.6 millones

de dólares, debido a que las inversiones a realizarse dentro del plan de expansión

serían direccionadas a los sectores donde es necesario invertir en obras de

infraestructura eléctrica.

PALABRAS CLAVE: Proyección espacial de demanda, Método jerárquico,

Optimización multiobjetivo, Estadística geo-referenciada, Saturación de uso del suelo,

Capacidad de carga del ambiente.

X

ABSTRACT

Currently the distribution companies of the country carry out the planning of the

electrical system focusing the load problems in sub-transmission networks for which

they use trend demand projections at the level of the total system of the company.

When geo- spatial demand data isn’t available, not observing the geo-spatial behavior

of the demand, preventing the determination of the zones within the service area where

the densification of electrical demand approaches critical levels..

This problem is solved by using spatial projection methodologies that must be based

on solid and validated geo-referenced statistics. Among the existing spatial projection

techniques, the ones that offer the greatest advantages are those that utilize hybrid

methods. For this particular work, a hierarchical method is used, which uses the

saturation of land use and the load capacity of the environment to the simulative stage

and multiobjective optimization to perform the logistic adjustment in the trend stage.

Within the algorithm developed for the application of the described methodology, there

are modules to adjust the demand forecast for coverage levels of substations and large

operating areas, which linking the historical behavior with the demand projection

obtained.

Based on the results obtained with the application of the proposed methodology to the

case of Empresa Eléctrica Quito, it is possible to achieve savings of 41.6 million

dollars, because the investments to be made within the expansion plan would be

directed to the sectors where it is necessary to investing in electrical infrastructure

works.

KEYWORDS: Spatial projection of demand, hierarchical method, multi-objective

optimization, geo-referenced statistics, saturation of land use, load capacity of the

environment.

1

1 INTRODUCCIÓN

La previsión espacio-temporal de la demanda eléctrica es la base para el desarrollo de

la planificación de sistemas eléctricos, ya que a partir de estos datos se puede

identificar el futuro desarrollo de la red eléctrica en función de las necesidades de los

clientes de una empresa de distribución de energía eléctrica.

Dentro de las empresas de distribución del país por muchos años se ha utilizado

métodos de proyección mediante tasas de crecimiento a nivel de subestaciones de

Alto Voltaje / Medio Voltaje (AV/MV), las cuales si bien representan de una manera

muy acertada el comportamiento futuro de la demanda a nivel sistema, no permiten

identificar los sitios dentro del área de servicio donde se está densificando el uso de la

energía eléctrica, coadyuvando a que los recursos no sean invertidos de forma óptima,

en los sitios donde los usuarios, tanto actuales como futuros lo requieran.

Las tasas de crecimiento a nivel de subestación (AV/MV), no son de utilidad en la

planificación de sistemas eléctricos de distribución debido al alto grado de variación en

la topología de las redes de distribución y por consiguiente, del área servida; por lo

que para un nivel desagregado en micro-áreas el cual será mucho más pequeño que

las áreas de cobertura de subestaciones, las metodologías tendenciales no son

adecuadas, esto es provocado porque un área que estaba servida por cierto primario,

al siguiente día; por razones operativas, estará servida de otro primario u otra

subestación, provocando así distorsiones en las tasas de crecimiento tendenciales.

La falta de conocimiento de demanda geo-localizada y previsión especial de la misma,

provoca que las inversiones se direccionen a sectores donde se encuentran

facilidades constructivas, por ejemplo, la instalación de nuevas subestaciones (AV/MV)

bajo líneas de transmisión existentes, pero muy alejadas de los centros de carga,

incrementando los presupuestos y las dificultades en la construcción de alimentadores

primarios.

Para evitar estos inconvenientes se ve la necesidad de utilizar la proyección de

demanda a nivel de micro-áreas, esto considerando que los límites de cada micro-área

permanecen invariables a lo largo del tiempo, consiguiendo de esta manera determinar

el real comportamiento de la carga de forma espacial.

Con la información de previsión por micro-áreas es posible realizar un proceso de

agregación al nivel de cobertura requerido por las distintas áreas de la empresa,

2

evitando que se presenten distorsiones en los crecimientos tendenciales en cualquiera

de estos niveles de cobertura.

1.1. Pregunta de investigación

¿Cómo se puede determinar la proyección de demanda espacial eléctrica a nivel de

micro-áreas en las zonas de servicio de las empresas de distribución eléctrica en el

Ecuador?

1.2. Objetivo General

Determinar una metodología, que con la ayuda de las herramientas computacionales y

la información existentes en las bases de datos de una empresa de distribución

eléctrica del Ecuador, permita la obtención de la proyección de demanda eléctrica a

nivel de grandes zonas geográficas a utilizarse en la Planificación del Sistema de

Subtransmisión y a nivel de micro-áreas que se utilizará en la Planificación del Sistema

de Distribución.

1.3. Objetivos Específicos

Realizar la revisión bibliográfica del estado del arte referente a la previsión espacial de

demanda eléctrica.

Verificar la información existente en las bases de datos pertenecientes a una Empresa

de Distribución Eléctrica, para posteriormente cotejar su correlación con el crecimiento

de demanda eléctrica, a fin de determinar su utilidad dentro del método de proyección

de demanda propuesto.

Definir las proyecciones de demanda por micro-área a través de la aproximación de

curvas logísticas, con la ayuda de optimización multi-objetivo, tomando en

consideración las demandas actual y saturada de cada una, así como también

agrupamientos de micro-áreas con métodos de inteligencia artificial.

Determinar, en las zonas definidas para los procesos operativos, grandes áreas de

consumo homogéneo y la estadística de demandas existente para cada una, de tal

manera que se presenten comportamientos tendenciales, a fin de que la proyección de

sus demandas pueda ser analizada con modelos de predicción para series de tiempo.

Obtener la previsión de carga en el corto plazo (un año), mediano plazo (5 años) y

largo plazo (10 años), para zonas grandes de operación de la Empresa y para cada

micro-área definida dentro del sistema de información geográfico de la Empresa.

3

1.4. Alcance

Para el presente trabajo se realizará la verificación de datos existente en base de

información eléctrica de Empresas de Distribución, para lo cual se utilizará a la

Empresa Eléctrica Quito como caso de aplicación, con el fin de determinar las

variables útiles para el análisis de proyección de demanda eléctrica, luego de esta

verificación se obtendrá una base de datos de información validada misma que nos

servirá para realizar análisis de agrupamiento con el fin de determinar grupos de

micro-áreas de características homogéneas. La caracterización de las micro-áreas

será utilizada en la aplicación del ajuste logístico dentro de la etapa tendencial del

método propuesto. Para la etapa simulativa, se propondrá dos caminos, el primero

para sectores donde exista la información de los planes de uso del suelo, y otra en

zonas sin esta información, donde se utilizarán datos de censos existentes, para en

estos realizar análisis econométricos.

Por otro lado, se realizará el análisis de previsión de la demanda en grandes zonas de

servicio, mismas que serán definidas de acuerdo a los procesos operativos internos de

la empresa; como estas zonas presentan comportamientos tendenciales con ciertos

componentes de estacionalidad, se utilizarán análisis de series de tiempo para la

proyección de demanda en cada una de ellas. La validación tanto de los métodos

propuestos, como la proyección oficial de la Empresa se la realizará contrastando los

resultados obtenidos para el sistema completo, con los datos de medición de demanda

realizada en el último año.

Los resultados de las proyecciones serán generados para los niveles de cobertura y

los períodos temporales que son requeridos por el área de Planificación de la Empresa

Eléctrica Quito, esto es con un horizonte de diez años y una resolución de un año.

1.5. Marco teórico

1.5.1. Información de bases de datos eléctricos

Las empresas distribuidoras de energía eléctrica poseen información histórica

relevante para su giro del negocio, dentro de bases de datos dispersas en distintas

áreas y/o departamentos de las empresas; en la actualidad en el país esta información

no es procesada y validada, por consiguiente no se la incluye dentro de una

inteligencia de negocios “Business Intelligence” (BI) que permitiría que los datos sean

accesibles y utilizados en los diversos procesos tanto técnicos como administrativos.

Es por este motivo que para iniciar cualquier proceso que requiera información

estadística es necesario la estructuración de una base de datos que contenga toda la

4

información necesaria, corregida y validada a utilizarse en las distintas actividades que

se desarrollarán, misma que se construirá con miras a la implementación de la BI que

se manejará dentro de la empresa distribuidora.

En cuanto a la información necesaria para realizar la proyección de demanda geo-

espacial de manera adecuada, es útil para las empresas mantener históricos a un nivel

de micro-áreas, con información eléctrica tal como: demanda, consumo, número de

usuarios, inventario de equipos instalados (luminarias, transformadores); e información

socio-económica que proviene de los censos poblacionales, realizados, para el caso

del país por el Instituto Nacional de Estadísticas y Censos (INEC).

1.5.1.1. Métodos de validación de información

Toda investigación, procesamiento y definición de metodologías inicia con la

recolección de gran cantidad de información histórica que las empresas distribuidoras

mantienen dentro de sus bases de datos, la validez de esta información condiciona el

análisis estadístico y los resultados del posterior estudio a realizarse.

Frecuentemente se encuentra que las compañías presentan problemas de calidad de

información entre el 60% y el 90% de las operaciones realizadas sobre bases de datos

[1], este problema puede ahondarse debido a que actualmente las empresas toman

decisiones cada vez más basándose en BI, la cual cambia de enfoque al no ser

determinadas por el juicio subjetivo o la intuición de las directivas, sino considerando la

información obtenida de las bases y repositorios de datos.

La mala calidad de la información se debe a la presencia de datos erróneos, faltantes

y desviaciones en la medición, los cuales pueden conducir a la toma de decisiones

erradas, produciendo pérdidas de tiempo, dinero o el direccionamiento de recursos no

optimizado.

Los datos faltantes son aquellos que en un instante puntual dentro de una serie

temporal se presenta como un dato vacío; lo cual no se debe confundir con datos de

cero (0), ya que cuando hablamos de energía eléctrica este dato puede representar

que un cliente no ha consumido electricidad o en el caso de mediciones en

alimentadores primarios esto puede representar que por mantenimiento el mismo fue

transferido durante ese período; estos datos se puede clasificar en tres tipos [2]: datos

perdidos completamente al azar, datos perdidos al azar y datos perdidos no debidos al

azar, de los cuales para el propósito del presente trabajo solamente se ocuparán los

del primer tipo, ya que al hacer referencia a los datos de demanda, la falta de estos se

presentará por fallas en los equipos de medición, lo cual es un condición debida

5

completamente al azar, que está relacionada con variables o condiciones exógenas

que no se consideran dentro del estudio de previsión de demanda.

Los datos erróneos y desviaciones en la medición se agrupan dentro de los llamados

outlier, los cuales representan observaciones que son numéricamente distantes del

resto de datos [3], estas observaciones se catalogan en dos tipos: discordante cuando

aparecen de forma sorpresiva y discordante para el investigador; y contaminante que

es un error que se presenta por inferencia exógena a los datos analizados, dentro de

estas, en el presente trabajo se consideraran solamente los datos discordantes ya que

los del tipo contaminante se presentan en análisis de datos financieros, económicos,

etc., pero no por razones propias del sistema eléctrico en series temporales de

demanda o energía.

Considerando que las variables de demanda y energía están influenciadas por

factores socio-económicos y técnicos, los datos discordantes se presentan por la

influencia de intervenciones desconocidas como depresiones o incentivos económicos,

puentes vacacionales, cambios de bases, errores de medición o transcripción de

datos, etc.

Es de vital importancia identificar y corregir de ser necesario estos errores y

desviaciones en la medición. Estas situaciones se presentan por tres razones

fundamentales [4]:

1. Si los efectos son grandes pueden sesgar la estimación de los parámetros,

produciendo malas predicciones futuras.

2. Si el suceso ocurre al final de la serie temporal y estas observaciones son

utilizadas para la proyección, éstas no serán de buena calidad, incluso si los

parámetros de regresión están bien estimados.

3. Si existe la posibilidad de que estos sucesos atípicos se vuelvan a presentar en

el futuro, y se puede estimar su efecto, es posible incorporar a la proyección el

mismo y así obtener predicciones más realistas.

1.5.1.1.1. Técnicas de imputación

A fin de realizar la corrección de datos atípicos existen las llamadas técnicas de

imputación [2], las cuales son procesos mediante los cuales se reemplazan los datos

perdidos con estimaciones:

· Imputación usando la media; la cual consiste en reemplazar los datos faltantes

por la media aritmética de los datos no perdidos de la variable imputada. El uso

6

de esta técnica afecta la correlación entre la variable imputada y cualquier otra

al reducir su variabilidad, y adicionalmente al realizarla en series temporales se

debe tener cuidado al calcular la media con todos los datos, ya que al

presentar tendencias (crecientes o decrecientes), la media no representará de

una manera correcta los valores al inicio o al final de la serie, como tampoco al

presentarse índices de variación periódica muy elevada.

· Imputación Hot Deck; cuyo objeto es el de reemplazar los registros vacíos con

información de campos con información completa. Este reemplazo se lo realiza

mediante una selección aleatoria de los valores observados, la técnica consiste

en identificar características comunes en los campos con información completa

y los vacíos, y decidir los valores a imputar en los registros faltantes. La

desventaja de utilizar esta técnica radica en la posible duplicación del mismo

valor reportado muchas veces, esto ocurre cuando existen muchos datos

faltantes y pocos valores registrados. Existen diferentes técnicas de imputación

Hot Deck [5]:

o Muestreo aleatorio simple, los valores a ser imputados se extraen de

manera aleatoria.

o Secuencial, proceso en el que se analizan todos los datos, en el cual si

el primer registro es un valor faltante, se llena con el valor inicial a

imputar, y si es un registro válido se utilizará éste como valor inicial y

será utilizado para imputar el siguiente valor faltante.

o Por clase, los valores observados se escogen al azar de la clase a la

que pertenece el registro vacío; por ejemplo, si la medición faltante

corresponde a un día miércoles, el valor observado se escogerá de

entre los días miércoles con medición válida.

o Vecino más cercano, se basa en la suposición que los individuos

cercanos en el mismo entorno tienen características similares, en este

método se definen los vecindarios en función de las características de

la medición: día de la semana, mes, año, existencia de transferencias

de carga, tipo de usuarios, etc.

· Imputación por regresión, los datos faltantes son reemplazados por el valor

predicho mediante una regresión de los datos existentes de la muestra. Este

método tiene la ventaja de trabajar con la base de datos completa minimizando

así el hecho de pérdida de información, puesto que se trabaja con todos los

datos registrados.

7

1.5.1.2. Corrección de datos eléctricos atípicos

Lee Willis en Power Distribution Planning Reference Book [6] dice: “El pico de

demanda y el uso de energía dentro de un sistema de servicio de electricidad, crecen

solo por dos razones: la adición de nuevos consumidores; o nuevos usos de

electricidad, similarmente cualquier decrecimiento en demanda eléctrica es debida a

reducciones de uno o ambos factores antes nombrados”, esto quiere decir que en las

series temporales de estos dos parámetros eléctricos un valor atípico será aquel que

varíe de forma significativa las tasas de crecimiento vegetativo, es así que pueden

presentarse variaciones válidas ante la presencia de condiciones especiales, como

pueden ser: depresiones económicas, aumento de la capacidad adquisitiva de la

población, ingreso de cargas especiales y cambios en la utilización del uso del suelo,

por lo que es necesario realizar la revisión individual de los valores de medición

mensual a fin de determinar qué valores son efecto de las condiciones antes

mencionadas y cuales se catalogarán como valores incorrectos. En la Figura 1.1 se

muestra como a finales del año 2009 se presentan registros erróneos los cuales se

identifican gráficamente como un pico temporal; estos registros producen desviaciones

en la regresión obtenida con datos no validados.

Figura 1.1 Medición del primario 36B y regresión entre los años 2007 y 2011

Fuente: Sistema de información de distribución (SDi), EEQ

Otro aspecto a considerar para la corrección de las desviaciones en la medición de

demandas es la Ley de nodos de Kirchhoff, ya que las empresas distribuidoras de

manera general poseen medición en la barra de alimentación de las subestaciones y

en todos y cada uno de los primarios asociados a dicha barra, con lo cual se puede

validar los registros faltantes y los errores de recolección o tabulación de las

mediciones de alimentadores primarios; con la restricción de que dicha validación se la

8

debe realizar únicamente con mediciones coincidentes. En la Figura 1.2 se observa

como la medición de la barra de la subestación es igual a la suma de las demandas

registradas en cada alimentador primario, cumpliendo la mencionada ley.

Figura 1.2 Ley de nodos en una subestación de distribución

1.5.2. Modelamiento espacial de demanda eléctrica

Modelar la demanda eléctrica de forma espacial se refiere a definir geográficamente la

ubicación de la carga eléctrica, lo cual se hace de acuerdo al detalle de desagregación

que se requiera; donde el nivel de detalle más utilizado por las empresas de

distribución son las micro-áreas, en los cuales se recopilan los datos de consumo y

demanda de una superficie geográfica limitada e invariable en el tiempo, para

posteriormente realizar algún método de previsión de carga futura en cada micro-área,

proporcionando un pronóstico de carga que es de naturaleza geográfica [7].

Dentro de las empresas de distribución eléctrica se poseen datos de demandas

mensuales registrados a nivel de cabecera de los alimentadores primarios, los cuales

cubren varios kilómetros cuadrados, es por ello que se requiere un método de

asignación de esta demanda registrada a un nivel de desagregación inferior.

1.5.2.1. Modelamiento espacial de demanda con software de análisis técnico

Los programas computacionales de análisis técnico de redes eléctricas poseen

algoritmos de distribución de carga, así como también estos programas permiten

modelar las redes de distribución geográficamente, consiguiendo con estas dos

características del software una asignación geo-referenciada de carga.

9

En el Ecuador el Ministerio de Electricidad y Energías Renovables, homologó el

software Cymdist [8] para la realización de los análisis técnicos en las empresas

distribuidoras. En este software existe la herramienta “Distribución de carga”, misma

que asigna una porción de la demanda medida en un punto de la red eléctrica a cada

fase de cada tramo de carga existente aguas abajo de dicho punto de medición, según

los kVA conectados o los kWh consumidos.

El método de kWh consumidos, el cual es el método utilizado en el presente trabajo,

realiza la repartición de carga de acuerdo a la siguiente formulación matemática:

!"#$% =&"#$(',%) × *+' Ecuación 1.1 Consumo total del primario en la fase “k”

"#-../+(',%) = "#012% × 3"#$(',%) × *+!"#$% 4 Ecuación 1.2. Demanda activa distribuida en la carga “s” y la fase “k”

"5-6-../+(',%) = "#-../+(',%) × 78 9*:%;< > 9 Ecuación 1.3. Demanda reactiva distribuida en la carga “s” y la fase “k”

Donde:

s: Número de la carga a asignar la demanda

k: Fase de la carga “s” a asignar la demanda (A, B o C)

kWh(s,k): Consumo de la fase “k” en la carga “s”

fc: Factor de carga por tipo de carga (dato opcional)

kWdemk: Demanda activa medida del alimentador primario en la fase “k”

fpk: Factor de potencia en la fase “k” de la carga “s”

1.5.2.2. Modelamiento de demanda por micro-áreas

El primer paso del pre-procesamiento de datos es convertir datos de carga basados en

transformadores o clientes, a datos de carga basados en micro-áreas [9]. Para este fin

los software de modelamiento geográfico poseen herramientas de intersección

espacial entre entidades geo-referenciadas.

10

Esta herramienta requiere realizar un procesamiento de la información de mediciones

existentes en cabecera de los primarios para asociarlos a las micro-áreas de acuerdo

al siguiente proceso:

1. Obtención de la información de medición de las demandas.

2. Validación de la información de medición de demandas.

3. Distribución de carga en el software de análisis técnico.

4. Obtención de información de cargas geo-referenciadas; esto puede ser a nivel

de transformadores de distribución o clientes.

5. Integración de información de cargas geo-referenciadas en el sistema de

información geográfico.

6. Intersección espacial de información de cargas a nivel de micro-áreas.

1.5.3. Análisis de conglomerados en entidades geo-referenciales

El análisis de conglomerados se refiere a las técnicas de clasificación de objetos

pertenecientes a un conjunto de datos en grupos, tratando que cada uno sea lo más

homogéneo posible, y se minimice la similitud entre cada grupo [10], [11], [12], [13].

La clasificación se la realiza seleccionando el atributo apropiado y se relaciona con

una referencia cuidadosamente seleccionada; esto depende únicamente del campo

que concierne al usuario, que para el caso de entidades geo-referenciadas será la

ubicación espacial de cada objeto.

El análisis de conglomerados es un tema amplio, por lo que existen abundantes

algoritmos de agrupación de conjuntos de datos. Los métodos más utilizados implican

calcular la distancia, la densidad y el intervalo o una distribución estadística particular.

La decisión acerca del criterio de selección de algoritmos de análisis de

conglomerados es normalmente subjetiva y depende del método que mejor refleje los

propósitos de cada estudio particular [10], algunos de los algoritmos existentes en el

software de información geográfica homologado a nivel nacional [14] se describen a

continuación:

· K-Means; los parámetros iniciales de este método son la cantidad de

conglomerados y el conjunto de sus centroides, se calcula las distancias de

cada objeto a cada uno de los centroides y el elemento se asigna al

conglomerado con el que la distancia del elementos es menor, finalmente el

centroide del conglomerado al que se asignó el objeto se recalcula.

11

· Vecino más cercano; conociendo la distancia entre pares de elementos de todo

el conjunto de objetos, se determina cuales son los más próximos en cuanto a

distancia o similitud, definiendo así que estos forman parte de un grupo y no se

volverán a separar durante todo el proceso, se vuelve a calcular la distancia

entre todos los elementos considerando que el grupo ya formado es un solo

objeto, con un centroide único.

· Método de Ward; este método busca minimizar la varianza dentro de cada

grupo, para lo cual se calcula la media de todas las variables en cada

conglomerado, luego se calcula la distancia entre cada objeto para

posteriormente sumarlas, así como también la media del conglomerado,

finalmente se juntan los conglomerados que produzcan menores incrementos

en la suma de las distancias dentro de cada conglomerado, este método crea

grupos homogéneos y de tamaños similares.

· Método de clasificación de cortes naturales (Jenks) [15]; es el más popular

para la clasificación de entidades geo-referenciales, el mismo se basa en la

maximización de la varianza entre clases y, al mismo tiempo, minimizar la

varianza dentro de las clases, de esta manera los grupos de valores se

agrupan naturalmente.

· Método de clasificación por Quantiles; consiste en mantener la cantidad de

datos igualmente clasificados en grupos, el problema es que algunos datos

similares o iguales pueden clasificarse en diferentes grupos. Este método se

basa más en la subjetividad del ser humano que en los datos mismos y se

considera que transmiten poca información sobre los datos.

1.5.3.1. Correlación de variables

La correlación entre variables es una metodología estadística descriptiva, mediante la

cual se trata de estimar el nivel de relación lineal existente entre ellas, en caso de

existir correlación el objetivo es realizar predicciones para dichas variables,

considerando las limitaciones debido a las inferencias de la causa de la relación [16].

La correlación mide el grado de relación entre dos variables, lo cual gráficamente se

puede observar como la cercanía de los puntos a una recta en su respectivo diagrama

de dispersión (Ver Figura 1.3).

Figura 1.3 Diagrama de dispersión del consumo total respecto al número de clientes por micro-área y representación de la recta de tendencia

Fuente: Sistema de información comercial EEQ

El índice de relación entre variables se mide con los llamados coeficientes de

correlación, los cuales indican el grado de asociación en términos de crecimiento o

decremento de acuerdo a las siguientes consideraciones

· Positiva o directa, especifica que una variable crecerá si aumenta la otra.

· Negativa o inversa, señala que una variable present

variable aumenta.

· Nula, se da cuando no existe relación entre las variables.

1.5.3.1.1. Coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson es un índice que mide de grado de

covariancia entre las variables

términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “

“μy” y varianzas “σ2x” y “σ2y”, respectivamente; la correlación está dada por

Ecuación 1.4 Cálcul

1.5.3.1.2. Coeficiente de correlación de Spearman

Este índice es un valor estadístico no paramétrico ya que a diferencia del coeficiente

de correlación de Pearson es necesario conocer la distribución de probabilidad entre

12

Diagrama de dispersión del consumo total respecto al número de clientes área y representación de la recta de tendencia lineal de los datos

Sistema de información comercial EEQ



uerdo a las siguientes consideraciones [17]:

Positiva o directa, especifica que una variable crecerá si aumenta la otra.

Negativa o inversa, señala que una variable presentará decremento si la otra

Nula, se da cuando no existe relación entre las variables.

Coeficiente de correlación de Pearson


covariancia entre las variables [18], es por ello que este coeficiente se define en

términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “

”, respectivamente; la correlación está dada por

6 = ?@(A > BC)DE > BFGHICIF Cálculo del coeficiente de correlación de Pearson

Coeficiente de correlación de Spearman



Diagrama de dispersión del consumo total respecto al número de clientes lineal de los datos



Positiva o directa, especifica que una variable crecerá si aumenta la otra.

ará decremento si la otra


, es por ello que este coeficiente se define en

términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “μx” y

”, respectivamente; la correlación está dada por [19]:



13

las variables “X” y “Y”, este se puede obtener sin conocer los parámetros de dicha

distribución, esto implica que el coeficiente de correlación de Spearman es el mismo

de Pearson pero aplicado sobre las variables transformadas en rangos [16], si “rx” es el

rango de la variable “X”, “ry” es el rango de la variable “Y” y “n” es el número de rangos

definidos, se puede determinar el coeficiente de correlación de Spearman mediante la

Ecuación 1.5 [17].

6' = 9 > JK D6CL > 6FLG 9) Ecuación 1.5 Cálculo del coeficiente de correlación de Spearman

1.5.3.1.3. Coeficiente de correlación de Kendall

El coeficiente de correlación de Kendall es usado cuando se requiere determinar el

grado de relación lineal entre dos variables cuantitativas pero las mismas no siguen un

comportamiento normal; al igual que en el caso del coeficiente de correlación de

Spearman, se basa en rangos por tal motivo se requiera una definición previa de los

mismos a partir de los datos originales [16].

! = Q × (R >S)TP(P > 9) > K UVL(UVL > 9)MLNO × TP(P > 9) > K UWL(UWL > 9)MLNO Ecuación 1.6 Cálculo del coeficiente de correlación de Kendall

Donde:

P: número de veces que se incrementa Y conforme se incrementa X

M: número de veces que disminuye Y conforme se incrementa X

n: número de rangos

tx: número de observaciones empatadas en cada grupo de la variable X

ty: número de observaciones empatadas en cada grupo de la variable Y

1.5.3.1.4. Causalidad e interpretación de la correlación

La correlación entre dos variables tan solo significa que ambas comparten información,

es decir que existe o no una relación entre la variación de las variables. Pero el origen

de la información, la fuente de la variabilidad o la causa de ésta, es una cuestión que

no puede resolverse mediante recursos netamente matemáticos [18].

Esto quiere decir que el investigador debe realizar un análisis de causalidad para

determinar que una correlación entre variables tiene un significado físico, por ejemplo

14

como se observa en la Figura 1.3, el consumo total de energía aumenta mientras

aumenta el número de clientes residenciales, lo cual tiene lógica, ya que si incremento

un nuevo usuario en una zona dada, el consumo de este cliente aumentará el total de

la energía en la zona; por el contrario si se compara la variable demanda eléctrica, con

la variable referida al número de viviendas prestadas del censo poblacional, no existe

una relación física ya que es lo mismo que esta vivienda sea prestada o propia, en

ambos casos el consumo eléctrico será el mismo, y por ende que aumente o

disminuya el número de casa prestadas no influirá en la demanda eléctrica.

El nivel de relación entre variables se puede interpretar en base a sus coeficientes de

correlación, el peso de cada valor de correlación puede ser definido de acuerdo a cada

investigador, es por ello que varios autores presentan distintas tablas de valoración

[20], [17]; este peso se pueden evaluar en función de su magnitud como se muestra en

la Tabla 1.1, o en función del signo del coeficiente de la correlación Tabla 1.2.

Tabla 1.1 Fuerza de la relación entre variables

Valor Fuerza de la relación

< 0.20 Pobre

0.21 – 0.40 Débil

0.41 – 0.60 Moderada

0.61 – 0.80 Buena

0.81 – 1.00 Muy Buena

Tabla 1.2 Significación de la relación

Valor Significación de la relación

-1 Correlación negativa perfecta

-0.5 Correlación negativa fuerte, moderada o débil

0 Ninguna correlación

+0.5 Correlación positiva fuerte, moderada o débil

+1 Correlación positiva perfecta

1.5.3.2. Análisis de regresión geográficamente ponderada

Este es un modelo de regresión local que genera una ecuación de regresión para cada

objeto dentro del conjunto de datos de la variable dependiente a fin de definir las

variaciones geográficas [21], dentro de estas regresiones que son locales, una región

es descrita alrededor de un punto de regresión y todos los otros puntos de datos

15

dentro de la región son usados para calibrar el modelo, con la particularidad de que

cada punto está ponderado por su distancia desde el punto de regresión, con lo que

los objetos más cercanos a este punto tienen mayor peso que aquellos más lejanos en

la regresión [22].

Algunas de las ventajas de la utilización del GWR son [23]:

· Permite obtener mayor grado de precisión al trasladar el análisis de una

perspectiva global a una local.

· Los coeficientes varían de una entidad espacial a otra.

· Permite conocer la forma en que se combinan localmente las variables de la

regresión para obtener el ajuste específico en una localización.

· La desagregación del coeficiente de determinación en valores locales y el

análisis de su distribución geográfica permiten reconocer donde las variables

independientes tienen un mayor o menor poder explicativo.

· La implementación de esta técnica en los sistemas de información geográfica

facilita la elaboración de mapas con los resultados generados.

· Facilita explorar la estructura espacial del modelo, de tal manera que sea

posible medir la dependencia espacial o detectar conglomerados de datos.

El modelo considera un conjunto de variables independientes “X”, y una variable

dependiente “Y” correspondiente a la sub-área “s”, definida de acuerdo a lo siguiente

[24]:

E(') =XY(')A Z [ Ecuación 1.7 Modelo de regresión geográficamente ponderada

Y(') = DA\#(')AG]OA\#(')E Ecuación 1.8 Pesos de las variables independientes en el sub-área “s”

#(') = ^#O,' _ ` __ #

16

Donde:

ε: Residual o parte no explicada de la variable dependiente.

f: Ancho de banda que determina la distancia máxima para la cual los pesos espaciales son diferentes de cero.

di,j: Distancia euclideana entre i y j.

1.5.4. Métodos de proyección de demanda

En la actualidad los métodos de proyección de demanda se han clasificado en tres

categorías de acuerdo a las bases de datos utilizadas por las diferentes metodologías

[25]:

1.5.4.1. Métodos de tendencia

Estos métodos utilizan técnicas de extrapolación para determinar la demanda máxima

futura, se basan en los datos de entrada la demanda histórica en forma de serie

temporal. Estas técnicas requieren pequeñas bases de datos para realizar la previsión

de grandes zonas donde se minimice las variaciones de cobertura, en contraparte

aportan poca información para el planificador de redes de distribución, ya que estas

técnicas no consideran las relaciones entre áreas, imposibilitando definir la inferencia

de las transferencias de carga.

1.5.4.2. Métodos simulativos

Estas técnicas utilizan diversas fuentes de datos las cuales pueden ser tanto internas

como externas a las empresas para simular la demanda futura del sistema eléctrico.

Estos métodos se pueden definir en dos tipos, el primero que utiliza la información de

usos del suelo para determinar el crecimiento de demanda y el segundo que

caracteriza el crecimiento dinámico de la carga a través de probabilidades o mapas de

preferencia, estos métodos requieran mayor cantidad de información ya que usan

bases zonificadas o geo-referenciadas para su aplicación.

1.5.4.3. Métodos Híbridos

Estas técnicas engloban las mejores características de los métodos tendenciales y

simulativos; como son: el ajuste de datos estimados que se acerca mucho al

comportamiento de la curva de demanda, la eliminación de los efectos de la

estacionalidad proporcionando resultados más confiables, que son ventajas de los

métodos tendenciales; y, una alta relación entre el crecimiento de la demanda y el

crecimiento poblacional, la estimación del tipo de consumo dentro de una micro-área,

17

la facilidad de que la relación demanda y uso del suelo se puede realizar a través de

regresión múltiple, así como también permiten la oportunidad de adicionar variables

que influyan en el comportamiento de la demanda, características que brindan los

métodos simulativos [26], la suma de estas características hacen de los métodos

híbridos los más recomendables para la realización de la proyección espacial de la

demanda eléctrica.

1.5.4.4. Método de series de tiempo

Una serie de tiempo se define como una sucesión de observaciones de una variable

referida a momentos o períodos de tiempo diferentes, los cuales por lo general se

toman de manera regular, por lo que se concluye que es una secuencia ordenada de

mediciones de una variable particular [27].

Dentro de este método se considera que la única variable independiente es el tiempo,

y con ésta se pretende identificar el patrón de comportamiento de la variable

dependiente, que permita posteriormente realizar la proyección futura de esta última.

Considerando que la demanda varía de manera aleatoria y continua durante el tiempo,

ésta puede considerarse como una serie de tiempo, por lo que se puede realizar

análisis de series temporales con los datos de demanda histórica disponible.

El modelo de una serie de tiempo está definido por cuatro componentes [26], [27]:

· Tendencia T(t): es el componente de largo plazo que define el crecimiento o

decremento de la serie en un amplio período de tiempo.

· Ciclo C(t): es una fluctuación periódica que se presenta alrededor de la

tendencia, estas tienden a repetirse cada dos o más períodos, estos patrones

son difíciles de establecer ya que los ciclos no son estables.

· Estacionalidad E(t): se define como un patrón de cambio que se repite

periódicamente, al número de períodos transcurridos entre picos consecutivos

se denomina período estacional.

· Aleatoriedad A(t): son fluctuaciones aleatorias que no responden a ningún

patrón de comportamiento, este componente irregular de la serie de tiempo es

el factor residual, toma en consideración las desviaciones en los valores reales

a la serie de tiempo.

La definición del modelo de serie temporal consiste en determinar cuáles de los

componentes anteriores deben estar incluidos, considerando que la tendencia y la

18

aleatoriedad siempre están presentes en la serie de tiempo, la estacionalidad y el ciclo

pueden o no estar presentes, como se puede observar en la Figura 1.4.

El modelo de serie de tiempo Y(t) se puede definir de tres maneras:

E(n) = !(n) Z o(n) Z ?(n) Z -(n) Ecuación 1.11 Esquema aditivo de una serie temporal

E(n) = !(n) × o(n) × ?(n) × -(n) Ecuación 1.12 Esquema multiplicativo de una serie temporal

E(n) = !(n) × o(n) × ?(n) Z -(n) Ecuación 1.13 Esquema mixto de una serie temporal

Figura 1.4 Descomposición multiplicativa de una serie de tiempo

1.5.4.4.1. Modelos ARIMA

Los modelos auto-regresivo integrado de medias móviles; ARIMA por su acrónimo en

inglés, desarrollan una metodología que combina tres procesos matemáticos: auto-

regresivo, medias móviles e integración, para datos de series de tiempo [28], de tal

manera que lo propios datos históricos de la variable determinan el futuro de la misma.

Estos son modelos del tipo estocástico y requieren como insumo series estacionarias,

por lo que en el caso de que la serie no cumpla con esto, se busca hacerlas cumplir

con este requerimiento a través de la diferenciación [29].

La elaboración del modelo ARIMA conlleva la definición de los tres procesos que

comprende cinco casos [26]:

19

Caso 1. Proceso auto-regresivo (AR): éste se basa en la premisa que una

observación depende de las observaciones anteriores, en este proceso se define que

la variable “Y” en el tiempo depende de sus valores en períodos anteriores, con los

valores de la variable expresados alrededor de la media “δ”.

Este modelo define el valor pronosticado de la variable “Y” en el período “t” como

alguna proporción “αi” de su valor en los períodos (t-i) más una perturbación “ut” en el

tiempo “t”, es decir un error aleatorio no correlacionado con media cero y varianza

constante conocido como ruido blanco, donde el número de períodos anteriores “p”,

serán los necesarios para explicar el modelo.

(pq > r) = s& tu (pq]u > r)vuNw x Z yq Ecuación 1.14 Proceso auto-regresivo de orden p, AR(p).

Caso 2. Proceso de media móvil (MA): es una combinación lineal de términos de

error con ruido blanco a los cuales se les aplican las constantes de proporción “βi”, con

el fin de determinar el modelo de “Y” en el período “t” como una constante “μ”, más un

promedio móvil de los términos de error presente y pasados, con el número de

períodos de media móvil “q”, necesarios para explicar el modelo.

En = B Z Yz{n Z&YL{n]L|LNO Ecuación 1.15 Proceso de media móvil de orden q, MA(q).

Caso 3. Proceso auto-regresivo y media móvil (ARMA): este es una combinación

de AR y MA de tal forma que tendrá “p” términos auto-regresivos y “q” términos de

media móvil, y un término constante de error aleatorio que identifica la parte no

explicada por el modelo “θ”.

En = } Z Yz{n Z&YL{n]L|LNO Z& t~ Dpq]~ > rGv~Nw

Ecuación 1.16 Proceso auto-regresivo y media móvil, ARMA(p, q).

Caso 4. Proceso auto-regresivo integrado de media móvil (ARIMA): los modelos

de los casos anteriores presuponen que las series son débilmente estacionarias; es

decir de media y varianza constantes y covarianza invariable en el tiempo; lo que

quiere decir que están integradas, una gran cantidad de series de tiempo no cumplen

20

con esta condición, es por lo que deben ser diferenciadas para conseguir esta

característica; es así que una serie de tiempo se dice I(d), si después de diferenciarla

“d” veces se obtiene una serie estacionaria I(0); al aplicar esto al modelo ARMA(p, q)

de la serie de tiempo original, se obtiene un modelo ARIMA (p, d, q), donde “p” denota

el número de términos auto-regresivos, “d” el número de veces que debe ser

diferenciada y “q” el número de términos de media móvil.

Caso 5. Modelos estacionales ARIMA (SARIMA): cuando en los modelos se trata de

series estacionales se plantea los modelos denotados con la letra S, y el orden de sus

parámetros se escribe con mayúsculas. La unión de modelos estacionales con los no

estacionales producen un modelo de gran capacidad de adaptación que refleja tanto la

tendencia como la estacionalidad, esto se logra con la multiplicación de los operadores

polinomiales que caracterizan cada modelo; ARIMA (p, d, q) x (P, D, Q).

1.5.4.5. Método de ajuste logístico

Mientras las grandes zonas de cobertura presentan crecimientos tendenciales los

cuales pueden ser analizados como series temporales, cuando se desagregan las

áreas en tamaños menores las demandas históricas van ajustándose a un

comportamiento logístico, el cual se asemeja a una curva en “S”, en la cual un

relativamente breve período de crecimiento muy rápido representa casi todo el

crecimiento de carga a largo plazo [7].

La curva S tiene tres distintas fases (ver Figura 1.5), las cuales representan períodos

de la historia de la pequeña área durante los cuales las dinámicas de crecimiento

fundamentalmente difieren en su comportamiento.

Figura 1.5 Fases de crecimiento de demanda en micro-áreas

21

· Período latente.- Es el tiempo antes de la explosión de desarrollo, cuando no

ocurren crecimientos significativos de cargas o existen ingresos de carga

esporádicos.

· Rampa de crecimiento.- Durante este período ocurre un crecimiento en un rango

relativamente rápido, debido al incremento de nuevas construcciones en la micro-

área.

· Período saturado.- La micro-área esta “llena”, completamente desarrollada

arquitectónicamente, los crecimientos pueden continuar pero en un nivel muy bajo

en comparación con el experimentado durante la rampa de crecimiento.

El modelamiento de esta curva se lo realiza a través de la función de Gompertz, la cual

identifica la curva tipo “S”, en la cual se presenta un punto de inflexión donde la curva

cambia su forma cóncava por convexa, ésta se puede definir con la Ecuación 1.17 [9].

W(U) = 1 Ecuación 1.17 Función de Gompertz

Donde:

a: asíntota superior.

c: tasa de crecimiento.

t: tiempo.

b: constante negativa.

Los términos del exponencial se pueden transformar como se indica en Ecuación 1.18.

U = >9+ (>) Ecuación 1.18 Determinación del tiempo de aceleración

Incluyendo la Ecuación 1.18, en la Ecuación 1.17, se obtiene una forma de la curva de

Gompertz, en función del límite superior que representaría la saturación de la

demanda “a” en la micro-área, la tasa de crecimiento “c”, y el tiempo de aceleración

“∆t”.

W(U) = 1]() Ecuación 1.19 Función de Gompertz para aproximar micro-áreas

22

1.5.4.6. Método de saturación del uso del suelo

Los métodos simulativos basan su aplicación en la distinción de los tipos de

consumidores, esto permite que los modelos definan las diferencias en el

comportamiento de cada tipo de cliente.

Uno de estos comportamientos es el que ubica los tipos de usuarios espacialmente;

esto debido a que los consumidores comerciales, residenciales e industriales buscan

diferentes ubicaciones dentro de una ciudad, pueblo o área rural, en patrones basados

en diferencias claras de necesidades, magnitud de demanda y comportamientos,

haciendo dichos patrones predecibles [7].

Con esta característica espacial de los usuarios se puede prever los comportamientos

futuros de cada micro-área, llamándose a este tipo de proyección “métodos de

simulación por uso del suelo”.

La saturación arquitectónica de los distintos tipos de usos del suelo lo establecen los

municipios en sus planes de desarrollo y ordenamiento territorial, manteniendo

concordancia con la historia y las necesidades futuras de la ciudad.

Con esta información se define una metodología que relacione los datos de oferta y

demanda del suelo, para transformarla en información de datos eléctricos, a fin de

determinar la máxima solicitación de demanda eléctrica que se presentará cuando se

haya completado las construcciones posibles en una micro-área.

El método para determinar la saturación de demanda por uso del suelo sigue el

proceso que se describe en las siguientes secciones.

1.5.4.6.1. Determinación del área total habilitada por micro-áreas

El área total habilitada es una cantidad en metros cuadrados totales de construcción

arquitectónica máxima que puede llegar a tener una micro-área si se utiliza todo el

terreno habilitado y el número total de pisos permitido dentro de los planes de

desarrollo y ordenamiento territorial, en cada uno de los lotes que componen la micro-

área.

El cálculo de este valor se lo realiza mediante lo siguiente:

· Se define los tipos de uso existentes en la micro-área; ver Figura 1.6,

(residenciales, comerciales, industriales, múltiple, equipamiento, etc.).

23

Figura 1.6 Tipos de usuarios por micro-área

· Mediante la intersección espacial se determina el área total por tipo de uso, por

ejemplo, como se puede observar en la Figura 1.7, el área total

correspondiente al uso “Equipamiento” de la micro-área mostrada será:

8760.98m2 + 2900.75m2 = 11661.73m2.

Figura 1.7 Área total por tipo de usuario

· De la misma manera, con la ayuda de la intersección espacial se determina el

área neta (AN), la cual corresponde al área total por tipo de uso menos la

superficie correspondiente a calles y áreas verdes (ver Figura 1.8).

24

Figura 1.8 Área neta por tipo de uso

· Se calcula el área habilitada por piso (A_habpiso) multiplicando el área neta (AN)

por el coeficiente de ocupación del suelo (COS) definido en el plan de

desarrollo y ordenamiento territorial de los municipios para cada zona (ver

Figura 1.9).

-$L' = - × o Ecuación 1.20 Área habilitada por piso

Figura 1.9 Área habilitada por piso y por tipo de uso

25

· Para el cálculo del área permitida (Aper) se multiplica el área habilitada por piso

(A_habpiso) y el número de pisos, de cada uno de los tipos de uso de la micro-

área (ver Figura 1.10).

- = -$L' × :/ Ecuación 1.21 Área permitida por cada tipo de uso

Figura 1.10 Área permitida por cada tipo de uso

· Finalmente el área total habilitada por micro-área (AT_habmicro) se determina a

través del sumatorio del área permitida de todos los tipos de uso existentes en

la micro-área.

-!$L =&-:16LL Ecuación 1.22 Área total habilitada por micro-área

1.5.4.6.2. Determinación del índice de densidad de demanda W/m2.

El factor W/m2 es un indicador cuantitativo que define las micro-áreas con mayor

densidad de demanda, mismo que se puede asociar con su aproximación a la

saturación de demanda; es decir, define entre las micro-áreas cuyo valor de demanda

sea más grande, la probabilidad de que se encuentren saturadas, considerando

aquellas que en el corto plazo no tengan posibilidad de aumento de su población,

como tampoco de modificar el uso del suelo.

26

La determinación de este factor se lo hace en función de los datos actuales de la

micro-área:

· La demanda actual de la micro-área se determina como la suma de las

demandas modeladas espacialmente de las cargas que pertenecen a la micro-

área bajo análisis (ver Figura 1.11), en caso de existir cargas importantes cuyo

ingreso esté previsto y/o se considera que éstas vayan a modificar el

comportamiento normal de la zona (cocinas de inducción, plataformas

gubernamentales, sistemas eléctricos de transporte masivo, etc.), se las debe

incluir adicionado al resultado anterior.

Figura 1.11 Demanda modelada espacialmente de las cargas de la micro-área

NE02_04_04

· El factor W/m2, se determina para la micro-área dividiendo su demanda (Dmicro)

para el área total habilitada de la misma.

# 2

27

con zonas de uso mixto, diferencia entre zonas de protección ecológica con zonas de

infraestructura permitida, etc.

De los grupos definidos se determina una muestra de micro-áreas por tipos de uso

considerando las que posean un factor W/m2 más elevado; éstas se asumen que

posiblemente se encuentren saturadas actualmente.

Para las micro-áreas que se determinaron como posiblemente saturadas, se realiza la

verificación en campo, tomando en cuenta las siguientes consideraciones:

· Las construcciones presentarán distintas alturas y cantidad de pisos, llegando

algunas de ellas pero no todas al máximo permitido dentro de los planes de

desarrollo de los municipios.

· Dentro de la micro-área existirán sectores que no presentarán posibles

crecimientos, como por ejemplo áreas reservadas, zonas protegidas, áreas

verdes, cuerpos de agua.

· Todas las construcciones de dicha área deberán ser relativamente nuevas,

considerando que las mismas en el mediano plazo no serán reformadas con el fin

de ampliarlas.

Con esto se determinarán las micro-áreas que actualmente se encuentran ya

saturadas, a fin de realizar un análisis estadístico para determinar el valor más

probable del factor W/m2 a ser tomado como base para el conjunto de micro-áreas de

características similares determinadas como grupos homogéneos.

1.5.4.6.4. Cálculo de la demanda saturada de la empresa

Los valores del factor W/m2 determinados en el punto anterior se utilizan en todas las

micro-áreas pertenecientes al grupo homogéneo al que corresponden, que no han

llegado a la saturación, de manera que al multiplicarlo por el área total habilitada por

micro-área se obtenga la demanda en estado de saturación en toda el área de servicio

de la empresa, disgregado por micro-áreas. Esto se expresa matemáticamente a

través de la Ecuación 1.24.

UL = # 2

28

un estado estable, más bien fluctúa por arriba o debajo de los niveles de saturación

[30], [31].

Este es generalmente un concepto ligado a los crecimientos poblacionales, utilizado

para definir los niveles demográficos [32], [30] o impacto en el medio ambiente [31],

[33], el cual se lo puede asociar a datos censales, los cuales brindan bancos de

información de población o vivienda, y es esta información de vivienda la que interesa

para determinar el impacto arquitectónico que se presentará a la saturación del

sistema, ya que el nivel arquitectónico o constructivo está directamente ligado a la

demanda eléctrica.

Es así que el concepto de capacidad de carga del ambiente para el análisis de la

saturación de demanda eléctrica se define como la capacidad máxima de

construcciones que se pueden edificar y habitar en un área determinada.

Para esto se considera dos grupos variables censales que se muestran en la Tabla

1.3. Esta información se encuentra en las bases de datos del Área de Planificación de

la Distribución de la EEQ, misma que es obtenida a través de la información generada

en el censo nacional de población y vivienda, cuya última versión fue realizada en el

año 2010.

Tabla 1.3 Variables censales ocupadas para determinar la capacidad de carga del

ambiente

Grupo Variable Descripción

Ocupación

de

Viviendas

Ocupada Presente (VOP) Vivienda habitada con personas presentes durante

el censo

Ocupada Ausente (VOA) Vivienda habitada sin personas presentes durante el

censo

Desocupada (VOD) Vivienda existente pero sin habitantes permanentes

durante el censo

En Construcción (VOC) Viviendas en construcción

Tipo

de

Vivienda

Casa _Villa (VPCA) Vivienda particular definitiva tipo casa o villa

Departamento (VPDE) Vivienda particular definitiva tipo departamento

Cuarto Casa (VPCU) Vivienda particular definitiva tipo cuarto

Mediagua (VPME) Vivienda particular temporal tipo mediagua

Rancho (VPRA) Vivienda particular definitiva tipo Rancho

Covacha (VPCO) Vivienda particular temporal tipo covacha

29

Grupo Variable Descripción

Choza (VPCH) Vivienda particular temporal tipo choza

Otra tipo Vivienda (VPOT) Vivienda particular temporal de otro tipo

Hotel (VCHT) Vivienda colectiva definitiva tipo hotel

Cuartel (VCCU) Vivienda colectiva definitiva tipo cuartel

Cárcel (VCCA) Vivienda colectiva definitiva tipo cárcel

Centro Acogida (VCCE) Vivienda colectiva definitiva tipo centro de acogida

Hospital (VCHO) Vivienda colectiva definitiva tipo hospital

Convento (VCCO) Vivienda colectiva definitiva tipo convento

Asilo (VCAS) Vivienda colectiva definitiva tipo asilo

Otra tipo Vivienda (VCOT) Vivienda colectiva temporal de otro tipo de vivienda

Sin Vivienda (VCSV) Hogares sin vivienda

Para la determinación de la demanda de saturación a través de la capacidad de carga

del ambiente se calculan dos factores:

· Factor de ocupación de viviendas (FOV), determina el nivel de cobertura de

habitabilidad, el cual está relacionado con la cantidad de ocupación del suelo,

identificando qué porcentaje del área está edificada y/o habitada, y cuanto falta

por edificar y/u ocupar; a la vez describe el crecimiento horizontal y en cierta

medida el crecimiento vertical de la demanda eléctrica.

= 5 Z 55 Z5 Z 5 Z 5 Ecuación 1.25 Factor de ocupación de viviendas

· Factor de ocupación definitiva (FOD), determina el índice de hogares que

habitan una vivienda definitiva; es decir, la existencia de construcciones

habitacionales que tienen poca probabilidad de ser mejoradas en el corto

plazo, este factor está íntimamente ligado al crecimiento económico de la zona,

que se relaciona con el crecimiento vertical de la demanda eléctrica.

= 5R Z 5R¡ Z 5R ¢ Z 5R£ Z 5o¤\ Z 5o ¢ Z 5o Z5o ¡ Z 5o¤ Z 5o Z 5o¥5R\ Z 5o\ Ecuación 1.26 Factor de ocupación definitiva

30

Donde:

VPT: Total de viviendas particulares

5R\ = 5R Z 5R¡ Z 5R ¢ Z 5R£ Z 5R¦¡ Z 5R Z 5R ¤ Z 5R\ Ecuación 1.27 Total de viviendas particulares

VCT: Total de viviendas colectivas

5o\ = 5o¤\ Z 5o ¢ Z 5o Z 5o ¡ Z 5o¤ Z 5o Z 5o¥ Z 5o\ Z 5o¥ Ecuación 1.28 Total de viviendas colectivas

La demanda de saturación se determina al inferir los dos factores con la demanda

presentada en el período en el cual se realizó el censo (Di).

U = L Z Ecuación 1.29 Demanda saturada por capacidad de carga del ambiente

A fin de obtener resultados confiables, se debe considerar los siguientes casos:

· Los censos se realizan en períodos de varios años y el alcance de la

saturación puede darse entre algún instante entre el año que se realizó dicho

censo y el instante de la última demanda registrada,

· La demanda de saturación no es un valor estable y puede oscilar llegando a

valores superiores al nivel de capacidad de carga del ambiente;

· O bien, durante el período de tiempo entre el censo y la última demanda

registrada puede existir cambios en la forma de utilización del suelo dentro del

área bajo análisis.

Por lo que es necesario realizar la verificación de los valores obtenidos, a fin de validar

el nivel máximo de carga posible para cada micro-área, entre los valores de demanda

medida y la demanda de saturación calculada.

UL = §¨©OªLªM(, U) Ecuación 1.30 Validación de la demanda saturada por micro-área

31

1.5.5. Criterios de validación

Los criterios de validación son mecanismos de aceptabilidad estadística de un modelo

matemático utilizado, bajo criterios de confiabilidad del modelo, discriminación entre

diferentes modelos, exactitud de la aproximación al valor verdadero, precisión en

función de la minimización de la dispersión y validación en cuanto la certeza de la

medida [29].

A lo largo de los años se han formulado diferentes criterios estadísticos que pretenden

medir la calidad relativa del modelo [26] [29], a continuación se describen los criterios

de validación utilizados en el presente trabajo.

1.5.5.1. Criterio R2

Es conocido como coeficiente de determinación muestral múltiple, es un coeficiente

estadístico descriptivo que determina la proporción de la varianza de la variable

dependiente “Y”, los valores posibles del este factor estadístico estarán entre 0 y 1.

«< = K DE¬L > EG E) « 9P > " Ecuación 1.32 Coeficiente de determinación R2ajustada

Este criterio define que un modelo matemático presenta un mejor desempeño mientras

el valor de R2ajustada se aproxime a 1.

1.5.5.2. Raíz del error cuadrático medio RMSE

Este estadístico se define como la raíz cuadrada de la media de los errores al cuadrado para un número de “n” de muestras.

32

«S? = ¯9P&DEL > E¬LG E¬LEL °MLNO

Ecuación 1.34 Porcentaje de error medio absoluto

Generalmente este estimador se utiliza en series de tiempo homogéneas e igualmente

espaciadas, puede generar problemas cuando se tienen valores de Yi muy pequeños y E¬ i grandes, debido a que esto redunda en valores MAPE muy grandes, este estadístico puede tomar valores entre 0 e infinito.

1.5.5.4. Criterio de información Akaike AIC

El estadístico AIC fue desarrollado por Hirotugo Akaike en 1974, bajo una idea de

penalizar un exceso de parámetros ajustados; éste es un estimado muestral de la

esperanza de log-verosimilitud para modelos de series temporales, mediante un

mecanismo metodológico donde los parámetros y la dimensión del modelo son

desconocidos, por lo que deben ser determinados a partir del conjunto de datos.

En el marco metodológico se define un vector “θ” con “k” número de variables

independientes, para el cual se determina un estimador de máxima verosimilitud “}¬(")” y una función de verosimilitud de las observaciones ±@}¬(")H, el estimador AIC viene dato por:

-²o(") = >Q ±@}¬(")H Z Q" Ecuación 1.35 Criterio de información Akaike

33

El objetivo de la selección de modelos mediante el criterio AIC es estimar la pérdida de

información cuando la distribución de probabilidad real es aproximada a una

distribución hipotética del modelo a ser evaluado, mediante esta consideración el

modelo seleccionado se hará a partir del mínimo valor del AIC.

1.5.6. Revisión del estado del arte

Como se explicó en 1.5.4, existen tres tipos de métodos de proyección, tendenciales,

simulativos e híbridos. El primer tipo de métodos es el que se ha estudiado más

ampliamente ya que se basan en modelos de proyección de datos que presenten

tendencias [34], entre los cuales se pueden destacar los métodos de regresión tanto

simple como múltiples, métodos econométricos, métodos basados en promedios y

suavización exponencial y métodos autoregresivos.

Oberzo [27], realiza la predicción del sistema de Lima-Sur, con la utilización del

método tendencial ARIMA, este análisis es útil para las proyecciones a nivel sistema o

grandes zonas de cobertura pero no permiten obtener la identificación espacial de los

crecimientos de demanda.

Lui y Ma [35], presentan un método simulativo que utiliza el ajuste de curvas mediante

el grado de relacional de gris, que forma parte de las teorías de lógica difusa, el cual lo

aplican para determinar similitud entre curvas, mientras que Fahiman, Erfani,

Rajasegarar y Palaniswami [36], desarrollan un trabajo en el cual se realiza un ajuste

de curvas mediante técnicas de conocimiento profundo y agrupamiento con algoritmos

k-shape; estos métodos precisan curvas de carga al nivel geo-espacial en el cual se

esté realizando el estudio, haciendo muy difícil su aplicación debido a la imposibilidad

de obtener dichas curvas para la mayoría de las empresas distribuidoras al nivel de

micro-áreas, los trabajos indicados utilizan estos métodos para pronósticos de corto

plazo. Por otro lado Sabri, Hariyante y Fitriana [37], utilizan un modelo dinámico gris,

para el pronóstico de corto plazo de la demanda eléctrica en función de las

condiciones climáticas, lo cual se enfoca en determinar variaciones del pronóstico

producido por cambios climáticos.

Chumbi y Patiño [38], presentan un modelo simulativo espacio temporal, en el cual

determinan un análisis probabilístico de la ubicación de nuevos clientes en micro-áreas

de acuerdo a un análisis de preferencias. En análisis probabilísticos se requiere gran

cantidad de información a fin de que el modelo tenga una aproximación aceptable.

Melo, Carreño y Padilha [39] [40], presentan modelos probabilísticos basados en la

utilización de multi-agentes para determinar el grado de inferencia que determinará su

34

inclusión dentro de una proyección espacial, lo cual define una visión acerca de los

impactos por un redesarrollo probable de una zona específica, pero no incluyen un

nivel límite de crecimiento de carga, el cual se puede obtener con el nivel de

saturación. Estos mismos autores [41], presentan un método que utiliza la regresión

espacial ponderada para modelar el crecimiento horizontal de demanda debido a la

extensión del área urbana de una ciudad, a través de un modelo probabilístico para

definir mapas de preferencia, en este trabajo se analiza la relación existente entre la

demanda eléctrica y variables socioeconómicas, pero al igual que los otros trabajos de

estos autores no consideran restricciones de crecimiento

Documents

ESCUELA POLITÉCNICA NACIONAL · Geo-procesamiento de información con coordenada UTM ..... 41 2.2.3.2. Generación de rutas de lectura ... 2.5.2. Simulación de saturación por capacidad