Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA ELÉCTRICA Y
ELECTRÓNICA
PROYECCIÓN ESPACIAL DE LA DEMANDA ELÉCTRICA A
MEDIANO PLAZO EN EMPRESAS DE DISTRIBUCIÓN EN EL
ECUADOR
TESIS DE GRADO PREVIO A LA OBTENCIÓN DEL TÍTULO DE MAGÍSTER EN
INGENIERÍA ELÉCTRICA EN DISTRIBUCIÓN
RICARDO ALEJANDRO DÁVILA ARIAS
ricardo.davila@en,edu,ec
DIRECTOR:
DR. FABIÁN ERNESTO PÉREZ YAULI
Quito, enero 2019
II
AVAL
Certifico que el presente trabajo fue desarrollado por Ricardo Alejandro Dávila Arias,
bajo mi supervisión.
DR. FABIÁN ERNESTO PÉREZ YAULI
DIRECTOR DEL TRABAJO DE TITULACIÓN
III
DECLARACIÓN DE AUTORÍA
Yo Ricardo Alejandro Dávila Arias, declaro bajo juramento que el trabajo aquí descrito
es de mi autoría; que no ha sido previamente presentada para ningún grado o
calificación profesional; y, que he consultado las referencias bibliográficas que se
incluyen en este documento.
A través de la presente declaración cedo mis derechos de propiedad intelectual
correspondientes a este trabajo, a la Escuela Politécnica Nacional, según lo
establecido por la Ley de Propiedad Intelectual, por su Reglamento y por la
normatividad institucional vigente.
Ricardo Alejandro Dávila Arias
IV
DEDICATORIA
El presente trabajo está dedicado a la memoria de mi padre, Jaime Alberto Atahualpa
Dávila Boada, por su amor, cariño y las enseñanzas que me convirtieron en la persona
que soy el día de hoy.
V
AGRADECIMIENTO
En primer lugar agradezco a Dios, por su amor incondicional, a mi esposa por su
apoyo y comprensión durante mis años de estudio y a mi madre por el cariño y los
consejos brindados.
VI
ÍNDICE DE CONTENIDO
1 INTRODUCCIÓN ............................................................................................................................. 1
1.1. PREGUNTA DE INVESTIGACIÓN ............................................................................................................ 2
1.2. OBJETIVO GENERAL .......................................................................................................................... 2
1.3. OBJETIVOS ESPECÍFICOS .................................................................................................................... 2
1.4. ALCANCE ........................................................................................................................................ 3
1.5. MARCO TEÓRICO ............................................................................................................................. 3
1.5.1. Información de bases de datos eléctricos........................................................................... 3 1.5.1.1. Métodos de validación de información ........................................................................................ 4 1.5.1.2. Corrección de datos eléctricos atípicos ........................................................................................ 7
1.5.2. Modelamiento espacial de demanda eléctrica .................................................................. 8 1.5.2.1. Modelamiento espacial de demanda con software de análisis técnico ....................................... 8 1.5.2.2. Modelamiento de demanda por micro-áreas .............................................................................. 9
1.5.3. Análisis de conglomerados en entidades geo-referenciales ............................................. 10 1.5.3.1. Correlación de variables ............................................................................................................. 11 1.5.3.2. Análisis de regresión geográficamente ponderada .................................................................... 14
1.5.4. Métodos de proyección de demanda ............................................................................... 16 1.5.4.1. Métodos de tendencia ............................................................................................................... 16 1.5.4.2. Métodos simulativos .................................................................................................................. 16 1.5.4.3. Métodos Híbridos ....................................................................................................................... 16 1.5.4.4. Método de series de tiempo ...................................................................................................... 17 1.5.4.5. Método de ajuste logístico ......................................................................................................... 20 1.5.4.6. Método de saturación del uso del suelo .................................................................................... 22 1.5.4.7. Método de capacidad de carga del ambiente ............................................................................ 27
1.5.5. Criterios de validación ...................................................................................................... 31 1.5.5.1. Criterio R2 ................................................................................................................................... 31 1.5.5.2. Raíz del error cuadrático medio RMSE ....................................................................................... 31 1.5.5.3. Porcentaje de error medio absoluto MAPE ................................................................................ 32 1.5.5.4. Criterio de información Akaike AIC ............................................................................................ 32
1.5.6. Revisión del estado del arte.............................................................................................. 33
2 METODOLOGÍA ............................................................................................................................ 35
2.1. DESCRIPCIÓN DEL ÁREA DE ESTUDIO ................................................................................................... 35
2.2. MANEJO DE INFORMACIÓN DE BASES DE DATOS ELÉCTRICOS ................................................................... 37
2.2.1. Información histórica de demanda eléctrica en redes primarias ..................................... 38
2.2.2. Información topológica de redes primarias ..................................................................... 39
2.2.3. Información de consumos geo-referenciados .................................................................. 41 2.2.3.1. Geo-procesamiento de información con coordenada UTM ....................................................... 41 2.2.3.2. Generación de rutas de lectura .................................................................................................. 41 2.2.3.3. Verificación de la correcta ubicación de usuarios ...................................................................... 42 2.2.3.4. Validación de las coordenadas UTM de los usuarios con la secuencia de lectura. .................... 42 2.2.3.5. Generación de base de datos geo-referenciada de consumos .................................................. 43
2.2.4. Validación de demandas históricas .................................................................................. 44
2.2.5. Corrección de demandas históricas .................................................................................. 45
2.2.6. Información de datos eléctricos relevantes ...................................................................... 47
2.2.7. Información socio-económica .......................................................................................... 47
2.3. GENERACIÓN DE ESTADÍSTICA GEO-REFERENCIADA ................................................................................ 48
2.3.1. Grilla de micro-áreas existente en la EEQ ........................................................................ 49
2.3.2. Determinación de demandas mensuales por micro-área................................................. 49 2.3.2.1. Intersección geo-espacial de datos de demanda eléctrica ......................................................... 50
VII
2.3.3. Relacionamiento de datos eléctricos y socio-económicos por micro-área ....................... 52 2.3.3.1. Intersección geo-espacial de datos socioeconómicos ................................................................ 52
2.4. ANÁLISIS DE CONGLOMERADOS DE MICRO-ÁREAS ................................................................................. 54
2.4.1. Análisis de correlación entre variables de las micro-áreas ............................................... 54
2.4.2. Análisis de regresión geográficamente ponderada en ArcGIS ......................................... 56
2.4.3. Definición de conglomerados geográficamente ponderados ........................................... 58
2.5. SIMULACIÓN DE SATURACIÓN DE DEMANDA ........................................................................................ 59
2.5.1. Simulación de saturación de uso del suelo ....................................................................... 60
2.5.2. Simulación de saturación por capacidad de carga del ambiente ..................................... 62
2.6. PROYECCIÓN ESPACIAL DE DEMANDA CON UN MÉTODO JERÁRQUICO ........................................................ 64
2.6.1. Agregación de demanda de las micro-áreas .................................................................... 64
2.6.2. Proyección de demanda por conglomerados ................................................................... 64
2.6.3. Ajuste de previsión de carga con optimización multiobjetivo .......................................... 67 2.6.3.1. Minimización de la incompatibilidad de demanda histórica ...................................................... 68 2.6.3.2. Minimización del desajuste de demanda futura ........................................................................ 69 2.6.3.3. Límite de la pendiente ................................................................................................................ 69 2.6.3.4. Límite de la rampa de tiempo .................................................................................................... 69 2.6.3.5. Función de optimización ............................................................................................................ 70
2.6.4. Algoritmo de proyección jerárquico ................................................................................. 70 2.6.4.1. Bloque de carga de datos. .......................................................................................................... 71 2.6.4.2. Bloque Proyección tendencial de conglomerados. .................................................................... 71 2.6.4.3. Bloque de optimización multiobjetivo. ...................................................................................... 72 2.6.4.4. Generación de resultados preliminares ..................................................................................... 72
2.6.5. Inclusión geo-espacial de cargas especiales futuras ........................................................ 72
2.6.6. Elección del modelo de proyección ................................................................................... 74
2.7. PROYECCIÓN DE DEMANDAS EN GRANDES ZONAS DE SERVICIO ................................................................. 75
2.7.1. Definición de grandes zonas de servicio ........................................................................... 76
2.7.2. Previsión de demanda por agregación de micro-áreas .................................................... 78
2.8. PROYECCIÓN DE DEMANDA PARA EL ÁREA DE COBERTURA DE SUBESTACIONES DE DISTRIBUCIÓN .................... 79
2.8.1. Definición de cobertura de servicio de las subestaciones de distribución ........................ 79
2.8.2. Previsión de demanda por agregación de micro-áreas .................................................... 80
2.9. AJUSTE DE DATOS DE PREVISIÓN EN NIVELES DE COBERTURA ................................................................... 81
2.9.1. Ajuste de proyección a nivel de cobertura de zonas operativas ....................................... 82
2.9.2. Ajuste de proyección a nivel de cobertura de subestaciones ........................................... 83
3 RESULTADOS Y DISCUSIÓN .......................................................................................................... 84
3.1. RESULTADOS ................................................................................................................................. 84
3.1.1. Análisis espacial de variables eléctricas y socioeconómicas ............................................ 84 3.1.1.1. Análisis de demanda histórica .................................................................................................... 84 3.1.1.2. Datos de comercialización de energía eléctrica ......................................................................... 90 3.1.1.3. Datos espaciales socio-económicos ........................................................................................... 93 3.1.1.4. Peso en la demanda de las zonas en la EEQ. .............................................................................. 96
3.1.2. Previsión de demanda por micro-áreas ............................................................................ 98
3.1.3. Previsión de demanda para zonas operativas ................................................................ 100
3.1.4. Previsión de demanda para áreas de cobertura de subestaciones de distribución ........ 107
3.1.5. Previsión de demanda en el corto, mediano y largo plazo del sistema de distribución de
medio voltaje de la EEQ ................................................................................................................... 111
3.2. DISCUSIÓN ................................................................................................................................. 113
3.2.1. Contrastación de resultados con la medición del año 2017 ........................................... 113
3.2.2. Comparación de resultados de corto, mediano y largo plazo ........................................ 114
3.2.3. Análisis de resultados finales ......................................................................................... 114
VIII
3.2.3.1. Caso 1. Obras necesarias para abastecer los crecimientos de demanda geo-espacial ............ 115 3.2.3.2. Caso 2. Obras necesarias para solventar la sobrecarga del sistema de 46kV ........................... 117 3.2.3.3. Caso 3. Obras necesarias para mejorar la calidad de producto en el sistema.......................... 118 3.2.3.4. Obras de expansión del sistema de distribución en MV .......................................................... 119
4 CONCLUSIONES ......................................................................................................................... 122
5 REFERENCIAS BIBLIOGRÁFICAS .................................................................................................. 128
6 ANEXOS ..................................................................................................................................... 131
IX
RESUMEN
En la actualidad las empresas distribuidoras del país realizan la planificación del
sistema eléctrico enfocándose a solventar los problemas de carga en redes de
subtransmisión, para lo cual utilizan proyecciones de demanda tendenciales a nivel del
sistema total de la empresa, dejando de observar el comportamiento geo-espacial de
la demanda, impidiendo determinar las zonas dentro del área de servicio donde la
densificación de la demanda eléctrica se acerca a niveles críticos.
Este problema se resuelve utilizando metodologías de proyección espacial, las cuales
deben partir de una estadística geo-referenciada sólida y validada. Dentro de las
técnicas de proyección espacial existentes, las que presenten mayores ventajas son
aquellas que utilizan métodos híbridos, de los cuales para el presente trabajo se utiliza
un método jerárquico, que utiliza la saturación del uso del suelo y la capacidad de
carga del ambiente para la etapa simulativa y optimización multiobjetivo para la
realizar el ajuste logístico en la etapa tendencial.
Dentro del algoritmo desarrollado para la aplicación de la metodología descrita, se
incluyen módulos de ajuste de la previsión de demanda para niveles de cobertura de
subestaciones y grandes zonas operativas, que vincula el comportamiento histórico
con la proyección de demanda obtenida.
A partir de los resultados obtenidos con la aplicación de la metodología propuesta al
caso de la Empresa Eléctrica Quito, es posible conseguir un ahorro de 41.6 millones
de dólares, debido a que las inversiones a realizarse dentro del plan de expansión
serían direccionadas a los sectores donde es necesario invertir en obras de
infraestructura eléctrica.
PALABRAS CLAVE: Proyección espacial de demanda, Método jerárquico,
Optimización multiobjetivo, Estadística geo-referenciada, Saturación de uso del suelo,
Capacidad de carga del ambiente.
X
ABSTRACT
Currently the distribution companies of the country carry out the planning of the
electrical system focusing the load problems in sub-transmission networks for which
they use trend demand projections at the level of the total system of the company.
When geo- spatial demand data isn’t available, not observing the geo-spatial behavior
of the demand, preventing the determination of the zones within the service area where
the densification of electrical demand approaches critical levels..
This problem is solved by using spatial projection methodologies that must be based
on solid and validated geo-referenced statistics. Among the existing spatial projection
techniques, the ones that offer the greatest advantages are those that utilize hybrid
methods. For this particular work, a hierarchical method is used, which uses the
saturation of land use and the load capacity of the environment to the simulative stage
and multiobjective optimization to perform the logistic adjustment in the trend stage.
Within the algorithm developed for the application of the described methodology, there
are modules to adjust the demand forecast for coverage levels of substations and large
operating areas, which linking the historical behavior with the demand projection
obtained.
Based on the results obtained with the application of the proposed methodology to the
case of Empresa Eléctrica Quito, it is possible to achieve savings of 41.6 million
dollars, because the investments to be made within the expansion plan would be
directed to the sectors where it is necessary to investing in electrical infrastructure
works.
KEYWORDS: Spatial projection of demand, hierarchical method, multi-objective
optimization, geo-referenced statistics, saturation of land use, load capacity of the
environment.
1
1 INTRODUCCIÓN
La previsión espacio-temporal de la demanda eléctrica es la base para el desarrollo de
la planificación de sistemas eléctricos, ya que a partir de estos datos se puede
identificar el futuro desarrollo de la red eléctrica en función de las necesidades de los
clientes de una empresa de distribución de energía eléctrica.
Dentro de las empresas de distribución del país por muchos años se ha utilizado
métodos de proyección mediante tasas de crecimiento a nivel de subestaciones de
Alto Voltaje / Medio Voltaje (AV/MV), las cuales si bien representan de una manera
muy acertada el comportamiento futuro de la demanda a nivel sistema, no permiten
identificar los sitios dentro del área de servicio donde se está densificando el uso de la
energía eléctrica, coadyuvando a que los recursos no sean invertidos de forma óptima,
en los sitios donde los usuarios, tanto actuales como futuros lo requieran.
Las tasas de crecimiento a nivel de subestación (AV/MV), no son de utilidad en la
planificación de sistemas eléctricos de distribución debido al alto grado de variación en
la topología de las redes de distribución y por consiguiente, del área servida; por lo
que para un nivel desagregado en micro-áreas el cual será mucho más pequeño que
las áreas de cobertura de subestaciones, las metodologías tendenciales no son
adecuadas, esto es provocado porque un área que estaba servida por cierto primario,
al siguiente día; por razones operativas, estará servida de otro primario u otra
subestación, provocando así distorsiones en las tasas de crecimiento tendenciales.
La falta de conocimiento de demanda geo-localizada y previsión especial de la misma,
provoca que las inversiones se direccionen a sectores donde se encuentran
facilidades constructivas, por ejemplo, la instalación de nuevas subestaciones (AV/MV)
bajo líneas de transmisión existentes, pero muy alejadas de los centros de carga,
incrementando los presupuestos y las dificultades en la construcción de alimentadores
primarios.
Para evitar estos inconvenientes se ve la necesidad de utilizar la proyección de
demanda a nivel de micro-áreas, esto considerando que los límites de cada micro-área
permanecen invariables a lo largo del tiempo, consiguiendo de esta manera determinar
el real comportamiento de la carga de forma espacial.
Con la información de previsión por micro-áreas es posible realizar un proceso de
agregación al nivel de cobertura requerido por las distintas áreas de la empresa,
2
evitando que se presenten distorsiones en los crecimientos tendenciales en cualquiera
de estos niveles de cobertura.
1.1. Pregunta de investigación
¿Cómo se puede determinar la proyección de demanda espacial eléctrica a nivel de
micro-áreas en las zonas de servicio de las empresas de distribución eléctrica en el
Ecuador?
1.2. Objetivo General
Determinar una metodología, que con la ayuda de las herramientas computacionales y
la información existentes en las bases de datos de una empresa de distribución
eléctrica del Ecuador, permita la obtención de la proyección de demanda eléctrica a
nivel de grandes zonas geográficas a utilizarse en la Planificación del Sistema de
Subtransmisión y a nivel de micro-áreas que se utilizará en la Planificación del Sistema
de Distribución.
1.3. Objetivos Específicos
Realizar la revisión bibliográfica del estado del arte referente a la previsión espacial de
demanda eléctrica.
Verificar la información existente en las bases de datos pertenecientes a una Empresa
de Distribución Eléctrica, para posteriormente cotejar su correlación con el crecimiento
de demanda eléctrica, a fin de determinar su utilidad dentro del método de proyección
de demanda propuesto.
Definir las proyecciones de demanda por micro-área a través de la aproximación de
curvas logísticas, con la ayuda de optimización multi-objetivo, tomando en
consideración las demandas actual y saturada de cada una, así como también
agrupamientos de micro-áreas con métodos de inteligencia artificial.
Determinar, en las zonas definidas para los procesos operativos, grandes áreas de
consumo homogéneo y la estadística de demandas existente para cada una, de tal
manera que se presenten comportamientos tendenciales, a fin de que la proyección de
sus demandas pueda ser analizada con modelos de predicción para series de tiempo.
Obtener la previsión de carga en el corto plazo (un año), mediano plazo (5 años) y
largo plazo (10 años), para zonas grandes de operación de la Empresa y para cada
micro-área definida dentro del sistema de información geográfico de la Empresa.
3
1.4. Alcance
Para el presente trabajo se realizará la verificación de datos existente en base de
información eléctrica de Empresas de Distribución, para lo cual se utilizará a la
Empresa Eléctrica Quito como caso de aplicación, con el fin de determinar las
variables útiles para el análisis de proyección de demanda eléctrica, luego de esta
verificación se obtendrá una base de datos de información validada misma que nos
servirá para realizar análisis de agrupamiento con el fin de determinar grupos de
micro-áreas de características homogéneas. La caracterización de las micro-áreas
será utilizada en la aplicación del ajuste logístico dentro de la etapa tendencial del
método propuesto. Para la etapa simulativa, se propondrá dos caminos, el primero
para sectores donde exista la información de los planes de uso del suelo, y otra en
zonas sin esta información, donde se utilizarán datos de censos existentes, para en
estos realizar análisis econométricos.
Por otro lado, se realizará el análisis de previsión de la demanda en grandes zonas de
servicio, mismas que serán definidas de acuerdo a los procesos operativos internos de
la empresa; como estas zonas presentan comportamientos tendenciales con ciertos
componentes de estacionalidad, se utilizarán análisis de series de tiempo para la
proyección de demanda en cada una de ellas. La validación tanto de los métodos
propuestos, como la proyección oficial de la Empresa se la realizará contrastando los
resultados obtenidos para el sistema completo, con los datos de medición de demanda
realizada en el último año.
Los resultados de las proyecciones serán generados para los niveles de cobertura y
los períodos temporales que son requeridos por el área de Planificación de la Empresa
Eléctrica Quito, esto es con un horizonte de diez años y una resolución de un año.
1.5. Marco teórico
1.5.1. Información de bases de datos eléctricos
Las empresas distribuidoras de energía eléctrica poseen información histórica
relevante para su giro del negocio, dentro de bases de datos dispersas en distintas
áreas y/o departamentos de las empresas; en la actualidad en el país esta información
no es procesada y validada, por consiguiente no se la incluye dentro de una
inteligencia de negocios “Business Intelligence” (BI) que permitiría que los datos sean
accesibles y utilizados en los diversos procesos tanto técnicos como administrativos.
Es por este motivo que para iniciar cualquier proceso que requiera información
estadística es necesario la estructuración de una base de datos que contenga toda la
4
información necesaria, corregida y validada a utilizarse en las distintas actividades que
se desarrollarán, misma que se construirá con miras a la implementación de la BI que
se manejará dentro de la empresa distribuidora.
En cuanto a la información necesaria para realizar la proyección de demanda geo-
espacial de manera adecuada, es útil para las empresas mantener históricos a un nivel
de micro-áreas, con información eléctrica tal como: demanda, consumo, número de
usuarios, inventario de equipos instalados (luminarias, transformadores); e información
socio-económica que proviene de los censos poblacionales, realizados, para el caso
del país por el Instituto Nacional de Estadísticas y Censos (INEC).
1.5.1.1. Métodos de validación de información
Toda investigación, procesamiento y definición de metodologías inicia con la
recolección de gran cantidad de información histórica que las empresas distribuidoras
mantienen dentro de sus bases de datos, la validez de esta información condiciona el
análisis estadístico y los resultados del posterior estudio a realizarse.
Frecuentemente se encuentra que las compañías presentan problemas de calidad de
información entre el 60% y el 90% de las operaciones realizadas sobre bases de datos
[1], este problema puede ahondarse debido a que actualmente las empresas toman
decisiones cada vez más basándose en BI, la cual cambia de enfoque al no ser
determinadas por el juicio subjetivo o la intuición de las directivas, sino considerando la
información obtenida de las bases y repositorios de datos.
La mala calidad de la información se debe a la presencia de datos erróneos, faltantes
y desviaciones en la medición, los cuales pueden conducir a la toma de decisiones
erradas, produciendo pérdidas de tiempo, dinero o el direccionamiento de recursos no
optimizado.
Los datos faltantes son aquellos que en un instante puntual dentro de una serie
temporal se presenta como un dato vacío; lo cual no se debe confundir con datos de
cero (0), ya que cuando hablamos de energía eléctrica este dato puede representar
que un cliente no ha consumido electricidad o en el caso de mediciones en
alimentadores primarios esto puede representar que por mantenimiento el mismo fue
transferido durante ese período; estos datos se puede clasificar en tres tipos [2]: datos
perdidos completamente al azar, datos perdidos al azar y datos perdidos no debidos al
azar, de los cuales para el propósito del presente trabajo solamente se ocuparán los
del primer tipo, ya que al hacer referencia a los datos de demanda, la falta de estos se
presentará por fallas en los equipos de medición, lo cual es un condición debida
5
completamente al azar, que está relacionada con variables o condiciones exógenas
que no se consideran dentro del estudio de previsión de demanda.
Los datos erróneos y desviaciones en la medición se agrupan dentro de los llamados
outlier, los cuales representan observaciones que son numéricamente distantes del
resto de datos [3], estas observaciones se catalogan en dos tipos: discordante cuando
aparecen de forma sorpresiva y discordante para el investigador; y contaminante que
es un error que se presenta por inferencia exógena a los datos analizados, dentro de
estas, en el presente trabajo se consideraran solamente los datos discordantes ya que
los del tipo contaminante se presentan en análisis de datos financieros, económicos,
etc., pero no por razones propias del sistema eléctrico en series temporales de
demanda o energía.
Considerando que las variables de demanda y energía están influenciadas por
factores socio-económicos y técnicos, los datos discordantes se presentan por la
influencia de intervenciones desconocidas como depresiones o incentivos económicos,
puentes vacacionales, cambios de bases, errores de medición o transcripción de
datos, etc.
Es de vital importancia identificar y corregir de ser necesario estos errores y
desviaciones en la medición. Estas situaciones se presentan por tres razones
fundamentales [4]:
1. Si los efectos son grandes pueden sesgar la estimación de los parámetros,
produciendo malas predicciones futuras.
2. Si el suceso ocurre al final de la serie temporal y estas observaciones son
utilizadas para la proyección, éstas no serán de buena calidad, incluso si los
parámetros de regresión están bien estimados.
3. Si existe la posibilidad de que estos sucesos atípicos se vuelvan a presentar en
el futuro, y se puede estimar su efecto, es posible incorporar a la proyección el
mismo y así obtener predicciones más realistas.
1.5.1.1.1. Técnicas de imputación
A fin de realizar la corrección de datos atípicos existen las llamadas técnicas de
imputación [2], las cuales son procesos mediante los cuales se reemplazan los datos
perdidos con estimaciones:
· Imputación usando la media; la cual consiste en reemplazar los datos faltantes
por la media aritmética de los datos no perdidos de la variable imputada. El uso
6
de esta técnica afecta la correlación entre la variable imputada y cualquier otra
al reducir su variabilidad, y adicionalmente al realizarla en series temporales se
debe tener cuidado al calcular la media con todos los datos, ya que al
presentar tendencias (crecientes o decrecientes), la media no representará de
una manera correcta los valores al inicio o al final de la serie, como tampoco al
presentarse índices de variación periódica muy elevada.
· Imputación Hot Deck; cuyo objeto es el de reemplazar los registros vacíos con
información de campos con información completa. Este reemplazo se lo realiza
mediante una selección aleatoria de los valores observados, la técnica consiste
en identificar características comunes en los campos con información completa
y los vacíos, y decidir los valores a imputar en los registros faltantes. La
desventaja de utilizar esta técnica radica en la posible duplicación del mismo
valor reportado muchas veces, esto ocurre cuando existen muchos datos
faltantes y pocos valores registrados. Existen diferentes técnicas de imputación
Hot Deck [5]:
o Muestreo aleatorio simple, los valores a ser imputados se extraen de
manera aleatoria.
o Secuencial, proceso en el que se analizan todos los datos, en el cual si
el primer registro es un valor faltante, se llena con el valor inicial a
imputar, y si es un registro válido se utilizará éste como valor inicial y
será utilizado para imputar el siguiente valor faltante.
o Por clase, los valores observados se escogen al azar de la clase a la
que pertenece el registro vacío; por ejemplo, si la medición faltante
corresponde a un día miércoles, el valor observado se escogerá de
entre los días miércoles con medición válida.
o Vecino más cercano, se basa en la suposición que los individuos
cercanos en el mismo entorno tienen características similares, en este
método se definen los vecindarios en función de las características de
la medición: día de la semana, mes, año, existencia de transferencias
de carga, tipo de usuarios, etc.
· Imputación por regresión, los datos faltantes son reemplazados por el valor
predicho mediante una regresión de los datos existentes de la muestra. Este
método tiene la ventaja de trabajar con la base de datos completa minimizando
así el hecho de pérdida de información, puesto que se trabaja con todos los
datos registrados.
7
1.5.1.2. Corrección de datos eléctricos atípicos
Lee Willis en Power Distribution Planning Reference Book [6] dice: “El pico de
demanda y el uso de energía dentro de un sistema de servicio de electricidad, crecen
solo por dos razones: la adición de nuevos consumidores; o nuevos usos de
electricidad, similarmente cualquier decrecimiento en demanda eléctrica es debida a
reducciones de uno o ambos factores antes nombrados”, esto quiere decir que en las
series temporales de estos dos parámetros eléctricos un valor atípico será aquel que
varíe de forma significativa las tasas de crecimiento vegetativo, es así que pueden
presentarse variaciones válidas ante la presencia de condiciones especiales, como
pueden ser: depresiones económicas, aumento de la capacidad adquisitiva de la
población, ingreso de cargas especiales y cambios en la utilización del uso del suelo,
por lo que es necesario realizar la revisión individual de los valores de medición
mensual a fin de determinar qué valores son efecto de las condiciones antes
mencionadas y cuales se catalogarán como valores incorrectos. En la Figura 1.1 se
muestra como a finales del año 2009 se presentan registros erróneos los cuales se
identifican gráficamente como un pico temporal; estos registros producen desviaciones
en la regresión obtenida con datos no validados.
Figura 1.1 Medición del primario 36B y regresión entre los años 2007 y 2011
Fuente: Sistema de información de distribución (SDi), EEQ
Otro aspecto a considerar para la corrección de las desviaciones en la medición de
demandas es la Ley de nodos de Kirchhoff, ya que las empresas distribuidoras de
manera general poseen medición en la barra de alimentación de las subestaciones y
en todos y cada uno de los primarios asociados a dicha barra, con lo cual se puede
validar los registros faltantes y los errores de recolección o tabulación de las
mediciones de alimentadores primarios; con la restricción de que dicha validación se la
8
debe realizar únicamente con mediciones coincidentes. En la Figura 1.2 se observa
como la medición de la barra de la subestación es igual a la suma de las demandas
registradas en cada alimentador primario, cumpliendo la mencionada ley.
Figura 1.2 Ley de nodos en una subestación de distribución
1.5.2. Modelamiento espacial de demanda eléctrica
Modelar la demanda eléctrica de forma espacial se refiere a definir geográficamente la
ubicación de la carga eléctrica, lo cual se hace de acuerdo al detalle de desagregación
que se requiera; donde el nivel de detalle más utilizado por las empresas de
distribución son las micro-áreas, en los cuales se recopilan los datos de consumo y
demanda de una superficie geográfica limitada e invariable en el tiempo, para
posteriormente realizar algún método de previsión de carga futura en cada micro-área,
proporcionando un pronóstico de carga que es de naturaleza geográfica [7].
Dentro de las empresas de distribución eléctrica se poseen datos de demandas
mensuales registrados a nivel de cabecera de los alimentadores primarios, los cuales
cubren varios kilómetros cuadrados, es por ello que se requiere un método de
asignación de esta demanda registrada a un nivel de desagregación inferior.
1.5.2.1. Modelamiento espacial de demanda con software de análisis técnico
Los programas computacionales de análisis técnico de redes eléctricas poseen
algoritmos de distribución de carga, así como también estos programas permiten
modelar las redes de distribución geográficamente, consiguiendo con estas dos
características del software una asignación geo-referenciada de carga.
9
En el Ecuador el Ministerio de Electricidad y Energías Renovables, homologó el
software Cymdist [8] para la realización de los análisis técnicos en las empresas
distribuidoras. En este software existe la herramienta “Distribución de carga”, misma
que asigna una porción de la demanda medida en un punto de la red eléctrica a cada
fase de cada tramo de carga existente aguas abajo de dicho punto de medición, según
los kVA conectados o los kWh consumidos.
El método de kWh consumidos, el cual es el método utilizado en el presente trabajo,
realiza la repartición de carga de acuerdo a la siguiente formulación matemática:
!"#$% =&"#$(',%) × *+' Ecuación 1.1 Consumo total del primario en la fase “k”
"#-../+(',%) = "#012% × 3"#$(',%) × *+!"#$% 4 Ecuación 1.2. Demanda activa distribuida en la carga “s” y la fase “k”
"5-6-../+(',%) = "#-../+(',%) × 78 9*:%;< > 9 Ecuación 1.3. Demanda reactiva distribuida en la carga “s” y la fase “k”
Donde:
s: Número de la carga a asignar la demanda
k: Fase de la carga “s” a asignar la demanda (A, B o C)
kWh(s,k): Consumo de la fase “k” en la carga “s”
fc: Factor de carga por tipo de carga (dato opcional)
kWdemk: Demanda activa medida del alimentador primario en la fase “k”
fpk: Factor de potencia en la fase “k” de la carga “s”
1.5.2.2. Modelamiento de demanda por micro-áreas
El primer paso del pre-procesamiento de datos es convertir datos de carga basados en
transformadores o clientes, a datos de carga basados en micro-áreas [9]. Para este fin
los software de modelamiento geográfico poseen herramientas de intersección
espacial entre entidades geo-referenciadas.
10
Esta herramienta requiere realizar un procesamiento de la información de mediciones
existentes en cabecera de los primarios para asociarlos a las micro-áreas de acuerdo
al siguiente proceso:
1. Obtención de la información de medición de las demandas.
2. Validación de la información de medición de demandas.
3. Distribución de carga en el software de análisis técnico.
4. Obtención de información de cargas geo-referenciadas; esto puede ser a nivel
de transformadores de distribución o clientes.
5. Integración de información de cargas geo-referenciadas en el sistema de
información geográfico.
6. Intersección espacial de información de cargas a nivel de micro-áreas.
1.5.3. Análisis de conglomerados en entidades geo-referenciales
El análisis de conglomerados se refiere a las técnicas de clasificación de objetos
pertenecientes a un conjunto de datos en grupos, tratando que cada uno sea lo más
homogéneo posible, y se minimice la similitud entre cada grupo [10], [11], [12], [13].
La clasificación se la realiza seleccionando el atributo apropiado y se relaciona con
una referencia cuidadosamente seleccionada; esto depende únicamente del campo
que concierne al usuario, que para el caso de entidades geo-referenciadas será la
ubicación espacial de cada objeto.
El análisis de conglomerados es un tema amplio, por lo que existen abundantes
algoritmos de agrupación de conjuntos de datos. Los métodos más utilizados implican
calcular la distancia, la densidad y el intervalo o una distribución estadística particular.
La decisión acerca del criterio de selección de algoritmos de análisis de
conglomerados es normalmente subjetiva y depende del método que mejor refleje los
propósitos de cada estudio particular [10], algunos de los algoritmos existentes en el
software de información geográfica homologado a nivel nacional [14] se describen a
continuación:
· K-Means; los parámetros iniciales de este método son la cantidad de
conglomerados y el conjunto de sus centroides, se calcula las distancias de
cada objeto a cada uno de los centroides y el elemento se asigna al
conglomerado con el que la distancia del elementos es menor, finalmente el
centroide del conglomerado al que se asignó el objeto se recalcula.
11
· Vecino más cercano; conociendo la distancia entre pares de elementos de todo
el conjunto de objetos, se determina cuales son los más próximos en cuanto a
distancia o similitud, definiendo así que estos forman parte de un grupo y no se
volverán a separar durante todo el proceso, se vuelve a calcular la distancia
entre todos los elementos considerando que el grupo ya formado es un solo
objeto, con un centroide único.
· Método de Ward; este método busca minimizar la varianza dentro de cada
grupo, para lo cual se calcula la media de todas las variables en cada
conglomerado, luego se calcula la distancia entre cada objeto para
posteriormente sumarlas, así como también la media del conglomerado,
finalmente se juntan los conglomerados que produzcan menores incrementos
en la suma de las distancias dentro de cada conglomerado, este método crea
grupos homogéneos y de tamaños similares.
· Método de clasificación de cortes naturales (Jenks) [15]; es el más popular
para la clasificación de entidades geo-referenciales, el mismo se basa en la
maximización de la varianza entre clases y, al mismo tiempo, minimizar la
varianza dentro de las clases, de esta manera los grupos de valores se
agrupan naturalmente.
· Método de clasificación por Quantiles; consiste en mantener la cantidad de
datos igualmente clasificados en grupos, el problema es que algunos datos
similares o iguales pueden clasificarse en diferentes grupos. Este método se
basa más en la subjetividad del ser humano que en los datos mismos y se
considera que transmiten poca información sobre los datos.
1.5.3.1. Correlación de variables
La correlación entre variables es una metodología estadística descriptiva, mediante la
cual se trata de estimar el nivel de relación lineal existente entre ellas, en caso de
existir correlación el objetivo es realizar predicciones para dichas variables,
considerando las limitaciones debido a las inferencias de la causa de la relación [16].
La correlación mide el grado de relación entre dos variables, lo cual gráficamente se
puede observar como la cercanía de los puntos a una recta en su respectivo diagrama
de dispersión (Ver Figura 1.3).
Figura 1.3 Diagrama de dispersión del consumo total respecto al número de clientes por micro-área y representación de la recta de tendencia
Fuente: Sistema de información comercial EEQ
El índice de relación entre variables se mide con los llamados coeficientes de
correlación, los cuales indican el grado de asociación en términos de crecimiento o
decremento de acuerdo a las siguientes consideraciones
· Positiva o directa, especifica que una variable crecerá si aumenta la otra.
· Negativa o inversa, señala que una variable present
variable aumenta.
· Nula, se da cuando no existe relación entre las variables.
1.5.3.1.1. Coeficiente de correlación de Pearson
El coeficiente de correlación de Pearson es un índice que mide de grado de
covariancia entre las variables
términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “
“μy” y varianzas “σ2x” y “σ2y”, respectivamente; la correlación está dada por
Ecuación 1.4 Cálcul
1.5.3.1.2. Coeficiente de correlación de Spearman
Este índice es un valor estadístico no paramétrico ya que a diferencia del coeficiente
de correlación de Pearson es necesario conocer la distribución de probabilidad entre
12
Diagrama de dispersión del consumo total respecto al número de clientes área y representación de la recta de tendencia lineal de los datos
Sistema de información comercial EEQ
El índice de relación entre variables se mide con los llamados coeficientes de
correlación, los cuales indican el grado de asociación en términos de crecimiento o
uerdo a las siguientes consideraciones [17]:
Positiva o directa, especifica que una variable crecerá si aumenta la otra.
Negativa o inversa, señala que una variable presentará decremento si la otra
Nula, se da cuando no existe relación entre las variables.
Coeficiente de correlación de Pearson
El coeficiente de correlación de Pearson es un índice que mide de grado de
covariancia entre las variables [18], es por ello que este coeficiente se define en
términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “
”, respectivamente; la correlación está dada por
6 = ?@(A > BC)DE > BFGHICIF Cálculo del coeficiente de correlación de Pearson
Coeficiente de correlación de Spearman
Este índice es un valor estadístico no paramétrico ya que a diferencia del coeficiente
de correlación de Pearson es necesario conocer la distribución de probabilidad entre
Diagrama de dispersión del consumo total respecto al número de clientes lineal de los datos
El índice de relación entre variables se mide con los llamados coeficientes de
correlación, los cuales indican el grado de asociación en términos de crecimiento o
Positiva o directa, especifica que una variable crecerá si aumenta la otra.
ará decremento si la otra
El coeficiente de correlación de Pearson es un índice que mide de grado de
, es por ello que este coeficiente se define en
términos de la covarianza de las variables aleatorias “X” y “Y”, cuyas medias son “μx” y
”, respectivamente; la correlación está dada por [19]:
Este índice es un valor estadístico no paramétrico ya que a diferencia del coeficiente
de correlación de Pearson es necesario conocer la distribución de probabilidad entre
13
las variables “X” y “Y”, este se puede obtener sin conocer los parámetros de dicha
distribución, esto implica que el coeficiente de correlación de Spearman es el mismo
de Pearson pero aplicado sobre las variables transformadas en rangos [16], si “rx” es el
rango de la variable “X”, “ry” es el rango de la variable “Y” y “n” es el número de rangos
definidos, se puede determinar el coeficiente de correlación de Spearman mediante la
Ecuación 1.5 [17].
6' = 9 > JK D6CL > 6FLG 9) Ecuación 1.5 Cálculo del coeficiente de correlación de Spearman
1.5.3.1.3. Coeficiente de correlación de Kendall
El coeficiente de correlación de Kendall es usado cuando se requiere determinar el
grado de relación lineal entre dos variables cuantitativas pero las mismas no siguen un
comportamiento normal; al igual que en el caso del coeficiente de correlación de
Spearman, se basa en rangos por tal motivo se requiera una definición previa de los
mismos a partir de los datos originales [16].
! = Q × (R >S)TP(P > 9) > K UVL(UVL > 9)MLNO × TP(P > 9) > K UWL(UWL > 9)MLNO Ecuación 1.6 Cálculo del coeficiente de correlación de Kendall
Donde:
P: número de veces que se incrementa Y conforme se incrementa X
M: número de veces que disminuye Y conforme se incrementa X
n: número de rangos
tx: número de observaciones empatadas en cada grupo de la variable X
ty: número de observaciones empatadas en cada grupo de la variable Y
1.5.3.1.4. Causalidad e interpretación de la correlación
La correlación entre dos variables tan solo significa que ambas comparten información,
es decir que existe o no una relación entre la variación de las variables. Pero el origen
de la información, la fuente de la variabilidad o la causa de ésta, es una cuestión que
no puede resolverse mediante recursos netamente matemáticos [18].
Esto quiere decir que el investigador debe realizar un análisis de causalidad para
determinar que una correlación entre variables tiene un significado físico, por ejemplo
14
como se observa en la Figura 1.3, el consumo total de energía aumenta mientras
aumenta el número de clientes residenciales, lo cual tiene lógica, ya que si incremento
un nuevo usuario en una zona dada, el consumo de este cliente aumentará el total de
la energía en la zona; por el contrario si se compara la variable demanda eléctrica, con
la variable referida al número de viviendas prestadas del censo poblacional, no existe
una relación física ya que es lo mismo que esta vivienda sea prestada o propia, en
ambos casos el consumo eléctrico será el mismo, y por ende que aumente o
disminuya el número de casa prestadas no influirá en la demanda eléctrica.
El nivel de relación entre variables se puede interpretar en base a sus coeficientes de
correlación, el peso de cada valor de correlación puede ser definido de acuerdo a cada
investigador, es por ello que varios autores presentan distintas tablas de valoración
[20], [17]; este peso se pueden evaluar en función de su magnitud como se muestra en
la Tabla 1.1, o en función del signo del coeficiente de la correlación Tabla 1.2.
Tabla 1.1 Fuerza de la relación entre variables
Valor Fuerza de la relación
< 0.20 Pobre
0.21 – 0.40 Débil
0.41 – 0.60 Moderada
0.61 – 0.80 Buena
0.81 – 1.00 Muy Buena
Tabla 1.2 Significación de la relación
Valor Significación de la relación
-1 Correlación negativa perfecta
-0.5 Correlación negativa fuerte, moderada o débil
0 Ninguna correlación
+0.5 Correlación positiva fuerte, moderada o débil
+1 Correlación positiva perfecta
1.5.3.2. Análisis de regresión geográficamente ponderada
Este es un modelo de regresión local que genera una ecuación de regresión para cada
objeto dentro del conjunto de datos de la variable dependiente a fin de definir las
variaciones geográficas [21], dentro de estas regresiones que son locales, una región
es descrita alrededor de un punto de regresión y todos los otros puntos de datos
15
dentro de la región son usados para calibrar el modelo, con la particularidad de que
cada punto está ponderado por su distancia desde el punto de regresión, con lo que
los objetos más cercanos a este punto tienen mayor peso que aquellos más lejanos en
la regresión [22].
Algunas de las ventajas de la utilización del GWR son [23]:
· Permite obtener mayor grado de precisión al trasladar el análisis de una
perspectiva global a una local.
· Los coeficientes varían de una entidad espacial a otra.
· Permite conocer la forma en que se combinan localmente las variables de la
regresión para obtener el ajuste específico en una localización.
· La desagregación del coeficiente de determinación en valores locales y el
análisis de su distribución geográfica permiten reconocer donde las variables
independientes tienen un mayor o menor poder explicativo.
· La implementación de esta técnica en los sistemas de información geográfica
facilita la elaboración de mapas con los resultados generados.
· Facilita explorar la estructura espacial del modelo, de tal manera que sea
posible medir la dependencia espacial o detectar conglomerados de datos.
El modelo considera un conjunto de variables independientes “X”, y una variable
dependiente “Y” correspondiente a la sub-área “s”, definida de acuerdo a lo siguiente
[24]:
E(') =XY(')A Z [ Ecuación 1.7 Modelo de regresión geográficamente ponderada
Y(') = DA\#(')AG]OA\#(')E Ecuación 1.8 Pesos de las variables independientes en el sub-área “s”
#(') = ^#O,' _ ` __ #
16
Donde:
ε: Residual o parte no explicada de la variable dependiente.
f: Ancho de banda que determina la distancia máxima para la cual los pesos espaciales son diferentes de cero.
di,j: Distancia euclideana entre i y j.
1.5.4. Métodos de proyección de demanda
En la actualidad los métodos de proyección de demanda se han clasificado en tres
categorías de acuerdo a las bases de datos utilizadas por las diferentes metodologías
[25]:
1.5.4.1. Métodos de tendencia
Estos métodos utilizan técnicas de extrapolación para determinar la demanda máxima
futura, se basan en los datos de entrada la demanda histórica en forma de serie
temporal. Estas técnicas requieren pequeñas bases de datos para realizar la previsión
de grandes zonas donde se minimice las variaciones de cobertura, en contraparte
aportan poca información para el planificador de redes de distribución, ya que estas
técnicas no consideran las relaciones entre áreas, imposibilitando definir la inferencia
de las transferencias de carga.
1.5.4.2. Métodos simulativos
Estas técnicas utilizan diversas fuentes de datos las cuales pueden ser tanto internas
como externas a las empresas para simular la demanda futura del sistema eléctrico.
Estos métodos se pueden definir en dos tipos, el primero que utiliza la información de
usos del suelo para determinar el crecimiento de demanda y el segundo que
caracteriza el crecimiento dinámico de la carga a través de probabilidades o mapas de
preferencia, estos métodos requieran mayor cantidad de información ya que usan
bases zonificadas o geo-referenciadas para su aplicación.
1.5.4.3. Métodos Híbridos
Estas técnicas engloban las mejores características de los métodos tendenciales y
simulativos; como son: el ajuste de datos estimados que se acerca mucho al
comportamiento de la curva de demanda, la eliminación de los efectos de la
estacionalidad proporcionando resultados más confiables, que son ventajas de los
métodos tendenciales; y, una alta relación entre el crecimiento de la demanda y el
crecimiento poblacional, la estimación del tipo de consumo dentro de una micro-área,
17
la facilidad de que la relación demanda y uso del suelo se puede realizar a través de
regresión múltiple, así como también permiten la oportunidad de adicionar variables
que influyan en el comportamiento de la demanda, características que brindan los
métodos simulativos [26], la suma de estas características hacen de los métodos
híbridos los más recomendables para la realización de la proyección espacial de la
demanda eléctrica.
1.5.4.4. Método de series de tiempo
Una serie de tiempo se define como una sucesión de observaciones de una variable
referida a momentos o períodos de tiempo diferentes, los cuales por lo general se
toman de manera regular, por lo que se concluye que es una secuencia ordenada de
mediciones de una variable particular [27].
Dentro de este método se considera que la única variable independiente es el tiempo,
y con ésta se pretende identificar el patrón de comportamiento de la variable
dependiente, que permita posteriormente realizar la proyección futura de esta última.
Considerando que la demanda varía de manera aleatoria y continua durante el tiempo,
ésta puede considerarse como una serie de tiempo, por lo que se puede realizar
análisis de series temporales con los datos de demanda histórica disponible.
El modelo de una serie de tiempo está definido por cuatro componentes [26], [27]:
· Tendencia T(t): es el componente de largo plazo que define el crecimiento o
decremento de la serie en un amplio período de tiempo.
· Ciclo C(t): es una fluctuación periódica que se presenta alrededor de la
tendencia, estas tienden a repetirse cada dos o más períodos, estos patrones
son difíciles de establecer ya que los ciclos no son estables.
· Estacionalidad E(t): se define como un patrón de cambio que se repite
periódicamente, al número de períodos transcurridos entre picos consecutivos
se denomina período estacional.
· Aleatoriedad A(t): son fluctuaciones aleatorias que no responden a ningún
patrón de comportamiento, este componente irregular de la serie de tiempo es
el factor residual, toma en consideración las desviaciones en los valores reales
a la serie de tiempo.
La definición del modelo de serie temporal consiste en determinar cuáles de los
componentes anteriores deben estar incluidos, considerando que la tendencia y la
18
aleatoriedad siempre están presentes en la serie de tiempo, la estacionalidad y el ciclo
pueden o no estar presentes, como se puede observar en la Figura 1.4.
El modelo de serie de tiempo Y(t) se puede definir de tres maneras:
E(n) = !(n) Z o(n) Z ?(n) Z -(n) Ecuación 1.11 Esquema aditivo de una serie temporal
E(n) = !(n) × o(n) × ?(n) × -(n) Ecuación 1.12 Esquema multiplicativo de una serie temporal
E(n) = !(n) × o(n) × ?(n) Z -(n) Ecuación 1.13 Esquema mixto de una serie temporal
Figura 1.4 Descomposición multiplicativa de una serie de tiempo
1.5.4.4.1. Modelos ARIMA
Los modelos auto-regresivo integrado de medias móviles; ARIMA por su acrónimo en
inglés, desarrollan una metodología que combina tres procesos matemáticos: auto-
regresivo, medias móviles e integración, para datos de series de tiempo [28], de tal
manera que lo propios datos históricos de la variable determinan el futuro de la misma.
Estos son modelos del tipo estocástico y requieren como insumo series estacionarias,
por lo que en el caso de que la serie no cumpla con esto, se busca hacerlas cumplir
con este requerimiento a través de la diferenciación [29].
La elaboración del modelo ARIMA conlleva la definición de los tres procesos que
comprende cinco casos [26]:
19
Caso 1. Proceso auto-regresivo (AR): éste se basa en la premisa que una
observación depende de las observaciones anteriores, en este proceso se define que
la variable “Y” en el tiempo depende de sus valores en períodos anteriores, con los
valores de la variable expresados alrededor de la media “δ”.
Este modelo define el valor pronosticado de la variable “Y” en el período “t” como
alguna proporción “αi” de su valor en los períodos (t-i) más una perturbación “ut” en el
tiempo “t”, es decir un error aleatorio no correlacionado con media cero y varianza
constante conocido como ruido blanco, donde el número de períodos anteriores “p”,
serán los necesarios para explicar el modelo.
(pq > r) = s& tu (pq]u > r)vuNw x Z yq Ecuación 1.14 Proceso auto-regresivo de orden p, AR(p).
Caso 2. Proceso de media móvil (MA): es una combinación lineal de términos de
error con ruido blanco a los cuales se les aplican las constantes de proporción “βi”, con
el fin de determinar el modelo de “Y” en el período “t” como una constante “μ”, más un
promedio móvil de los términos de error presente y pasados, con el número de
períodos de media móvil “q”, necesarios para explicar el modelo.
En = B Z Yz{n Z&YL{n]L|LNO Ecuación 1.15 Proceso de media móvil de orden q, MA(q).
Caso 3. Proceso auto-regresivo y media móvil (ARMA): este es una combinación
de AR y MA de tal forma que tendrá “p” términos auto-regresivos y “q” términos de
media móvil, y un término constante de error aleatorio que identifica la parte no
explicada por el modelo “θ”.
En = } Z Yz{n Z&YL{n]L|LNO Z& t~ Dpq]~ > rGv~Nw
Ecuación 1.16 Proceso auto-regresivo y media móvil, ARMA(p, q).
Caso 4. Proceso auto-regresivo integrado de media móvil (ARIMA): los modelos
de los casos anteriores presuponen que las series son débilmente estacionarias; es
decir de media y varianza constantes y covarianza invariable en el tiempo; lo que
quiere decir que están integradas, una gran cantidad de series de tiempo no cumplen
20
con esta condición, es por lo que deben ser diferenciadas para conseguir esta
característica; es así que una serie de tiempo se dice I(d), si después de diferenciarla
“d” veces se obtiene una serie estacionaria I(0); al aplicar esto al modelo ARMA(p, q)
de la serie de tiempo original, se obtiene un modelo ARIMA (p, d, q), donde “p” denota
el número de términos auto-regresivos, “d” el número de veces que debe ser
diferenciada y “q” el número de términos de media móvil.
Caso 5. Modelos estacionales ARIMA (SARIMA): cuando en los modelos se trata de
series estacionales se plantea los modelos denotados con la letra S, y el orden de sus
parámetros se escribe con mayúsculas. La unión de modelos estacionales con los no
estacionales producen un modelo de gran capacidad de adaptación que refleja tanto la
tendencia como la estacionalidad, esto se logra con la multiplicación de los operadores
polinomiales que caracterizan cada modelo; ARIMA (p, d, q) x (P, D, Q).
1.5.4.5. Método de ajuste logístico
Mientras las grandes zonas de cobertura presentan crecimientos tendenciales los
cuales pueden ser analizados como series temporales, cuando se desagregan las
áreas en tamaños menores las demandas históricas van ajustándose a un
comportamiento logístico, el cual se asemeja a una curva en “S”, en la cual un
relativamente breve período de crecimiento muy rápido representa casi todo el
crecimiento de carga a largo plazo [7].
La curva S tiene tres distintas fases (ver Figura 1.5), las cuales representan períodos
de la historia de la pequeña área durante los cuales las dinámicas de crecimiento
fundamentalmente difieren en su comportamiento.
Figura 1.5 Fases de crecimiento de demanda en micro-áreas
21
· Período latente.- Es el tiempo antes de la explosión de desarrollo, cuando no
ocurren crecimientos significativos de cargas o existen ingresos de carga
esporádicos.
· Rampa de crecimiento.- Durante este período ocurre un crecimiento en un rango
relativamente rápido, debido al incremento de nuevas construcciones en la micro-
área.
· Período saturado.- La micro-área esta “llena”, completamente desarrollada
arquitectónicamente, los crecimientos pueden continuar pero en un nivel muy bajo
en comparación con el experimentado durante la rampa de crecimiento.
El modelamiento de esta curva se lo realiza a través de la función de Gompertz, la cual
identifica la curva tipo “S”, en la cual se presenta un punto de inflexión donde la curva
cambia su forma cóncava por convexa, ésta se puede definir con la Ecuación 1.17 [9].
W(U) = 1 Ecuación 1.17 Función de Gompertz
Donde:
a: asíntota superior.
c: tasa de crecimiento.
t: tiempo.
b: constante negativa.
Los términos del exponencial se pueden transformar como se indica en Ecuación 1.18.
U = >9+ (>) Ecuación 1.18 Determinación del tiempo de aceleración
Incluyendo la Ecuación 1.18, en la Ecuación 1.17, se obtiene una forma de la curva de
Gompertz, en función del límite superior que representaría la saturación de la
demanda “a” en la micro-área, la tasa de crecimiento “c”, y el tiempo de aceleración
“∆t”.
W(U) = 1]() Ecuación 1.19 Función de Gompertz para aproximar micro-áreas
22
1.5.4.6. Método de saturación del uso del suelo
Los métodos simulativos basan su aplicación en la distinción de los tipos de
consumidores, esto permite que los modelos definan las diferencias en el
comportamiento de cada tipo de cliente.
Uno de estos comportamientos es el que ubica los tipos de usuarios espacialmente;
esto debido a que los consumidores comerciales, residenciales e industriales buscan
diferentes ubicaciones dentro de una ciudad, pueblo o área rural, en patrones basados
en diferencias claras de necesidades, magnitud de demanda y comportamientos,
haciendo dichos patrones predecibles [7].
Con esta característica espacial de los usuarios se puede prever los comportamientos
futuros de cada micro-área, llamándose a este tipo de proyección “métodos de
simulación por uso del suelo”.
La saturación arquitectónica de los distintos tipos de usos del suelo lo establecen los
municipios en sus planes de desarrollo y ordenamiento territorial, manteniendo
concordancia con la historia y las necesidades futuras de la ciudad.
Con esta información se define una metodología que relacione los datos de oferta y
demanda del suelo, para transformarla en información de datos eléctricos, a fin de
determinar la máxima solicitación de demanda eléctrica que se presentará cuando se
haya completado las construcciones posibles en una micro-área.
El método para determinar la saturación de demanda por uso del suelo sigue el
proceso que se describe en las siguientes secciones.
1.5.4.6.1. Determinación del área total habilitada por micro-áreas
El área total habilitada es una cantidad en metros cuadrados totales de construcción
arquitectónica máxima que puede llegar a tener una micro-área si se utiliza todo el
terreno habilitado y el número total de pisos permitido dentro de los planes de
desarrollo y ordenamiento territorial, en cada uno de los lotes que componen la micro-
área.
El cálculo de este valor se lo realiza mediante lo siguiente:
· Se define los tipos de uso existentes en la micro-área; ver Figura 1.6,
(residenciales, comerciales, industriales, múltiple, equipamiento, etc.).
23
Figura 1.6 Tipos de usuarios por micro-área
· Mediante la intersección espacial se determina el área total por tipo de uso, por
ejemplo, como se puede observar en la Figura 1.7, el área total
correspondiente al uso “Equipamiento” de la micro-área mostrada será:
8760.98m2 + 2900.75m2 = 11661.73m2.
Figura 1.7 Área total por tipo de usuario
· De la misma manera, con la ayuda de la intersección espacial se determina el
área neta (AN), la cual corresponde al área total por tipo de uso menos la
superficie correspondiente a calles y áreas verdes (ver Figura 1.8).
24
Figura 1.8 Área neta por tipo de uso
· Se calcula el área habilitada por piso (A_habpiso) multiplicando el área neta (AN)
por el coeficiente de ocupación del suelo (COS) definido en el plan de
desarrollo y ordenamiento territorial de los municipios para cada zona (ver
Figura 1.9).
-$L' = - × o Ecuación 1.20 Área habilitada por piso
Figura 1.9 Área habilitada por piso y por tipo de uso
25
· Para el cálculo del área permitida (Aper) se multiplica el área habilitada por piso
(A_habpiso) y el número de pisos, de cada uno de los tipos de uso de la micro-
área (ver Figura 1.10).
- = -$L' × :/ Ecuación 1.21 Área permitida por cada tipo de uso
Figura 1.10 Área permitida por cada tipo de uso
· Finalmente el área total habilitada por micro-área (AT_habmicro) se determina a
través del sumatorio del área permitida de todos los tipos de uso existentes en
la micro-área.
-!$L =&-:16LL Ecuación 1.22 Área total habilitada por micro-área
1.5.4.6.2. Determinación del índice de densidad de demanda W/m2.
El factor W/m2 es un indicador cuantitativo que define las micro-áreas con mayor
densidad de demanda, mismo que se puede asociar con su aproximación a la
saturación de demanda; es decir, define entre las micro-áreas cuyo valor de demanda
sea más grande, la probabilidad de que se encuentren saturadas, considerando
aquellas que en el corto plazo no tengan posibilidad de aumento de su población,
como tampoco de modificar el uso del suelo.
26
La determinación de este factor se lo hace en función de los datos actuales de la
micro-área:
· La demanda actual de la micro-área se determina como la suma de las
demandas modeladas espacialmente de las cargas que pertenecen a la micro-
área bajo análisis (ver Figura 1.11), en caso de existir cargas importantes cuyo
ingreso esté previsto y/o se considera que éstas vayan a modificar el
comportamiento normal de la zona (cocinas de inducción, plataformas
gubernamentales, sistemas eléctricos de transporte masivo, etc.), se las debe
incluir adicionado al resultado anterior.
Figura 1.11 Demanda modelada espacialmente de las cargas de la micro-área
NE02_04_04
· El factor W/m2, se determina para la micro-área dividiendo su demanda (Dmicro)
para el área total habilitada de la misma.
# 2
27
con zonas de uso mixto, diferencia entre zonas de protección ecológica con zonas de
infraestructura permitida, etc.
De los grupos definidos se determina una muestra de micro-áreas por tipos de uso
considerando las que posean un factor W/m2 más elevado; éstas se asumen que
posiblemente se encuentren saturadas actualmente.
Para las micro-áreas que se determinaron como posiblemente saturadas, se realiza la
verificación en campo, tomando en cuenta las siguientes consideraciones:
· Las construcciones presentarán distintas alturas y cantidad de pisos, llegando
algunas de ellas pero no todas al máximo permitido dentro de los planes de
desarrollo de los municipios.
· Dentro de la micro-área existirán sectores que no presentarán posibles
crecimientos, como por ejemplo áreas reservadas, zonas protegidas, áreas
verdes, cuerpos de agua.
· Todas las construcciones de dicha área deberán ser relativamente nuevas,
considerando que las mismas en el mediano plazo no serán reformadas con el fin
de ampliarlas.
Con esto se determinarán las micro-áreas que actualmente se encuentran ya
saturadas, a fin de realizar un análisis estadístico para determinar el valor más
probable del factor W/m2 a ser tomado como base para el conjunto de micro-áreas de
características similares determinadas como grupos homogéneos.
1.5.4.6.4. Cálculo de la demanda saturada de la empresa
Los valores del factor W/m2 determinados en el punto anterior se utilizan en todas las
micro-áreas pertenecientes al grupo homogéneo al que corresponden, que no han
llegado a la saturación, de manera que al multiplicarlo por el área total habilitada por
micro-área se obtenga la demanda en estado de saturación en toda el área de servicio
de la empresa, disgregado por micro-áreas. Esto se expresa matemáticamente a
través de la Ecuación 1.24.
UL = # 2
28
un estado estable, más bien fluctúa por arriba o debajo de los niveles de saturación
[30], [31].
Este es generalmente un concepto ligado a los crecimientos poblacionales, utilizado
para definir los niveles demográficos [32], [30] o impacto en el medio ambiente [31],
[33], el cual se lo puede asociar a datos censales, los cuales brindan bancos de
información de población o vivienda, y es esta información de vivienda la que interesa
para determinar el impacto arquitectónico que se presentará a la saturación del
sistema, ya que el nivel arquitectónico o constructivo está directamente ligado a la
demanda eléctrica.
Es así que el concepto de capacidad de carga del ambiente para el análisis de la
saturación de demanda eléctrica se define como la capacidad máxima de
construcciones que se pueden edificar y habitar en un área determinada.
Para esto se considera dos grupos variables censales que se muestran en la Tabla
1.3. Esta información se encuentra en las bases de datos del Área de Planificación de
la Distribución de la EEQ, misma que es obtenida a través de la información generada
en el censo nacional de población y vivienda, cuya última versión fue realizada en el
año 2010.
Tabla 1.3 Variables censales ocupadas para determinar la capacidad de carga del
ambiente
Grupo Variable Descripción
Ocupación
de
Viviendas
Ocupada Presente (VOP) Vivienda habitada con personas presentes durante
el censo
Ocupada Ausente (VOA) Vivienda habitada sin personas presentes durante el
censo
Desocupada (VOD) Vivienda existente pero sin habitantes permanentes
durante el censo
En Construcción (VOC) Viviendas en construcción
Tipo
de
Vivienda
Casa _Villa (VPCA) Vivienda particular definitiva tipo casa o villa
Departamento (VPDE) Vivienda particular definitiva tipo departamento
Cuarto Casa (VPCU) Vivienda particular definitiva tipo cuarto
Mediagua (VPME) Vivienda particular temporal tipo mediagua
Rancho (VPRA) Vivienda particular definitiva tipo Rancho
Covacha (VPCO) Vivienda particular temporal tipo covacha
29
Grupo Variable Descripción
Choza (VPCH) Vivienda particular temporal tipo choza
Otra tipo Vivienda (VPOT) Vivienda particular temporal de otro tipo
Hotel (VCHT) Vivienda colectiva definitiva tipo hotel
Cuartel (VCCU) Vivienda colectiva definitiva tipo cuartel
Cárcel (VCCA) Vivienda colectiva definitiva tipo cárcel
Centro Acogida (VCCE) Vivienda colectiva definitiva tipo centro de acogida
Hospital (VCHO) Vivienda colectiva definitiva tipo hospital
Convento (VCCO) Vivienda colectiva definitiva tipo convento
Asilo (VCAS) Vivienda colectiva definitiva tipo asilo
Otra tipo Vivienda (VCOT) Vivienda colectiva temporal de otro tipo de vivienda
Sin Vivienda (VCSV) Hogares sin vivienda
Para la determinación de la demanda de saturación a través de la capacidad de carga
del ambiente se calculan dos factores:
· Factor de ocupación de viviendas (FOV), determina el nivel de cobertura de
habitabilidad, el cual está relacionado con la cantidad de ocupación del suelo,
identificando qué porcentaje del área está edificada y/o habitada, y cuanto falta
por edificar y/u ocupar; a la vez describe el crecimiento horizontal y en cierta
medida el crecimiento vertical de la demanda eléctrica.
= 5 Z 55 Z5 Z 5 Z 5 Ecuación 1.25 Factor de ocupación de viviendas
· Factor de ocupación definitiva (FOD), determina el índice de hogares que
habitan una vivienda definitiva; es decir, la existencia de construcciones
habitacionales que tienen poca probabilidad de ser mejoradas en el corto
plazo, este factor está íntimamente ligado al crecimiento económico de la zona,
que se relaciona con el crecimiento vertical de la demanda eléctrica.
= 5R Z 5R¡ Z 5R ¢ Z 5R£ Z 5o¤\ Z 5o ¢ Z 5o Z5o ¡ Z 5o¤ Z 5o Z 5o¥5R\ Z 5o\ Ecuación 1.26 Factor de ocupación definitiva
30
Donde:
VPT: Total de viviendas particulares
5R\ = 5R Z 5R¡ Z 5R ¢ Z 5R£ Z 5R¦¡ Z 5R Z 5R ¤ Z 5R\ Ecuación 1.27 Total de viviendas particulares
VCT: Total de viviendas colectivas
5o\ = 5o¤\ Z 5o ¢ Z 5o Z 5o ¡ Z 5o¤ Z 5o Z 5o¥ Z 5o\ Z 5o¥ Ecuación 1.28 Total de viviendas colectivas
La demanda de saturación se determina al inferir los dos factores con la demanda
presentada en el período en el cual se realizó el censo (Di).
U = L Z Ecuación 1.29 Demanda saturada por capacidad de carga del ambiente
A fin de obtener resultados confiables, se debe considerar los siguientes casos:
· Los censos se realizan en períodos de varios años y el alcance de la
saturación puede darse entre algún instante entre el año que se realizó dicho
censo y el instante de la última demanda registrada,
· La demanda de saturación no es un valor estable y puede oscilar llegando a
valores superiores al nivel de capacidad de carga del ambiente;
· O bien, durante el período de tiempo entre el censo y la última demanda
registrada puede existir cambios en la forma de utilización del suelo dentro del
área bajo análisis.
Por lo que es necesario realizar la verificación de los valores obtenidos, a fin de validar
el nivel máximo de carga posible para cada micro-área, entre los valores de demanda
medida y la demanda de saturación calculada.
UL = §¨©OªLªM(, U) Ecuación 1.30 Validación de la demanda saturada por micro-área
31
1.5.5. Criterios de validación
Los criterios de validación son mecanismos de aceptabilidad estadística de un modelo
matemático utilizado, bajo criterios de confiabilidad del modelo, discriminación entre
diferentes modelos, exactitud de la aproximación al valor verdadero, precisión en
función de la minimización de la dispersión y validación en cuanto la certeza de la
medida [29].
A lo largo de los años se han formulado diferentes criterios estadísticos que pretenden
medir la calidad relativa del modelo [26] [29], a continuación se describen los criterios
de validación utilizados en el presente trabajo.
1.5.5.1. Criterio R2
Es conocido como coeficiente de determinación muestral múltiple, es un coeficiente
estadístico descriptivo que determina la proporción de la varianza de la variable
dependiente “Y”, los valores posibles del este factor estadístico estarán entre 0 y 1.
«< = K DE¬L > EG E) « 9P > " Ecuación 1.32 Coeficiente de determinación R2ajustada
Este criterio define que un modelo matemático presenta un mejor desempeño mientras
el valor de R2ajustada se aproxime a 1.
1.5.5.2. Raíz del error cuadrático medio RMSE
Este estadístico se define como la raíz cuadrada de la media de los errores al cuadrado para un número de “n” de muestras.
32
«S? = ¯9P&DEL > E¬LG E¬LEL °MLNO
Ecuación 1.34 Porcentaje de error medio absoluto
Generalmente este estimador se utiliza en series de tiempo homogéneas e igualmente
espaciadas, puede generar problemas cuando se tienen valores de Yi muy pequeños y E¬ i grandes, debido a que esto redunda en valores MAPE muy grandes, este estadístico puede tomar valores entre 0 e infinito.
1.5.5.4. Criterio de información Akaike AIC
El estadístico AIC fue desarrollado por Hirotugo Akaike en 1974, bajo una idea de
penalizar un exceso de parámetros ajustados; éste es un estimado muestral de la
esperanza de log-verosimilitud para modelos de series temporales, mediante un
mecanismo metodológico donde los parámetros y la dimensión del modelo son
desconocidos, por lo que deben ser determinados a partir del conjunto de datos.
En el marco metodológico se define un vector “θ” con “k” número de variables
independientes, para el cual se determina un estimador de máxima verosimilitud “}¬(")” y una función de verosimilitud de las observaciones ±@}¬(")H, el estimador AIC viene dato por:
-²o(") = >Q ±@}¬(")H Z Q" Ecuación 1.35 Criterio de información Akaike
33
El objetivo de la selección de modelos mediante el criterio AIC es estimar la pérdida de
información cuando la distribución de probabilidad real es aproximada a una
distribución hipotética del modelo a ser evaluado, mediante esta consideración el
modelo seleccionado se hará a partir del mínimo valor del AIC.
1.5.6. Revisión del estado del arte
Como se explicó en 1.5.4, existen tres tipos de métodos de proyección, tendenciales,
simulativos e híbridos. El primer tipo de métodos es el que se ha estudiado más
ampliamente ya que se basan en modelos de proyección de datos que presenten
tendencias [34], entre los cuales se pueden destacar los métodos de regresión tanto
simple como múltiples, métodos econométricos, métodos basados en promedios y
suavización exponencial y métodos autoregresivos.
Oberzo [27], realiza la predicción del sistema de Lima-Sur, con la utilización del
método tendencial ARIMA, este análisis es útil para las proyecciones a nivel sistema o
grandes zonas de cobertura pero no permiten obtener la identificación espacial de los
crecimientos de demanda.
Lui y Ma [35], presentan un método simulativo que utiliza el ajuste de curvas mediante
el grado de relacional de gris, que forma parte de las teorías de lógica difusa, el cual lo
aplican para determinar similitud entre curvas, mientras que Fahiman, Erfani,
Rajasegarar y Palaniswami [36], desarrollan un trabajo en el cual se realiza un ajuste
de curvas mediante técnicas de conocimiento profundo y agrupamiento con algoritmos
k-shape; estos métodos precisan curvas de carga al nivel geo-espacial en el cual se
esté realizando el estudio, haciendo muy difícil su aplicación debido a la imposibilidad
de obtener dichas curvas para la mayoría de las empresas distribuidoras al nivel de
micro-áreas, los trabajos indicados utilizan estos métodos para pronósticos de corto
plazo. Por otro lado Sabri, Hariyante y Fitriana [37], utilizan un modelo dinámico gris,
para el pronóstico de corto plazo de la demanda eléctrica en función de las
condiciones climáticas, lo cual se enfoca en determinar variaciones del pronóstico
producido por cambios climáticos.
Chumbi y Patiño [38], presentan un modelo simulativo espacio temporal, en el cual
determinan un análisis probabilístico de la ubicación de nuevos clientes en micro-áreas
de acuerdo a un análisis de preferencias. En análisis probabilísticos se requiere gran
cantidad de información a fin de que el modelo tenga una aproximación aceptable.
Melo, Carreño y Padilha [39] [40], presentan modelos probabilísticos basados en la
utilización de multi-agentes para determinar el grado de inferencia que determinará su
34
inclusión dentro de una proyección espacial, lo cual define una visión acerca de los
impactos por un redesarrollo probable de una zona específica, pero no incluyen un
nivel límite de crecimiento de carga, el cual se puede obtener con el nivel de
saturación. Estos mismos autores [41], presentan un método que utiliza la regresión
espacial ponderada para modelar el crecimiento horizontal de demanda debido a la
extensión del área urbana de una ciudad, a través de un modelo probabilístico para
definir mapas de preferencia, en este trabajo se analiza la relación existente entre la
demanda eléctrica y variables socioeconómicas, pero al igual que los otros trabajos de
estos autores no consideran restricciones de crecimiento