Download pdf - Self Similarity

Transcript
  • 1Auto-similaridad

    Ivn Bernal, [email protected]

    Quito Ecuador

    Copyright @2010, I. Bernal

    AgendaAgenda

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 22

  • 2BibliografaBibliografaBibliografaBibliografa Kihong Park, Walter Willinger, Self-Similar Network Traffic and

    Performance Evaluation, 2000 John Wiley & Sons, Inc.

    Marco Aurelio Alzate Monroy Introduccin al Trfico AutosimilarMarco Aurelio Alzate Monroy, Introduccin al Trfico Autosimilaren Redes de Comunicaciones, Revista INGENIERIA, Universidad Distrital, 2001, Vol. 6(2), pp. 6 - 17

    Carey Williamson, Network Traffic Self-Similarity, Department of Computer Science, University of Calgary (presentacin).

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    p , y g y (p )

    33

    IntroduccinIntroduccinIntroduccinIntroduccin Originalmente se consideraban como secuencias de variables independientes:

    Los tiempos entre llegadas de las demandas de los usuarios.De igual manera las cantidades representativas de la demanda:

    Duracin de las llamadas Longitud de los paquetes Tamao de los archivos etc Tamao de los archivos, etc.

    Posteriormente se vio que la correlacin existente entre estas variables era tan importante que se desarrollaron nuevos modelos ms elaborados en los que la correlacin decaa exponencialmente con el tiempo.

    Recientemente se ha evidenciado que en las redes modernas de comunicaciones, la correlacin entre estas variables no decae tan rpidamente y puede persistir a travs de

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    correlacin entre estas variables no decae tan rpidamente y puede persistir a travs de muchas escalas de tiempo. Este fenmeno, que afecta significativamente el desempeo de las redes de comunicaciones, se puede

    representar adecuadamente mediante modelos de trfico fractal o auto-similar.

    44

  • 3IntroduccinIntroduccinIntroduccinIntroduccin El trabajo seminal que condujo a considerar la auto-similaridad una nocin importante en el

    entendimiento del trfico de redes fue el de Leland, Taqqu, Willinger and Wilson [1992-1994].Estudio basado en mediciones que indic que trfico agregado de una LAN Ethernet es self-

    similar.

    Se recolectaron trazas de gran longitud de LANs Ethernet en Bellcore.g g Estampillas de tiempo de alta resolucin. Se analizaron las propiedades estadsticas de las series de tiempo obtenidas.

    Incluyendo el Modelamiento y anlisis del performance de redes.Se deben revisar los esquemas de asignacin de recursos, control de congestin y dimensionamiento

    de redes a la luz de este fenmeno observado en el trfico de las redes de comunicaciones

    Desafortunadamente, el fenmeno de la autosimilaridad puede conducir a estructuras complejas de correlacin en las que la variabilidad se extiende a muchas escalas de tiempo, invalidando las tcnicas

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    de control diseadas para los modelos tradicionales de trfico.

    El paradigma que se ha mantenido por mucho tiempo en la comunidad de comunicaciones y performance de redes ha sido que el trfico de voz y, por extensin, el trfico de datos son descritos adecuadamente con ciertos modelos Markovianos (es decir de Poisson).

    55

    ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Trfico: la medida de la demanda que los usuarios de una red de

    comunicaciones imponen sobre los recursos de la red

    Modelos matemticos del comportamiento de los usuarios:Se representan los patrones de llegada de las demandas que los usuarios:

    Las demandas se pueden medir en trminos de paquetes, celdas, llamadas, flujos, conexiones, bits, o cualquier otra unidad de informacin adecuada.

    Los patrones de llegada se representan mediante alguna secuencia de tiempo que los identifique:9 Los instantes de llegada, {Tn, n Z}, o 9 El nmero de llegadas hasta el instante t, {N(t), t R}, o 9 La secuencia de tiempo entre llegadas, {An, n Z}, etc.

    P t t i t i d l i f t

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Por supuesto, como estas secuencias son representaciones del mismo fenmeno, se encuentran ntimamente relacionadas entre s:

    66

  • 4ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:La Figura 1(a) muestra un minuto de dos secuencias del tipo {N(t), t R}.

    Se trata de la llegada de paquetes de voz y datos en una red local con servicios integrados de voz y datos.y

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 77

    ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:Las Figuras 1(b) y 1(c) muestran los primeros cuatro segundos de las

    correspondientes secuencias del tipo {Tn, n Z}.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 88

  • 5ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:

    Se observa claramente la impredectibilidad de las secuencias, lo que obliga a modelar las series de tiempo {Tn, n Z}, {N(t), t R} o {An, n Z}, como realizaciones de procesos estocsticos.

    Los correspondientes modelos estocsticos deben capturar las principales caractersticas estadsticas del trfico en cuanto a su impacto en el desempeo de las redes. As:

    9 L ll d d t d d t d l Fi 1( ) d d l i l d9 Las llegadas de paquetes de datos de la Figura 1(c) pueden modelarse como un simple proceso de Poisson con una intensidad adecuada.

    9 Las llegadas de paquetes de voz de la Figura 1(b) debern modelarse mediante un proceso que tenga en cuenta la correlacin entre las llegadas impuesta por los intervalos de actividad e inactividad del usuario.

    Este simple ejemplo ilustra, la necesidad de desarrollar distintos

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 99

    desarrollar distintos modelos de trfico para diferentes tipos de servicio.

    ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:

    Desde los comienzos de la telefona hasta inicio de los 80s se consider que la llegada de llamadas a una central telefnica obedeca a un proceso de Poisson y que la duracin de las llamadas estaba exponencialmente distribuida, con total independencia entre llamadasindependencia entre llamadas.

    Estas suposiciones resultaron ampliamente validadas por las mediciones reales de trfico. Permitieron desarrollar mtodos de diseo para asegurar una calidad de servicio dada.

    9 Probabilidad de bloqueo. En un proceso de Poisson las llegadas se producen a intervalos exponencialmente distribuidos con

    total independencia entre ellos.

    Esta total independencia hace que la aplicacin de este modelo resulte muy fcil en

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Esta total independencia hace que la aplicacin de este modelo resulte muy fcil en anlisis de desempeo y diseo de redes de comunicaciones.

    El xito de este modelo en redes telefnicas motiv su aplicacin al trfico de datos durante los 70s, con igual xito a pesar de que las predicciones del modelo no resultaban tan exactas.

    9 La medida de la QoS era una sola para todos los usuarios: el retardo promedio9 Resultaba fcil desarrollar mtodos de diseo para asegurar una QoS dada.

    1010

  • 6ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:Con el aumento de las capacidades de transmisin de los enlaces, adems de

    la voz y los datos surgieron nuevos tipos de servicio como imgenes y video, los cuales empezaron a integrarse en una misma red de comunicacioneslos cuales empezaron a integrarse en una misma red de comunicaciones. El modelo de Poisson para estos nuevos tipos de trfico resulta invlido, dado que no

    puede esperarse independencia entre los tiempos entre llegadas.

    A partir de los 80s se han venido desarrollando nuevos modelos de trfico que tienen en cuenta esta correlacin entre tiempos de llegada. El proceso de llegada de paquetes de voz de la Figura 1(b), por ejemplo, podra

    modelarse mediante un Proceso Determinstico Markovianamente Modulado (MMDP):

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    ( )

    9El abonado transita de activo a inactivo de acuerdo con una cadena de Markov de dos estados:En el estado activo genera paquetes a una tasa constante.En el estado inactivo no genera paquetes.

    1111

    ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:

    Proceso de Poisson Markovianamente Modulado (MMPP). La figura muestra el trfico sobre una red LAN con datos interactivos permanentes y sesiones espordicas de

    transferencia de archivos.

    Este trfico compuesto se podra modelar mediante una cadena de Markov de dos estados:9 En cada estado, la llegada forma un proceso de Poisson con distinta intensidad, por lo que se trata de un

    MMPP.

    9 Estos tipos de modelos capturan mucha de la correlacin entre llegadas que impacta el desempeo de la red y cuyo efecto no se observa con el modelo de Poisson.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 1212

  • 7ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:

    Proceso de Poisson Markovianamente Modulado (MMPP). Los modelos MMPP han sido especialmente tiles en el modelamiento de trfico de video con tasa

    variable de bits, como MPEG2.

    9 L t i i t ti d t I P B tit d d M k d9 La transicin entre tipos de tramas I, P y B constituye una cadena de Markov, cada una con su respectiva tasa promedio de llegadas tipo Poisson.

    Otros modelos recientes incluyen:Modelos de flujo continuo, tiles en aquellos casos en los que cada unidad de informacin (celda,

    paquete, bit, etc.) representa una carga infinitesimal para la capacidad de los medios de transmisin.

    Modelos autoregresivos en los que el nmero de paquetes que llegan en un intervalo de tiempo dado se puede predecir a partir de una combinacin lineal del nmero de llegadas en los anteriores k intervalos.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Todos estos modelos recientes permiten capturar la correlacin existente entre llegadas de paquetes a corto plazo.

    Esto es, al calcular la autocovarianza de los procesos estocsticos correspondientes se encuentra que la velocidad a la que esta decae en el tiempo es exponencial:

    1313

    ModelamientoModelamiento de trficode trficoModelamientoModelamiento de trficode trfico Modelos matemticos del comportamiento de los usuarios:Sin embargo, mediciones y estudios recientes han demostrado que la

    autocorrelacin en muchas trazas de trfico reales decae de una manera hiperblica con el tiempo:hiperblica con el tiempo:El nmero de llegadas por segundo en un instante no slo depende de lo que pas hace

    unas milsimas de segundo sino tambin de lo que pas hace unos segundos e, inclusive, hace algunos miles de segundos [K. Park and W. Willinger].

    Los modelos de trfico autosimilar se han desarrollado precisamente para poder capturar los efectos de este fenmeno, que se report por primera vez en 1994 [Leland, Taqqu, Willinger y Wilson].

    H d l t i il id d id t f d t l d

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Hoy en da la autosimilaridad se considera un concepto fundamental para comprender :9 La naturaleza dinmica del trfico9 El desempeo de las redes9 Los procedimientos de control de trfico que buscan proporcionar una calidad de servicio

    dada.

    1414

  • 8IntroduccinIntroduccinIntroduccinIntroduccin Caractersticas de los Procesos Markovianos

    Para anlisis y control de desempeo en redes de comunicaciones es importante tener en cuenta cmo se comportan los procesos de trfico frente a la re-escalamiento , ya que el almacenamiento de paquetes en buffers y, hasta cierto grado, la asignacin de ancho de banda a flujos de paquetes se pueden considerar como operaciones sobre el proceso re-escalado.

    Re-escalamiento es la observacin de los fenmenos de trfico a diferentes escalas de tiempo. Anlisis exactos:

    Los anlisis markovianos permiten encontrar lmites exactos en condiciones de equilibrio para variables como el tiempo de espera en varios sistemas de colas.

    Control eficiente Por la simple estructura de correlacin generada por las fuentes Markovianas.

    9 Si los proceso markovianos son re-escalados apropiadamente en el tiempo, los procesos resultantes rpidamente pierden dependencia, asumiendo las propiedades de una secuencia de variables aleatorias IID (Independent and Identically Distributed, independientes e idnticamente distribuidas);

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Principalmente la propiedad de la poca ocurrencia de eventos raros (por ejemplo que las llegadas de paquetes se concentren) tiene una probabilidad exponencialmente pequea

    Esto hizo incrementar el optimismo a fines de los 80s e inicios de los 90s de emplear los Procesos Markovianos en lo que se refiere a la factibilidad de conseguir un control de trfico eficiente para el aprovisionamiento de QoS.

    1515

    IntroduccinIntroduccinIntroduccinIntroduccin Caractersticas de los Procesos Markovianos

    El comportamiento de los procesos Markovianos se explica por la poca correlacin entre eventos que se suceden relativamente separados en el tiempo.

    En cambio, si un proceso autosimilar se re-escala en el tiempo, los fenmenos de variabilidad persistirn de una escala de tiempo a otra (invarianzainvarianza a la escalamientoa la escalamiento).El descubrimiento, la formulacin sucinta y el reconocimiento de que el trfico de datos podra no

    exhibir las propiedades de escalamiento mencionadas ha influenciado significativamente la necesidad de re-examinar algunas de las premisas fundamentales.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 1616

  • 9IntroduccinIntroduccinIntroduccinIntroduccin Qu es la auto-similaridad (self-similarity)?

    Auto-similaridad y fractales son conceptos introducidos por Benoit Mandelbrot. Describen el fenmeno en el cual cierta propiedad de una objeto se preserva con respecto al

    escalamiento en espacio y/o tiempo.

    Si bj t t i il f t l t d ifi l f d l Si un objeto es auto-similar o fractal, sus partes, cuando se magnifican, se parecen a la forma del todo, donde la semejanza se mide en algn sentido adecuado

    Ejemplo: El conjunto del cantor en 2D definido en A=[0,1]x[0,1] se obtiene:9 Se empieza con un cuadrado slido de una unidad.9 Se escala el tamao del cuadrado en un 1/3 y colocando cuatro copias del cuadrado escalado en la cuatro

    esquinas de A.

    9 Si el mismo proceso de escalamiento y traslacin se aplica recursivamente a los objetos resultantes hasta el infinito, el conjunto lmite que se alcance define el conjunto de Cantor en 2D.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 1717

    IntroduccinIntroduccinIntroduccinIntroduccin Qu es la auto-similaridad (self-similarity)?

    Otro ejemplo de fractales es el Copo de Nieve de Von Koch. Se construye dividiendo cada lnea en tres segmentos iguales y remplazando el segmento de la mitad

    por dos segmentos iguales, como en un tringulo equiltero.

    Si el procedimiento se repite para cada nuevo segmento indefinidamente cualquier pequea porcin Si el procedimiento se repite para cada nuevo segmento indefinidamente, cualquier pequea porcin de la curva de Von Koch puede magnificarse para reproducir, exactamente, una porcin mayor.

    9 Esta propiedad se conoce como Autosimilaridad exacta.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 1818

  • 10

    Dimensin fractalDimensin fractalDimensin fractalDimensin fractal La dimensin fractal, D, es una generalizacin de la dimensin euclideana (DE).

    Si partimos de un segmento de longitud 1, y se lo divide en segmentos de longitud L obtendremos N(L) partes, de manera que:

    Cualquiera que sea LSi el objeto inicial es un cuadrado de superficie 1, y se lo compara con unidades

    cuadradas, cuyo lado tenga longitud L, el nmero de unidades N(L) que es necesario para cubrirlo es:

    Cualquiera que sea L

    Si, por ltimo, el objeto que se toma es tridimensional, por ejemplo, un cubo de volumen 1, y lo medimos en relacin con unidades que sean cubos de lado L:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    volumen 1, y lo medimos en relacin con unidades que sean cubos de lado L: Cualquiera que sea L

    1919

    Dimensin fractalDimensin fractalDimensin fractalDimensin fractal La dimensin fractal de un objeto geomtrico (D):

    N(L).L^D = 1N(L) es el nmero de objetos elementales, o de unidades, de tamao L que cubren el

    objeto.

    Despejando D:D= log (N(L))/log(1/L)

    Dimensiones del conjunto de Cantor D= log(2)/log(3) = 0.6309...

    Dimensiones de la curva de Koch D = log(4)/log(3) = 1.2618...

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Sin embargo se suele aceptar, e incluso definir, que un objeto es fractal solo cuando su dimensin fractal es mayor que su dimensin euclidea: D>DEAs por ejemplo no se considera fractal al conjunto de Cantor.

    2020

  • 11

    Dimensin fractalDimensin fractalDimensin fractalDimensin fractal Obsrvese que un segmento de lnea es un objeto unidimensional autosimilar pues puede

    dividirse en N segmentos idnticos, cada uno de ellos escalado por el factor r = N-1.

    Igualmente, un cuadrado es un objeto bidimensional autosimilar pues puede dividirse en N cuadrados idnticos donde el lado de cada uno de ellos se ha escalado por un factor rN cuadrados idnticos, donde el lado de cada uno de ellos se ha escalado por un factor r = N-1/2.

    Finalmente, un cubo es un objeto tridimensional autosimilar que puede dividirse en N cubos idnticos, donde el lado de cada uno de ellos se ha escalado por un factor r = N-1/3

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2121

    Dimensin fractalDimensin fractalDimensin fractalDimensin fractal

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2222

  • 12

    IntroduccinIntroduccinIntroduccinIntroduccin Qu es la auto-similaridad (self-similarity)?

    El objeto lmite tiene la propiedad de que si cualquiera de sus esquinas es magnificada adecuadamente, sta es similar a la forma del todo, es decir es auto-similar.

    No es sorprendente dado el proceso de construccin es recursivo (scale invariance property).

    Para el caso del conjunto Cantor 1D:Puede visualizarse como la proyeccin del conjunto de Cantor en 2D en una lnea.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2323

    IntroduccinIntroduccinIntroduccinIntroduccin Para el caso del conjunto de Cantor en 1D:

    Se le puede dar la siguiente interpretacin: una serie de trfico en la que X(t)=1 significa que hay la transmisin de un paquete al tiempo t.

    Si el proceso de construccin se termina en la iteracin n>=0, los segmentos contiguos de longitud 1/3 pueden interpretarse como periodos ON o trenes de paquetes de d i 1/3duracin 1/3.

    Los segmentos entre periodos ON sucesivos se consideran como periodos OFF (o ausencia de actividad de trfico).

    Intensidades de trfico no uniformes se obtienen generalizando el proceso de construccin introduciendo medidas de probabilidad.

    En lugar de hacer que los componentes izquierdo y derecho, luego del escalamiento, tengan la misma masa, se les puede asignar diferentes masas.

    La restriccin es que se preserve la masa total en cada etapa de la construccin iterativa.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Esta modificacin requiere la definicin de una medida de probabilidad y distribuyendo la medida en cada iteracin de forma no uniforme a la izquierda y derecha.

    La siguiente figura muestra una construccin con pesos para los componentes izquierdo y derecho, respectivamente.

    La medida de probabilidad es representada por altura La invarianza de escala se preserva

    2424

  • 13

    IntroduccinIntroduccinIntroduccinIntroduccin

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2525

    IntroduccinIntroduccinIntroduccinIntroduccin Para el caso del conjunto de Cantor en 1D:En general, los patrones de trfico producidos con pesos fijos son

    limitados, pero puede extenderse la idea usando diferentes pesos asociados con cada extremocon cada extremo.

    En la figura anterior, las partes izquierda y central se les dio la interpretacin de actividad de trfico por unidad de tiempo.

    Es til considerar los procesos acumulativos correspondientes, que sern siempre monotnicos.Revisando la figura de la parte izquierda, se puede asumir que el tiempo es discreto y

    0 ( l i i ) i

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    que para n>=0 (n reps la iteracin), se tiene que

    Se puede indexar el tiempo discreto como por lo que si y solo si en el proceso original [X(t)] se tiene que para todo

    Es decir que para valores de i para los cuales un periodo ON en el proceso original X(t) empieza en , X(i) es 0.

    2626

  • 14

    IntroduccinIntroduccinIntroduccinIntroduccin Para el caso del conjunto de Cantor un 1D:Para n=2Ahora considerando el proceso continuo Y(t) (figura anterior, parte

    d h ) d fi id l it iderecha), definida en , para la iteracin n.Y(t) es no monotnica y continua.Por inspeccin visual:Y(t) representa el volumen de trfico total hasta el tiempo t.

    9La auto-similaridad se preserva incluso en el proceso acumulativo.Esto es de mayor relevancia para el modelamiento de trfico. Se heredan algunas de las propiedades, incluyendo la auto-similaridad.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    X(i) representa la intensidad de trfico durante el intervalo i-simo.Una deficiencia de las construcciones utilizadas es que tienen una forma de

    regularidad recursiva (auto-similaridad determinstica).Para su uso en modelamiento de trfico se debe generalizar para incluir variabilidad

    estocstica.

    2727

    IntroduccinIntroduccinIntroduccinIntroduccin Auto-similaridad estocstica y trfico de redes

    La auto-similaridad estocstica admite la infusin de no determinismo de acuerdo a lo que requiere en las trazas de trfico medido, pero es una propiedad que puede ilustrarse visualmente.

    La figura presenta una traza de trfico en donde se grafica throughput (en bytes) vs el tiempoLa figura presenta una traza de trfico en donde se grafica throughput (en bytes) vs. el tiempo con una granularidad de 100s.

    9 Un nico punto de datos es el volumen de trfico agregado en un intervalo de 100 s.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2828

  • 15

    IntroduccinIntroduccinIntroduccinIntroduccin Auto-similaridad estocstica y trfico de redes

    La figura de la derecha es la misma serie de trfico con los primeros 1000 segundos estn ampliados por un factor de 10.

    Esta serie de tiempo truncada tiene una granularidad de 10s.Los otros dos grficos hace un zoom in re escalando el segmento inicial sucesivamente en unLos otros dos grficos hace un zoom-in, re-escalando el segmento inicial sucesivamente en un

    factor de 10.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 2929

    IntroduccinIntroduccinIntroduccinIntroduccin Auto-similaridad estocstica y trfico de redes

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 3030

  • 16

    IntroduccinIntroduccinIntroduccinIntroduccinco

    de

    rede

    sri

    dad

    esto

    cst

    ica

    y tr

    fic

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    A

    uto-

    sim

    ilar

    3131

    IntroduccinIntroduccinIntroduccinIntroduccin Auto-similaridad estocstica y trfico de redes

    Se puede admitir que las cuatro grficas se parecen mucho entre si. Sin embargo, a diferencia de los objetos fractales determinsticos, cada grfica no es una

    reproduccin exacta de la grfica anterior. P t h di i di h f t lid d t l t i l Por supuesto, sera mucho pedir si se esperase dicha fractalidad en un proceso tan aleatorio como la

    llegada de paquetes a una red Ethernet.

    Pero si se considera el trfico observado es una traza muestral de un proceso estocstico y se restringe la similitud a ciertas estadsticas de las series de tiempo re-escaladas, se descubre fcilmente autosimilaridad exacta en los objetos matemticos abstractos y autosimilaridad aproximada en las realizaciones especficas, como la de la figura.

    Para resaltar esta autosimilaridad se compara con un Proceso de Poisson. En las grficas siguientes se muestran las llegadas de acuerdo con un proceso de Poisson, con

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    En las grficas siguientes se muestran las llegadas de acuerdo con un proceso de Poisson, con magnificaciones por un factor 5.

    A medida que se consideran intervalos de tiempo mayores, las llegadas en cada intervalo varan menos, tanto que a intervalos t de ms de cuatro segundos se obtiene un nmero prcticamente constante de llegadas igual a 400t.

    En cambio, la variabilidad en el proceso de trfico de la red Ethernet parece ser invariante a la escala.

    3232

  • 17

    IntroduccinIntroduccinIntroduccinIntroduccinco

    de

    rede

    sri

    dad

    esto

    cst

    ica

    y tr

    fic

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    A

    uto-

    sim

    ilar

    3333

    Aspectos de la Aspectos de la autosimilaridadautosimilaridadAspectos de la Aspectos de la autosimilaridadautosimilaridad La auto similaridad se manifiesta a si misma en algunos estilos

    equivalentes:Varianzas que decaen lentamente Long range dependence (LRD)Autocorrelaciones no denegeradas (Non-degenerate autocorrelations)Efecto Hurst

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 3434

  • 18

    IntroduccinIntroduccinIntroduccinIntroduccin Auto-similaridad estocstica y trfico de redes

    Para medir la autosimilaridad estocstica se pueden utilizar las estadsticas de segundo orden. Estadsticas de segundo orden son propiedades estadsticas que capturan la naturaleza g p p q p

    de rfaga (burstiness) o variabilidad de los procesos.

    De hecho, la invarianza a la escala se puede definir en trminos de la funcin de autocorrelacin.

    La forma de la funcin de autocorrelacin juega un rol importante.La autocorrelacin como funcin del retraso de tiempo, se asume que decrece

    polinmicamente en lugar de exponencialmente.9 Esto es la manifestacin de la dependencia de largo rango que, en una importante clase de

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Esto es la manifestacin de la dependencia de largo rango que, en una importante clase de procesos, es equivalente a la autosimilaridad. La existencia de una correlacin no trivial a cierta distancia se conoce como Long-Range Detection

    (LDR)

    3535

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadConsidere un proceso estocstico de tiempo discreto (o serie de tiempo) X(t):

    X(t) se interpreta como el volumen de trfico, medido en paquetes, bytes o bits, en el tiempo t.p

    X(t) es el volumen de trfico total hasta el instante t (por ejemplo desde t=0).Para minimizar confusin cuando se emplea el punto de vista acumulativo , se

    denotar dicho proceso con Y(t).

    9Y(t) es el nmero total de paquetes que han llegado hasta el instante t.X(t) ser el proceso incremental correspondiente a Y(t), es decir:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Para propsitos de modelamiento de trfico, conviene que X(t) sea estacionario, en el sentido que su comportamiento o estructura sea invariante con respecto a desplazamientos en el tiempo.

    9Sin alguna de estacionaridad, cualquier cosa se permite y el modelo (basado en X(t)) pierde la mayor parte de su utilidad como una descripcin compacta de fenmenos supuestamente tratables.

    3636

  • 19

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadConsidere un proceso estocstico de tiempo discreto (o serie de tiempo) X(t):

    X(t) es un proceso estrictamente estacionario si:

    poseen la misma distribucin conjunta (joint distribution) para

    Resulta que el usar estacionariedad estricta es demasiado restrictivo y se usa una forma mas dbil: second-order stationaritystationarity, denominada tambin wide sense stationary.

    9Las estadsticas de primer y segundo orden:Valor esperadoLa funcin de autocovarianza Se asume que los dos primeros momentos existen y son finitos:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Se asume que los dos primeros momentos existen y son finitos:

    3737

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadConsidere un proceso estocstico de tiempo discreto (o serie de tiempo) X(t):

    Second-order stationaritystationarity (wide sense stationary) requiere que las estadsticas de estadsticas de primer y segundo orden sean invariantes a desplazamientos en el tiempoprimer y segundo orden sean invariantes a desplazamientos en el tiempo.p y g p z pp y g p z p

    9Se requiere que la funcin de autocovarianza satisfaga la invarianza de traslacin:

    Se asume tambin que por facilidad

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Por otro lado, considerando la caracterstica de estacionario:92=(0)

    3838

  • 20

    AgregacinAgregacinAgregacinAgregacin La agregacin de una serie del tiempo X(t) significa suavizar

    (smoothing) la serie del tiempo promediando las observaciones en bloques no sobrelapados de tamao m para obtener una nueva serie del tiempo X (t).m

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    AgregacinAgregacin: : EjemploEjemploAgregacinAgregacin: : EjemploEjemplo Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 21

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    4.5

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 22

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    4.5 8.0

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    4.5 8.0 2.5

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 23

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 2 es:

    4.5 8.0 2.5 5.0

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example La serie agregada para m = 2 es:

    Asumir que la serie original de tiempo X(t) contiene los siguientes valores (inventados):valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    4.5 8.0 2.5 5.0 6.0 7.5 7.0 4.0 4.5 5.0...

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 24

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 5 es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 5 es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 25

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 5 es:

    6.0

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 5 es:

    6.0 4.4

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 26

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 5 es:

    6.0 4.4 6.4 4.8 ...

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 10 es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 27

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 10 es:

    5.2

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 10 es:

    5.2 5.6

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

  • 28

    Aggregation: An ExampleAggregation: An ExampleAggregation: An ExampleAggregation: An Example Asumir que la serie original de tiempo X(t) contiene los siguientes

    valores (inventados):

    2 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 12 7 4 12 5 0 8 2 8 4 6 9 11 3 3 5 7 2 9 1...

    La serie agregada para m = 10 es:

    5.2 5.6 ...

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    AutocorrelacinAutocorrelacin no degeneradano degeneradaAutocorrelacinAutocorrelacin no degeneradano degenerada Para los procesos auto-similares, la funcin de autocorrelacin

    para el proceso agregado es indistinguible de la del proceso original.Si los coeficientes de la autocorrelacin coinciden (match) para todos los

    retrasos (lags k), entonces se denominan a los procesos exactly self-similar.

    Si los coeficientes de la autocorrelacin coinciden (match) para SOLO retrasos (lags k) grandes, entonces se denominan a los procesos asymptotically self-similar.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    asymptotically self similar .

    5656

  • 29

    AutocorrelacinAutocorrelacin no degeneradano degeneradaAutocorrelacinAutocorrelacin no degeneradano degenerada

    +1ef

    ficie

    ntOriginal self-similarprocess

    0

    corr

    elat

    ion

    Coe

    Aggregated self-similarprocess

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    -1lag k0A

    utoc

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadConsidere un proceso estocstico de tiempo discreto (o serie de tiempo) X(t):

    Para formar la invarianza de escala, primero se define el proceso agregado de X al nivel de agregacin m, obtenido del proceso original X mediante la siguiente suma g g , p g gnormalizada:

    9Es decir, X(t) es particionado en bloques no sobrelapados de tamao m, y se promedian los valores de cada bloque; se usa i para indexar estos bloques.

    9 denota a la funcin de autocovarianza deBajo lo asumido sobre second-order stationarity, se plantean las siguientes definiciones

    de autoauto--similaridadsimilaridad de segundo ordende segundo orden

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    de autoauto--similaridadsimilaridad de segundo ordende segundo orden.

    5858

  • 30

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadDefinicin (Auto-similaridad de segundo orden).

    X(t) es exactamenteexactamente auto-similar de segundo orden con parmetro de Hurst H (1/2

  • 31

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridadPara entender la forma de se discuten los procesos auto-similares con

    un enfoque mas general.

    S i d t l f d t i bit iSe quiere demostrar que la forma de autocovarianza no es arbitraria, que no necesariamente es lo que por lgica debera cumplirse.

    Notacin: (Xk es un proceso desplazado en k).Ejemplo de notacin (en t discreto) para decir que dos procesos (X y Xk) son

    equivalentes en el sentido que siguen las mismas distribuciones dimensionales finitas (que tendran los mismos valores de valor medio y varianza).

    La equivalencia est denotada por =

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    La equivalencia est denotada por =d

    6161

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridad

    Definicin de auto-similaridad para procesos de tiempo continuo en el sentido de distribuciones dimensionales finitas.

    Se considera un proceso acumulativo Y(t) en tiempo continuo . Y(t) es autosimilar con parmetro de auto-similaridad H (Hurst, 0=0 se cumple que:

    9 Esta es una forma natural para que Y(t) y Y(at) sean autosimilares.9 Y(t) y su versin escalada en el tiempo Y(at) , luego de normalizar usando , deben

    tener la misma distribucin.

    9 En el contexto de modelamiento de trfico, conviene pensar en Y(t) como el trfico acumulado hasta el tiempo t.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Para a>1, el tiempo se estira o dilata (se aplica un factor de contraccin a H para que la magnitud de Y(at) sea comparable con la de Y(t)). Lo contrario para a

  • 32

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridad

    El proceso de incremento de Y(t), al que se le denomina X(t) es otro asunto diferente.

    Considerando el caso en el que Y(t) sea H-ss (no es autosimilar sino es H-ss y no es 0)y que tenga incrementos estacionarios.

    Se dice que Y(t) es H-sssi. Se asume que Y(t) tiene varianza finita.

    Se puede comprobar que para t=1 y renombrando a como t en

    Entonces, para Y(t), usando las relaciones anteriores, la autocovarianza es:

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Y como una comprobacin rpida:El proceso de incremento X(t), tiene valor medio de cero y

    La frmula de autocovarianza para X(t) puede derivarse de forma similar que para la autocovarianza del proceso Y(t)

    6363

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridad.Se debe establecer una relacin entre:

    La autosimilaridad de un proceso de tiempo continuo, considerando las distribuciones, yLa autosimilaridad de segundo orden de un proceso de tiempo discreto que requiereLa autosimilaridad de segundo orden de un proceso de tiempo discreto que requiere

    invarianza exacta o asinttica con respecto a la estructura estadstica de segundo orden de la serie agregada de tiempo X(m)

    Se considera la siguiente relacin evidente para X(m)(1)

    De acuerdo a las propiedades de Y(t):

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Se puede probar que:Por lo tanto, si Y(t) es un proceso H-sssi, su proceso de incremento X(t)

    satisface:

    6464

  • 33

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Auto-similaridad de segundo orden y estacionaridad

    Esto es, las distribuciones de X y X(m) tambin estn relacionadas por una simple relacin de escala que involucra el parmetro de Hurst (H).

    Por eso, las definiciones de autosimilaridad de segundo orden (exacta y asinttica) exigen que X y m1-H X(m) tengan la misma estructura de autocorrelacin (para todo m para m grande).

    Respecto al parmetro H: [**]Para H=1/2

    9Visualizando a X(m) como una media muestral de tamao m, si las muestras fuesen obtenidas independientes la varianza de X(m) sera: Var(X(m)) =

    que es el valor que se obtiene para el caso con H= en la frmula [**]

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    que es el valor que se obtiene para el caso con H= en la frmula [ ]. Para < H < 1, la relacin es

    9 Esta relacin indica una estructura de dependencia muy particular entre las muestras X(t), la cual hace que la convergencia de Var(X(m)) hacia cero, a medida que crece el tamao muestral m, sea ms lenta que m-1.

    6565

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Long-Range DependenceSe denota a r(k) como la funcin de auto-correlacinPara 0< H

  • 34

    Procesos autoProcesos auto--similares y LRDsimilares y LRDProcesos autoProcesos auto--similares y LRDsimilares y LRD Long-Range Dependence

    Si H=1/2, r(k)=0 y X(t) es SRD, ya que sera completamente no correlacionado.Para 0< H < 1/2 se tiene que y es una condicin que no se

    encuentra en las aplicaciones.

    Para H=1 no es interesante dado que conduce a la situacin degenerada r(k)=1 para todo k>=1.

    Valores de H mayores a 1 se prohben por la condicin de estacionario de X(t).

    Ntese la diferencia conceptual entre autosimilaridad y dependencia de rango largo.

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Hay procesos autosimilares que no poseen dependencia de rango largo y viceversa. Sin embargo, bajo la restriccin < H < 1, existe una doble implicacin entre

    autosimilaridad y dependencia de rango largo (LDR) y por eso muchas veces se usan como conceptos idnticos.

    6767

    Impacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailedImpacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailed Hay una relacin ntima entre distribuciones de cola pesada y LRD.

    Una variable aleatoria Z tiene una distribucin de cola pesada si

    d d t t iti 0 2 l d f di d ldonde c es una constante positiva y 0 < < 2 es el parmetro de forma o ndice de la cola de la distribucin.

    Aunque existen definiciones tcnicamente ms sutiles que involucran funciones de variacin lenta, los conceptos principales se pueden extraer de esta definicin ligeramente ms restrictiva pero mucho ms prctica.

    De la relacin se observa la cola de la distribucin decae hiperblicamente en contraste con las distribuciones de cola liviana, como las distribuciones exponencial o

    i l d i l t

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    gaussiana, cuyas colas decrecen exponencialmente. La varianza de Z es infinita (si 0 < < 2) Incluso el valor medio puede ser infinito si 0 < 1 En el contexto de las redes, el caso de inters primario es 1 < < 2

    Existen distribuciones que tienen colas que decrecen sub-exponencialmente pero que poseen varianzas finitas (Weibull y log normal).

    6868

  • 35

    Impacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailedImpacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailed Distribucin de Pareto:

    donde 0 < < 2 es el parmetro de forma y b > 0 se conoce como el parmetro de localizacin. La varianza de una variable aleatoria con distribucin de Pareto es infinita. El valor medio es b/(-1) si > 1, o infinito si 1.La figura compara la funcin de distribucin complementaria en escala log-log (CDplot) para una

    distribucin exponencial y una distribucin de Pareto que representan el tiempo de transmisin de un archivo.

    Aunque ambas distribuciones tienen el mismo valor medio, slo uno de cada 10000 archivos tarda ms de 3 segundos en el caso exponencial,

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010 6969

    segundos en el caso exponencial, mientras que 3 de cada mil lo hacen en el caso de Pareto.

    Impacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailedImpacto de las distribuciones Impacto de las distribuciones heavy heavy tailedtailed La principal caracterstica de una variable aleatoria con distribucin de cola pesada es

    su variabilidad extrema. Puede tomar valores extremadamente grandes con una probabilidad no despreciable. Al tomar muestras de dicha variable, la gran mayora de valores sern pequeos pero algunos

    valores sern muy grandes, de manera que la convergencia de la media muestral es lenta. Especialmente si se aproxima a 1.

    Otra caracterstica importante de estas variables aleatorias es la predictibilidad. Se asume que la duracin de una conexin a una red es una variable aleatoria con cola pesada

    y se desea averiguar cul es la probabilidad de que la conexin persista en el futuro, dado que ha estado activa por t segundos.

    Con distribuciones de cola liviana (asintticamente exponencial), la prediccin es independiente de t,

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    Con distribuciones de cola liviana (asintticamente exponencial), la prediccin es independiente de t, de manera que la incertidumbre no disminuye al condicionar en mayores perodos de actividad.

    Pero con distribuciones de cola pesada, entre mayor sea el perodo de actividad observado, mayor es la certeza de que la conexin persista en el futuro.

    Debido a dicha predictibilidad, las variables aleatorias con distribucin de cola pesada conducen a procesos estocsticos con dependencia de rango largo (LRD).

    7070

  • 36

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento de trfico basado en mediciones Se coleccionan y analizan trazas de trfico de redes fsicas para detectar, identificar y cuantificar

    caractersticas pertinentes.

    S h d t d l t i il id d f bi t d di t t Se ha demostrado que la auto-similaridad es un fenmeno ubicuo encontrado en diversos contextos, de las redes modernas de comunicaciones:

    9 Tanto LAN como WAN9 Tanto IP como ATM9 Tanto enlaces de cobre como fibra ptica o inalmbricos9 En la navegacin por la web o en la transferencia de archivos, etc.

    De forma colectiva, los trabajos de mediciones constituyeron fuerte evidencia que la auto-similaridad no era un fenmeno aislado, espurio sino algo que de forma persistente se presenta en una serie de

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    ambientes de red.

    A mas de los esfuerzos para caracterizar el trfico ha habido trabajo en el rea de inferencia estadstica y cientfica [estimacin] que han sido esenciales para la deteccin y cuantificacin de auto-similaridad y LRD (Long Range Dependence).

    9 Estos trabajos se han orientado hacia la auto-similaridad del trfico de redes y se ha enfocado en explotar el inmenso y diverso volumen de mediciones de trfico de alta calidad disponibles.

    7171

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento de trfico basado en mediciones A nivel formal, la validez de una tcnica de inferencia o estimacin est atada a un proceso

    subyacente que presumiblemente es el que gener los datos.

    9 U d l d t fi l d id t i l t i d i f i t d ti9 Un modelo de trfico slo puede considerarse correcto si las tcnicas de inferencia estadstica utilizadas sobre trazas de trfico real permiten concluir que estas muestras de trfico son consistentes con el modelo.

    9 Puesto de otra manera, la exactitud en la identificacin de un sistema solo es adecuada cuando se conoce que los caminos a los datos o muestras se originaron de modelos especficos.

    9 En general, una muestra de origen desconocido no puede ser atribuida de forma nica a un modelo especfico.

    9 El propsito principal de la inferencia estadstica o cientfica es tratar con este problema l d i d t t d d t i t t t t d

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    concluyendo si unos datos o una muestra de datos son consistentes con una estructura de modelo asumido.

    7272

  • 37

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento de trfico basado en mediciones El ser consistente con un modelo asumido no elimina la existencia de otros (modelos) que se ajusten a

    los datos adecuadamente (o mejor). 9 En este sentido los modelos de trfico autosimilar han demostrado una gran consistencia con las medidas9 En este sentido, los modelos de trfico autosimilar han demostrado una gran consistencia con las medidas

    observadas, las cuales evidencian fenmenos de escalamiento en las redes modernas de comunicaciones.

    9 Se ha demostrado que el modelo MMPP y el de autosimilaridad son igualmente vlidos para representar el trfico de una fuente de video MPEG2.

    Dado que el modelo MMPP slo considera la autocorrelacin entre intervalos de tiempo muy prximos entre s, las tcnicas de anlisis de desempeo y de diseo de mtodos de control de trfico resultan mucho ms fciles que con el modelo autosimilar, por lo que el modelo MMPP es el preferido entre estas dos alternativas igualmente vlidas.

    Sin embargo, el inmenso volumen de diversas medidas de trfico de altsima calidad evidencian inconsistencias entre los modelos tradicionales y las medidas observadas, especialmente en lo referente a

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    estructuras de correlacin que se expanden a lo largo de diferentes escalas en el tiempo.

    Estos fenmenos, son capturados por los modelos de trfico autosimilar, los cuales se vuelven cada vez ms importantes en la medida en que el desarrollo de las redes de telecomunicaciones revelan el impacto de estos fenmenos de escala en el desempeo de las redes.

    En conclusin, el trabajo desarrollado en el modelamiento de trfico basado en mediciones, ha demostrado que auto-similaridad es consistente con trfico de redes medido y ha resultado ha sido aadir otra clase de modelo: los procesos auto-similares.

    7373

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento de trfico basado en medicionesMuchas de las tcnicas de inferencia usadas comnmente para cuantificar el grado de auto-

    similaridad o LRD (es decir, la estimacin del parmetro de Hurst) exhiben diferentes propiedades de robustez y algunas idiosincrasiasrobustez y algunas idiosincrasias.

    9 Debido a su naturaleza predominantemente heurstica, estas tcnicas han sido, generalmente, fciles de usar y aplicar, pero los resultados obtenidos son a menudo difciles de interpretar.

    Se han introducido (recientemente) nuevas tcnicas basadas en wavelets para el anlisis de trazas de trfico, representando un paso significativo hacia el desarrollo de tcnicas de inferencia ms exactas.

    9 Poseen mayor sensibilidad a diferentes tipos de fenmenos de escalamiento.9 Habilidad de discriminar ciertas asunciones de modelamiento alternativo, as efectos no

    estacionarios.

    9

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    9 Por la habilidad de las wavelets de localizar una seal dada en escala y tiempo, es posible detectar, identificar y describir comportamiento de escalamiento multifractal en trfico de redes medido. Este es un comportamiento de escalamiento en tiempo no uniforme que emerge cuando se estudia

    trfico TCP medido.

    7474

  • 38

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento fsico Trata de explicar las causas fsicas de la auto-similaridad en trfico de redes basado en: mecanismos de red y

    propiedades de sistemas distribuidos establecidas empricamente, que de forma colectiva conspiran para inducir auto-similaridad en puntos de multiplexacin en la capa de red.

    Desde el punto de vista del anlisis tradicional de series de tiempo, el modelamiento fsico afecta la seleccin del modelo escogiendo entre modelos competidores y bien ajustados (estadsticamente) que son mas congruentes al ambiente de red fsico de donde salieron los datos.

    9 Puesto de otra manera, el modelamiento fsico busca modelos de trfico de redes que: Se relacionan a la fsica de cmo el trfico es generado en una red real. Sean capaces de explicar empricamente fenmenos observados tales como auto-similaridad en trminos mas

    elementales.

    Provean nuevos detalles de la naturaleza dinmica del trfico. El primer tipo de causalidad (y el ms mundano) es el patrn de llegadas de una sola fuente de datos.

    9 As el video tipo VBR: Video MPEG exhibe variabilidad en escalas de tiempo mltiples lo que a su vez se

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    9 As el video tipo VBR: Video MPEG exhibe variabilidad en escalas de tiempo mltiples, lo que a su vez se cree que est relacionado a la variabilidad encontrada en el tiempo entre cambios de escenas sucesivas.

    9 Sin embargo, esta causalidad de fuente nica es perifrica a la discusin por dos razones: La auto-similaridad observada en los datos originales de mediciones de trfico recolectados por Bellcore durante 1989-1991,

    corresponde a un periodo en el cual video VBR era mnimo (o no existente) para ser un factor de influencia.

    Se conoce que video VBR puede aproximarse con modelos de trfico tipo SRD (short-range dependent), lo que a su vez permite investigar ciertos aspectos del impacto en el performance de la estructura de correlacin tipo Long Range, dentro de los confines del anlisis Markoviano tradicional.

    7575

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento fsico El segundo tipo de causalidad denominado causalidad estructural

    9 De naturaleza mas sutil.9 Sus races pueden atribuirse a una propiedad emprica de los sistemas distribuidos: la distribucin heavy-

    tailed de los tamaos de archivos y objetos. De forma simplificada, una variable aleatoria que obedece una distribucin heavy-tailed puede verse como que da lugar a

    un muy amplio rango de diferentes valores, incluyendo (como su marca registrada, trademark) valores very large con probabilidades no insignificantes.

    9 De forma resumida, si un host intercambia archivos cuyos tamaos son heavy tailed , el trfico de red resultante en los puntos de multiplexacin en la capa red es auto-similar.

    9 Se demostr que este fenmeno de causalidad es robusto, en el sentido que se aplica para una variedad de protocolos de capa transporte , tales como TCP, Tahoe, Reno y Vegas, y UDP con control de flujo. Esto abarca gran parte de los protocolos de transporte desplegados y un rango de configuraciones de red.

    9 Tambin se demostr que investigaciones realizadas sobre sistemas de archivos en UNIX en los 80s proporcionaban fuerte evidencia emprica ,basada en mediciones de los sistemas de archivos, que lo sistemas

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    de archivos UNIX son heavy tailed. Se considera que tal vez esta es la explicacin fsica mas simple, destilada, sin embargo de ser de alto nivel, de la auto-

    similaridad del trfico de red.

    9 Se ha encontrado evidencia correspondiente para objetos web , que son de relevancia mas reciente gracias a la explosin de WWW y su impacto en el trfico de Internet.

    9 Por supuesto, la causalidad estructural no sera significativa a menos que existan explicaciones que indiquen por qu objetos tipo heavy-tailed transportados va protocolos basados en TCP y UDP inducen rfagas con auto-similaridad en puntos de multiplexacin.

    7676

  • 39

    reas de Investigacinreas de Investigacinreas de Investigacinreas de Investigacin Puede clasificarse en cuatro categoras:

    Modelamiento fsico Como se sugiere en el artculo original de Leland et al. y presentado formalmente por el artculo de Willinger et al., e

    modelo ON/OFF de Willinger establece que la superposicin de un nmero grande de fuentes independientes ON/OFF con periodos ON y/o OFF heavy-tailed conduce a la auto-similaridad en el proceso agregado (un proceso de ruido G i F i l) LRD t d t i d l t l h t il d d l i d ON OFFGaussiano Fraccional) cuya LRD est determinada por la naturaleza heavy-tailed de los periodos ON y OFF.

    El modelo ON/OFF tiene sus races en u proceso de renovacin introducido por Mandelbrot y provee la base terica para gran parte del trabajo reciente en modelamiento fsico de trfico de red.

    9 Esta base terica junto con la evidencia emprica de las duraciones ON/OFF heavy-tailed representan una explicacin directa de mas bajo nivel de causalidad fsica causalidad fsica de auto-similaridad.

    9 Esta base terica forma los factores principales que distinguen el modelo ON/OFF de otros modelos matemticos de trfico auto-similar.

    El enlace entre descripciones de causalidad de alto y bajo nivel ha sido estudiada por Park et al., y se demuestra que la propiedad de capa aplicacin de tamao de archivos heavy-tailed se preserva en el stack de protocolos y mapeada en la capa red para aproximar periodos ocupados heavy-tailed .

    Ivn Bernal, Ph.D.Ivn Bernal, Ph.D.Revisin Junio 2010Revisin Junio 2010

    en la capa red para aproximar periodos ocupados heavy tailed .

    7777


Recommended