120
Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia Andrade Campos Prof. Paulo Roberto Freire Cunha Julho 2001 XXI Congresso da Sociedade Brasileira de Computação Jorge Luiz

Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Embed Size (px)

Citation preview

Page 1: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Jornada de Atualização em Informática

Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade

Jorge Luiz de Castro e Silva

Profa. Marcilia Andrade Campos

Prof. Paulo Roberto Freire Cunha

Julho 2001

XXI Congresso da Sociedade Brasileira de Computação

Jorge Luiz

Page 2: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Conteúdo

Motivação Redes de Alta Velocidade e Aplicações

Evolução das tecnologias e aplicações multimídia Requisitos para transmissão de conteúdos multimídia Serviços para redes multimídia

Conceitos Básicos Processo estocástico Momentos de um processo estocástico

média variância covariância correlação

Jorge Luiz

Page 3: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Conteúdo - (cont.)

Visão Geral sobre Modelagem de Tráfego O que se deve medir Fontes de tráfego Qual o objetivo da modelagem

Modelos para Modelar Tráfego Modelos tradicionais Modelos de series temporais Distribuições de caudas pesadas Modelo auto-similar

Jorge Luiz

Page 4: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Referências

D.L.Jagerman et al., “Stochastic Modeling of Traffic Process”, 1996 http://rutcor.rutgers.edu/melamed

M.E.Crovella et al.,”Self-Similarity in World Wide Web Traffic: Evidences and Possibles Causes”, 1997. http://cs.bu.edu/faculty/crovella/papers.html

V. Paxson and S. Floyd, “Wide-Area Traffic: The Failure of Poisson Modeling”, 1995. http://www-nrg.ee.lbl.gov/nrg-papers.html

W. Willinger et al.,”Self-Similarity and Heavy Tails: Structural Modeling of Network Traffic”, Http://www.cs.bu.edu/pub/barford/ss-lrd.html

Z. Sahinoglu and S. Tekinay, “On Multimedia Networks: Self-Similar Traffic and Network Performance”, 1999, IEEE Comm. Magazine.

Jorge Luiz

Page 5: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

1a Parte

Motivação

Jorge Luiz

Page 6: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Situação 1: Suponha um sistema onde os usuários disputam o acesso a um recurso cuja a capacidade é finita. Ex. o uso de uma canal de comunicação.O ferramental para análise e modelagem deste problema pode ser a Teoria das Filas.Medidas de desempenho como o comprimento da fila ou o tempo de espera dos objetos (bytes, pacotes, etc) na fila podem ser estimadas para alocação e compartilhamento eficiente do recurso.

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Page 7: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Situação 2: Suponha que se tenha medidas diárias sobre o tráfego na Internet. O objetivo é prever o número de acessos para os próximos 6 meses. A modelagem estocástica para este tipo de problema pode ser Séries Temporais e a Teoria Bayesiana.

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Page 8: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Para que usar modelagem de tráfego: Planejamento e dimensionamento de redes Análise de desempenho de redes Congestionamento de redes Análise de perda de pacotes Estudo do comportamento dos usuários

Geralmente, dados coletados e avaliados fornecem a base para os modelos analíticos. Os dados, então, representam o comportamento do tráfego da rede.

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Page 9: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

A partir das propriedades observadas nos dados empíricos é desenvolvido um modelo ou uma expressão matemática. O modelo matemático serve como uma aproximação do que acontece na realidade. O modelo matemático pode ser usado para analisar o desempenho da rede, como tamanho da fila, atraso na fila, probabilidade de perda, etc.

Por exemplo, analisando as perdas de informação que podem ocorrer em um sistema de transmissão de áudio e vídeo unicast.

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Page 10: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Camera/Microfone

Codificadorcontrole de taxa

Adaptador de RedeA / D to network

Adaptador de Rede D / A

Decodificadorcontrole de erro

Monitor/Caixa de somfrom network

Sistema de áudio e vídeo unicast

Elementos de um sistema de comunicação para transferência multimídia

Page 11: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Antes Os usuários da rede trabalhavam com aplicações tradicionais

(transferência de dados) que demandavam um serviço com baixas taxas de erro.

Hoje Aplicações multimídia que exigem um nível mínimo de QoS

(garantia de um mínimo de banda passante e baixos níveis de retardo e variação de atraso).

Os serviços fornecidos pela rede podem ser determinístico (com garantia absoluta de retardo máximo, vazão e taxa máxima de perdas) ou probabilístico (com garantia relativa em função de uma modelagem estocástica da fonte geradora do tráfego).

Jorge Luiz

Motivação da Análise e Modelagem de Tráfego em Redes

Page 12: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Motivação da Análise e Modelagem de Tráfego em Redes

Fontes de Tráfego ou Classes de Tráfego ATM Forum

Para SG -> CBR e VBR Para ME -> UBR e ABR

IETF Para ME -> rajadas

CBR = Constant Bit Rate VBR = Variable Bit Rate UBR = Unspecified Bit Rate ABR = Available Bit Rate ATM = Asynchronous Transfer Mode IETF = Internet Engineering Task Force

Jorge Luiz

Page 13: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Motivação da Análise e Modelagem de Tráfego em Redes

O tráfego em rajadas apresenta períodos ativos, durante os quais há geração de tráfego, intercalados por períodos de inatividade. Parâmetros para caracterizar esse tipo de tráfego incluem a duração média dos períodos de atividade e a explosividade da fonte (razão entre a taxa de pico e a taxa média de utilização.

O tráfego CBR é constante. A taxa média é igual a sua taxa de pico.

O tráfego VBR apresenta variações na taxa de transmissão ao longo do tempo. Parâmetros com a média e a variância da taxa de transmissão caracterizam o comportamento desse tipo de tráfego.

Jorge Luiz

Page 14: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

2a Parte

Redes de Alta Velocidade e Aplicações

Jorge Luiz

Page 15: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

O que está mudando? As tecnologias de redes de alta velocidade estão sendo

desenvolvidas em resposta a uma série de mudanças na área de: Computação Comunicação de dados Telecomunicações Aplicações

Jorge Luiz

Page 16: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Evolução da Computação O desempenho dos processadores está dobrando a

cada ano Memória de massa: disk array Sistemas gráficos que usam tecnologias avançadas

possibilitando altas taxas de transferência (na ordem de gigabit por segundo)

Sofware - o incremento na potência de processamento tem possibilitado o uso de novas aplicações. Ex: aplicações que fazem o reconhecimento de voz em tempo real.

Jorge Luiz

Page 17: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Evolução da Comunicação de Dados Capacidade de interligar sistemas de comunicação com

tecnologias diferentes de forma transparente para os usuários (internetworking).

Novas aplicações interativas interconectadas via rede como conferências multimídia.

Melhorias nos protocolos de interconexão de redes Uso de tecnologias que permitem garantir a qualidade e

o desempenho dos serviços de comunicação.

Jorge Luiz

Page 18: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Evolução das Telecomunicações Perfil da demanda está mudando: nos USA o tráfego de

voz cresce a uma taxa de 3% enquanto o de dados cresce mais de 20%.

As companhias estão diversificando seus serviços (TV a cabo, RDSI, etc)

Vantagens da integração de todos serviços em uma única rede de telecomunicações e capacidade de oferecer novos serviços aos usuários.

Já existe uma infra-estrutura digital que pode ser usada tanto para voz como para dados.

Jorge Luiz

Page 19: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Evolução das Aplicações Educação a distância Entretenimento Vídeo conferência Biblioteca virtual Telemedicina Vídeo sob demanda HDTV

Jorge Luiz

Page 20: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Resumindo Evolução conjunta das áreas de computação,

comunicação de dados e telecomunicações. São pressionadas para oferecer tecnologias que

suportam taxas de Gigabits por segundo e suporte às aplicações multimídia, integrando o tráfego de dados, voz e imagem de forma estática ou interativa.

Jorge Luiz

Page 21: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Para se transmitir arquivos multimídia é importante que os serviços providos pela rede sejam confrontados com os requisitos dos conteúdos multimídia.

Requisitos para transmissão de conteúdos multimídia Requisitos de largura de banda. Depende da qualidade do

áudio e vídeo. Áudio com qualidade fone requer 64 Kbps Com qualidade CD requer 1,4 Mbps HDTV não comprimido requer 200 Mbps.

Jorge Luiz

Page 22: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Requisitos para transmissão de conteúdos multimídia Fatores de sincronização requeridos para áudio e vídeo

Retardo deve ser menor que 100 ms. Jitter e skew devem ser menores que 10 ms. Em vídeo, a sincronização dos lábios deve ser menor que 80 ms. Transmissão com qualidade fone, a taxa de erro de bits é cerca

de 1%. Para qualidade CD a taxa deve ser melhor (0,1%). Fatores que influenciam a sincronização

retardo jitter skew taxa de bits taxa de erro de bits

Jorge Luiz

Page 23: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Tecnologias e Serviços de Redes Multimídia Serviços de redes WAN

comutação de circuitos comutação de pacotes Internet

Serviços de redes LAN Ethernet redes em anel

ATM

Jorge Luiz

Page 24: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Serviços de Redes WAN - Comutação de circuitos Requer pouca complexidade de processamento nos

seus nós e suporta taxa bit constante Características

estabelecimento de conexão fim-a-fim impossibilidade de estabelecer conexão qdo não existem

circuitos disponíveis tarifação baseada na distância e no tempo de conexão

Jorge Luiz

Page 25: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Serviços de Redes WAN - Comutação de circuitos Analógico

Serviço telefônico atual - provê conexões até 56 Kbps. Para transmissões multimídia de baixa qualidade.

Linhas privadas analógicas. Digital

RDSI (BRI E PRI) - Rede Digital de Serviços Integrados Basic Rate Interface - de 128 Kbps a 192 Kbps. Para transmissões de

voz digitalizada e vídeo conferência de baixa qualidade. Primary Rate Interface - 1,54 a 2 Mbps. Para vídeo com qualidade

VCR. Linhas privadas digitais - T1, T2, T3 e T4. Inicia em 1,544 Mbps (T1)

e vai até 274 Mbps (T4). T1 transporta vídeo com qualidade VCR e T4 pode transportar HDTV.

Jorge Luiz

Page 26: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Serviços de Redes WAN - Comutação de pacotes Requer maior complexidade de processamento nos

seus nós, mas oferece, em contrapartida, suporte ao tráfego inconstante, ou seja, com taxa de bit variável.

Características pacotes de tamanho variável conexões lógicas multiplexando uma única conexão física aloca banda de transmissão sob demanda técnica tipo store-and-foward tarifação baseada no tráfego e no tempo

Jorge Luiz

Page 27: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Serviços de Redes WAN - Comutação de pacotes X.25 - não é apropriado a transmissão multimídia em

tempo real. Produz delay e jitter em excesso. Frame Relay - minimiza o retardo, pois não controla

fluxo fim-a-fim e nem corrige erros. Até 1,544 Mbps. SMDS - serviço não orientado à conexão. Opera com

taxas de 1,54 a 155 Mbps (com ATM) ADSL - (velox) - Usa fibra ótica. Prover taxa de até 1,544

Mbps, se o assinante estiver a menos de 5,5 km. Acesso a Internet e vídeo sob demanda.

Jorge Luiz

Page 28: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Internet O protocolo TCP/IP não foi projetado para transmitir

tráfego multimídia. O IP é um protocolo não confiável, best effort e não orientado à conexão. O TCP é orientado à conexão e, por isso, usa excessivos reconhecimentos e retransmissões de segmentos.

Para suprir essas deficiências, foram criados outros protocolos para a Internet. RTP - protocolo de aplicação para transmissão multimídia

em tempo real. RSVP - configura e controla recursos oferecidos pela rede,

tais como largura de banda e buffers.

Jorge Luiz

Page 29: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Internet Para superar os problemas encontrados na Internet,

existem 2 pesquisas: Internet2 NGI (Next Generation Internet)

Jorge Luiz

Page 30: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Vantagens da comutação de circuitos Inexistência de congestionamento Adequado para aplicações com taxa de transmissão fixa

e alto índice de utilização Suporta aplicações sensíveis a atrasos, como a voz

Vantagens da comutação de pacotes Utilização otimizada do meio de transmissão Adequado para aplicações com taxa de transmissão

variável no caso de falha de nó ou enlace, permite o uso de rota

alternativa

Jorge Luiz

Page 31: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Redes de Alta Velocidade e Aplicações

Redes Locais Não foram projetadas para transportar multimídia Ethernet, Fast Ethernet e Gigabit Ethernet Redes em anel - FDDI

ATM Concebida para suportar tráfego multimídia, inclusive

em tempo real Princípio da comutação de células (53 bytes) Células comutadas em hardware baixo retardo Taxas de transmissão de 34 a 155 Mbps Com fibra ótica a taxa chega a 622 Mbps

Jorge Luiz

Page 32: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

3a Parte

Noções Básicas

de Processos Estocásticos

Jorge Luiz

Page 33: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Suponham as seguintes variáveis: Tempo de CPU consumido por programas Número de pacotes no buffer de um roteador Número total de bytes enviados por dia Evolução do percentual médio de utilização da rede a

cada segundo Intervalo de tempo entre pacotes recebidos Tempo de resposta de um servidor

ATENÇÂO: o período (tempo) onde as variáveis são mensuradas tem uma grande importância no comportamento delas. Cada uma das variáveis acima são variáveis aleatórias que variam no tempo. Jorge Luiz

Page 34: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

O termo estocástico vem do grego. Significa conjecturar, supor, advinhar. Podemos imaginar que um Processo Estocástico é um processo sobre o qual só podemos ter palpites sobre o comportamento, mas jamais certezas.

Processo estocástico é uma coleção de variáveis aleatórias indexadas pelo tempo. Representa-se por { X(t), t T } ou então {Xt, t T}

Espaço de parâmetros e de estados (T e E).O espaço de estados “E” representa o conjunto de todos

possíveis valores que as variáveis podem assumir.

Jorge Luiz

Page 35: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Processos com parâmetro discreto e contínuoProcessos com espaço de estado discreto e

contínuo

Para que serve?A finalidade do estudo dos processos estocásticos é

compreender o comportamento da trajetória de um sistema com objetivo de fazer previsões e/ou controlar o futuro do sistema.

Jorge Luiz

Page 36: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Tu

t

Tu = tempo consumido de CPU por processos durante um diaT = { t R 0 t 24 }, E = { x R x 0 }

0 24

Page 37: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Np

t

Np = número de pacotes no buffer de um roteador durante um diaT = { t R 0 t 24 }, E = { 0,1,...,n }

0 24

Page 38: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Np

t

Nb = número de total de bytes enviados por dia durante um anoT = { t R t = 1,2,...,365 }, E = { 0,1,...,n }

3651 2 3 . . .

Page 39: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Em

t

Em = evolução do percentual médio de utilização da rede a cadasegundo durante uma horaT = { t R t = 1,2,...,3600}, E = { x R x 0 }

36001 2 3 . . .

. . .

Page 40: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

ttt X EX ][: de Media

Momentos de um Processo Estocástico

)()(1

n

ttt xpxXE

Pode ser considerado como uma média ponderada dos valorespossíveis de x1, ..., xn. Se todos valores possíveis forem igualmenteprováveis, então

Se X discreto e tomar apenas um número finito de valores, então

n

ttx

nxXE

1

_ 1)(

É interessante encontrar um conjunto de medidas que ressaltemas características dominantes da variável.

Page 41: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Momentos de um Processo Estocástico

22

2

]}[{][

)]([)(: de Variância

tt

t

XEXE

XEXEX VX

A variância mede a dispersão de uma v.a. em relação à sua média. Grandes valores de 2 implicam grande dispersão emrelação à média. Pequenos valores implicam forte concentraçãoda distribuição na vizinhança da média. A variância amostral é dada por:

n

tt xx

nXV

1

2_

2 )(1

)(

Page 42: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Momentos de um Processo Estocástico

Page 43: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Momentos de um Processo Estocástico

O primeiro momento de duas variáveis, X e Y, que nos dá uma medida de sua interdependência, é (X,Y) = E[(X - mX)(Y - mY)]. É chamado covariância de X e Y.

Processo estocástico estacionárioAs funções de distribuição conjunta de um processo estacionário são iguais, ou seja, as funções de distribuição são invariantes sob mudanças da origem do tempo.

),...,;,...,(),...,;,...,( 1111 ktktxxFttxxF nnnn

Page 44: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Momentos de um Processo Estocástico

Suponha {Xt}, t=0,1,2,... é um processo estocástico estacionário. Um processo estacionário tem média estacionária = E[Xt], variância finita e estacionária 2 = E[(Xt - )2] e função de auto-covariância k = E[(Xt - )(Xt+k - )], que depende somente de k e não de t. Isto é, para esse processo, a média e variância independem do tempo e a covariância da diferença dos tempos.Auto-covariância amostral é dada por

1,...,1,0,))((1

1

__

nkxxxx

n

kn

tkttk

Page 45: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Noções Básicas de Processos Estocásticos

Jorge Luiz

Momentos de um Processo Estocástico

Observe que 0 = 2. A função de auto-correlação de Xt no atraso k é denotada como k. Por definição a autocorrelação amostral é k = k /0. Valores positivos de mostram que Xt+k tende a crescer com o crescimento de Xt, enquanto valores negativos mostram que Xt+k tende a decrescer. Um valor de próximo de zero indica ausência de relação entre Xt e Xt+k. Valores próximos de +1 e -1 indicam auto grau de relação entre as variáveis.

201

__

e ))((1

kk

k

kn

tkttk xxxx

n

Page 46: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

4a Parte

Visão Geral

sobre Modelagem de Tráfego

Jorge Luiz

Page 47: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Ferramenta de maior utilização -> Teoria das Filas tráfego oferecido a uma fila efetua-se medidas de desempenho, através de

metodologias analíticas ou simulações.

O tráfego simples consiste: de chegadas de entidades (células , pacotes, etc.) formam um fluxo caracterizado por uma sequência de

observações nos instantes de tempo ...,tn-1, tn, tn+1, ...

Jorge Luiz

Page 48: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Processos que modelam chegadas de entidades discretas podem ser matematicamente descritos como processos pontuais compostos por uma seqüência de instantes de chegada t0 = 0, t1, t2,..., tn, medidos a partir da origem zero.

Descrições equivalentes de processo pontuais Processo de contagem Processo de intervalos entre chegadas

Jorge Luiz

Page 49: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Processo de contagem {Xt}t=0 é um processo estocástico de valores inteiros não negativos e contínuo no tempo, onde Xt é o número de chegadas no intervalo de tempo (0, t].

Processo de intervalos entre chegadas é uma seqüência aleatória não negativa {An}n=1, onde An = tn - tn-1 é a duração do intervalo de tempo que separa a n-ésima chegada da anterior.

Jorge Luiz

Page 50: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

As observações podem descrever: intervalos de tempo entre chegadas sucessivas de

comandos -> mostra o comportamento do usuário intervalos de tempo entre chegadas de pacotes ou os

tamanhos dos pacotes -> mostra o comportamento da aplicação

os Xti normalmente tem uma fdp (função de distribuição de probabilidade) conhecida.

Jorge Luiz

Page 51: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

O que se deve mensurar: Telnet

Intervalo de tempo entre chegadas de sessões (em segundos)

ajusta-se a uma distribuição exponencial - f(x)=e-x Duração de cada sessão (entre o login e logout)

distribuição log-normal Intervalo de tempo entre chegadas de pacotes

distribuição de Pareto Tamanho do pacote (em bytes)

nenhuma distribuição conhecida

Jorge Luiz

Page 52: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Jorge Luiz

=3f(x)=e-x

Page 53: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Jorge Luiz

=0.9k=2,3,4,5f(x)= .k/x+1, x=k,...,)

Page 54: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

O que se deve mensurar: FTP

Chegadas de sessões FTP (num intervalo de 1 hora) ajusta-se a uma distribuição Poisson

Número de arquivos transferidos numa sessão FTP nenhuma distribuição conhecida

Tamanho de cada item de uma sessão FTP distribuição log-normal

Jorge Luiz

Page 55: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Jorge Luiz

=2=1

Page 56: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

O que se deve mensurar: Tráfego de vídeo VBR

Teleconferência - não tem mudanças de cenas ou corte e movimento moderado

Intervalo de tempo entre frames é constante - 33 milisegundos para NTSC (30 frames/s) e 40 milisegundos para PAL-M (25 frames/s)

Vídeo MPEG - fluxo mais explosivo - frequentes mudanças de cena e movimentos. Deve-se levar em consideração:

Duração da cena Três tipos de frames codificados: Intra-coded(I), Predicition(P)

e Bidirectional(B) -> Tamanho dos três tipos de frame.

Jorge Luiz

Page 57: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

O que modelar: Tráfego WWW - gerado pelos browsers

Crovella provou que segue o modelo auto-similar Intervalo de tempo médio entre solicitações - depende da

popularidade do site e do número de usuários. Site da NCSA tem 400.000 solicitações/dia. Para um usuário, o número médio de solicitações é 5,75 em 1/2 hora. Poisson.

Tamanho do documento transferido - Ajusta-se a uma distribuição de Pareto com 0,40 0,63 e 21 kbytes. Grau de variação do tamanho do doc. é muito grande. Variedade de documentos (HTML, images(gif, jpeg, bitmap), postscript, audio(wav, etc.) e vídeo(MPEG)

Jorge Luiz

Page 58: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

O que modelar: Tráfego WWW - gerado pelos browsers

Crovella provou que segue o modelo auto-similar Intervalo de tempo médio entre solicitações - depende da

popularidade do site e do número de usuários. Site da NCSA tem 400.000 solicitações/dia. Para um usuário, o número médio de solicitações é 5,75 em 1/2 hora. Poisson.

Tamanho do documento transferido - Ajusta-se a uma distribuição de Pareto com 0,40 0,63 e 21 kbytes. Grau de variação do tamanho do doc. é muito grande. Variedade de documentos (HTML, images(gif, jpeg, bitmap), postscript, audio(wav, etc.) e vídeo(MPEG)

Jorge Luiz

Page 59: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Visão Geral sobre Modelagem de Tráfego

Como obter os traces de dados: tcpdump ntop Existem traces prontos na Internet.

Simuladores de rede NS (Network Simulator) OPNET

Analisadores de tráfego NetSpec HP LAN Analyzer

Jorge Luiz

Page 60: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

5a Parte

Modelos

para Modelar Tráfego

Jorge Luiz

Page 61: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Processos de Renovação Variáveis são independentes e identicamente

distribuídas (IID) - as observações no tempo t não dependem de observações do passado ou do futuro.

Característica -> inexistência de uma função de autocorrelação

Processos de renovação mais usados em modelagem de tráfego Poisson Bernoulli

Jorge Luiz

Page 62: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

POISSON Um processo de Poisson descreve o número de

chegadas de entidades observadas no intervalo de tempo (0,t]. Tem a seguinte fdp:

O n-ésimo tempo An entre duas chegadas sucessivas é descrito por uma distribuição exponencial:

Jorge Luiz

,...1,0,!

)()(

xx

etxXP

tx

t

.0,1)( tetAP tn

Page 63: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

BERNOULLI As chegadas podem acontecer em algum slot de

tempo. A probabilidade de uma chegada em um slot de tempo é p, independente das outras chegadas. A probabilidade que aconteçam k chegadas em n slots de tempo é dada por:

Jorge Luiz

.,...,0,)1()( nkppk

nkXP knk

t

Page 64: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Processos de Renovação Possíveis aplicações

Chegada de usuários para utilizar alguma facilidade (aplicação) do computador

Chegada de pacotes em um nó da rede, desde que o tráfego observado não apresente autocorrelação.

Fluxo de comandos digitados pelo usuário, desde que não se observe dependência proveniente do passado.

Supõem que o tráfego não é correlacionado Na realidade o tráfego é correlacionado, contradizendo

a suposição da independência da V.A.

Jorge Luiz

Page 65: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Processos de Markov

Jorge Luiz

Page 66: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Processos Markovianos Descreve dependências entre os Xt.

A probabilidade (p ij ) do próximo estado observado Xn+1=j depende somente do estado atual Xn=i .

p ij independe do tempo que o processo permaneceu no seu estado atual.

Para definir a probabilidade da cadeia estar em um dado estado no presente basta olhar onde ela estava no instante imediatamente anterior. Esta propriedade é chamada de Propriedade Markoviana.

Jorge Luiz

Page 67: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Processos Markovianos

Um bêbado deseja se deslocar de um ponto A para um ponto B. Chamemos de Xt a posição do bêbado no instante t. Para simplificar, suponhamos que o bêbado só possa se deslocar uma posição para trás e para frente ou então permanecer na mesma posição que ele estava no instante anterior, com a mesma probabilidade

Jorge Luiz

Page 68: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 69: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 70: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 71: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 72: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 73: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 74: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 75: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 76: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 77: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 78: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 79: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 80: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Jorge Luiz

A B2 3 4 5 6 7 81

Page 81: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Depois de doze passos o bêbado está no estado 2. Seja Xn a posição do bêbado no instante n. Lembre-se que E = {A,1,2,3,4,5,6,7,8,B} e T Z+. Observe que P( X13 = 3 | X12 = 2 ) = 1/2

P( X13 = 5 | X12 = 2 ) = 0

A propriedade Markoviana não é uma propriedade válida para todos os processos e aqueles que a possuem são ditos Markovianos.

Jorge Luiz

Page 82: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Exemplo - mudança do estado de uma rede Considere uma rede que pode estar em um de dois

estados: UP e DOWN. Considere o conjunto E = {0,1} para representar os

estados dessa rede: 0 corresponde a DOWN e 1 a UP. O estado dessa rede é observado a cada hora. T =

{0,1,2,...} Desta forma temos uma cadeia estocástica {Xn}, onde

Xn é o estado da rede na n-ésima hora de observação.

Jorge Luiz

Page 83: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Considere ainda que: Se a rede estiver no estado UP a probabilidade dela

falhar na próxima hora é dada por ; Se a rede estiver no estado DOWN a probabilidade de se

consertar a falha na próxima hora é ; Probabilidades de transição:

p00 = P(Xn+1 = 0 | Xn = 0) = 1 -

p01 = P(Xn+1 = 1 | Xn = 0) =

p10 = P(Xn+1 = 0 | Xn = 1) =

p11 = P(Xn+1 = 1 | Xn = 1) 1 -

Jorge Luiz

Page 84: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Diagrama de transição P

Jorge Luiz

1 0

1 -

1 -

Page 85: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

A matriz de transição P é dada por:

Jorge Luiz

1 -

1 - = P

down na hora n

up na hora n

down na hora n+1

up na hora n+1

Page 86: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Tradicionais

Modelos de Tráfego usando Cadeias de Markov Possíveis aplicações

Comportamento do usuário no terminal. A próxima ação é determinada pela ação anterior.

Falha / mudança do estado da Rede ou do sistema.

Jorge Luiz

Page 87: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos

Modelos EstocásticosLineares (Séries Temporais)

Jorge Luiz

Page 88: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Estocásticos Lineares

Série Temporal é a classe de fenômenos cujo processo de observação e a conseqüente quantificação numérica gera uma seqüência de dados distribuídos no tempo. Na maioria das séries, as observações são tomadas em intervalos de tempo discretos e eqüidistantes.

Uma série temporal discreta pode ser representada por XT = { x1, x2, ..., xT}, sendo que cada observação discreta xt está associada a um instante de tempo distinto.

Jorge Luiz

Page 89: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

O objetivo inicial da análise de séries temporais é a realização de inferências sobre as propriedades ou características básicas do mecanismo gerador do processo estocástico das observações da série. A partir das observações da série é possível construir um modelo matemático que represente a realidade de forma simplificada.

Após a construção do modelo, é possível utilizá-lo para testar hipóteses e realizar a previsão de valores futuros da série.

Jorge Luiz

Page 90: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Considerando um conjunto de observações de uma série temporal coletadas até o instante t e de um modelo que represente esses fenômenos, a previsão do valor da série no tempo t + h pode ser obtida.

Jorge Luizt+ht

Page 91: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método de previsão é um conjunto de procedimentos usados no desenvolvimento de um determinado prognóstico. Se baseia na suposição de que observações passadas contém todas informações sobre o padrão de comportamento da série e esse padrão é recorrente no tempo.

O propósito dos métodos de provisão consiste em distinguir o padrão de qualquer ruído que possa estar contido nas observações e então usar para prever os valores futuros.

Jorge Luiz

Page 92: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método de previsão

Jorge Luiz

Univariados

Funções de Transferência

Multivariados

Univariados

Decomposição

Simples de previsão

Avançados

Page 93: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método de Decomposição Identifica componentes (não observáveis) individuais

presentes no padrão básico da série histórica de dados e a partir daí extrapola o futuro.

Xt = f(St, Tt, Ct, Et)

St é a componente sazonal para o período t representa as flutuações da série de acordo com algum fator de

sazonalidade.

Ct é a componente de ciclo para o período t comportamento similar ao sazonal, embora tenha comprimento

maior

Jorge Luiz

Page 94: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos Estocásticos Lineares

Método de Decomposição Tt é a componente de tendência para o período t

representa o aumento ou declínio gradual nos valores das observações.

Et é a componente aleatória no período t É determinada pela identificação e remoção das

componentes anteriores.

Jorge Luiz

Page 95: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método Simples de Previsão Considera como previsão para o período futuro a média

das observações passadas recentes. Método da Média Móvel - mais conhecido

O termo média móvel é usado porque à medida que a próxima observação se torna disponível, a média das observações é recalculada, incluindo essa observação no conjunto das observações e desprezando a observação mais antiga.

n

xxxx nttt

t

...21

Page 96: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método Avançados de Previsão Os modelos mais conhecidos são:

AR(p) - Autoregressivo Linear de ordem p MA(q) - Médias Móveis de ordem q ARMA(p,q) - Autoregressivo e de Médias Móveis ARIMA(p,d,q) - Autoregressivo integrado e de Médias Móveis Box e Jenkins

Esses modelos obtém a previsão de algum valor futuro da série temporal pela combinação dos valores reais passados e/ou dos erros ocorridos.

Jorge Luiz

Page 97: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Modelo Autoregresssivo - AR(p) É dado pela equação:

onde xt corresponde à observação da série no tempo t,

ou seja, xt é a soma ponderada dos p valores anteriores

mais o ruído aleatório ou ruído branco;

p corresponde ao parâmetro do modelo AR de ordem p;

t representa o erro de eventos aleatórios que não

podem ser explicados pelo modelo.

Jorge Luiz

tptpttt xxxx ...2211

Page 98: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Modelo de Médias Móveis - MA(q) É dado pela equação:

onde t representa o erro dos eventos aleatórios que nâo

podem ser explicados pelo modelo;

q corresponde ao parâmetro do modelo MA de ordem q;

Essa equação é similar à equação anterior, exceto pelo

fato de que o valor previsto para a observação depende

dos valores dos erros observados em cada período

passado, ao invés das próprias observações.

Jorge Luiz

qtqttttx ...2211

Page 99: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Modelo Autoregressivo e de Médias Móveis - ARMA(p,q) É dado pela equação:

os modelos ARMA relacionam os valores futuros com as

observações passadas, assim como também com os

erros passados apurados entre os valores reais e os

previstos.

Jorge Luiz

qtqtttptpttt xxxx ...... 22112211

Page 100: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Modelo Autoregressivo Integrados - ARIMA(p,d,q) É dado pela equação:

sendo wt = xt - xt-d;

onde p e q são os parâmetros do processo ARMA de

ordem p e q;

t representa o erro dos eventos aleatórios que nâo

podem ser explicados pelo modelo;

d eqüivale ao grau de homogeneidade não-estacionária.

Jorge Luiz

qtqtttptpttt wwwx ...... 22112211

Page 101: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos EstocásticosLineares

Método de BOX e JENKINS Consiste na busca de um modelo ARIMA que

represente o processo estocástico gerador da série temporal, a partir de um modelo ARMA aplicável na descrição de séries temporais estacionárias, estendendo esse conceito para séries temporais não estacionarias.

Jorge Luiz

Page 102: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos

Distribuição de Caudas Pesadas

Jorge Luiz

Page 103: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Jorge Luiz

X x-0.5 x-1 x-1.5

10 0.316228 0.1 0.031622100 0.1 0.001 0.0011000 0.031622 0.0001 0.000032

Cálculo x- para = 0.5, 1, 1.5

Para fixo, a medida que x cresce, a função não tende azero. Quanto menor o valor de , mais vagarosamente a função tende a zero.

Page 104: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Características V.A. que tem distribuição de caudas pesadas

apresentam uma grande variabilidade nos valores observados. A média é muito afetada pelos valores extremos.

A variância ou o desvio padrão é muito grande. Uma distribuição de cauda pesada tem grande infinita.

Se o fenômeno observado apresenta grande variabilidade em diversas escalas de tempo, a distrib. de probabilidade tem que ter caudas pesadas.

Jorge Luiz

Page 105: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Forma A v.a. X segue uma distribuição de cauda pesada se:

Por ex., a distribuição normal N(0,1) não tem caudas pesadas. P( N(0,1)>3 ) 0.

Uma distribuição de caudas pesadas apresenta probabilidades diferentes de 0 para valores grandes de x.

Jorge Luiz

20 , ,~)( xxxXP

Page 106: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Jorge Luiz

=0.9k=2,3,4,5f(x)= .k/x+1, x=k,...,)

Page 107: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Distribuição de Pareto

A função de distribuição acumulada é:

Jorge Luiz

kxkxkxf ,0 ,0 ,)( )1(

kxkx

kxXPxF

,0 ,0 ,1)()(

kxKx

kxXP

,0 ,0 ,)(

Page 108: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Distribuição de Caudas Pesadas

Variáveis encontradas no estudo do comportamento das

redes que seguem uma distribuição de caudas pesadas: tempo de transmissão de arquivos; tamanho de arquivos disponíveis nos servidores Web; Tempo entre chegadas de pacotes em roteadores da Internet; número de sites visitados;

Jorge Luiz

Page 109: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelos

Modelo Auto-Similar

Jorge Luiz

Page 110: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Jorge Luiz

Conjuntos Cantor com 5 níveis de recursão

Page 111: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

S0 = [0,1]

S1 = [0,1/3] U [2/3,1]

s2 = [0,1/9] U [2/9,1/3] U [2/3,7/9] U [8/9,1]

Duas propriedades do fenômeno auto-similar: o conjunto mantém um padrão na sua estrutura,

mesmo em escalas pequenas A estrutura se repete. Uma estrutura auto-similar

contém pequenas réplicas de si mesma.Jorge Luiz

Page 112: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Seja {Xt} um processo estocástico estacionário média estacionária: = E[Xt]

variância finita e estacionária: v = E[(Xt - )2]

auto-covariância estacionária: k = E[(Xt - )(Xt+k - )]

Se k=0, então v = 0

auto-correlação no atraso k é k. Por definição k = k / 0

Jorge Luiz

Page 113: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Dividir {Xt} em blocos não superpostos de tamanho m. É criar uma novas séries de tempo ou séries amostrais de Xt

Seja Xj(m) é a media amostra Xjm-m+1+...+Xjm, então

Xj(m) = ( Xjm-m+1+...+Xjm)) / m

Se o processo é um ruído branco, então os Xjm-m+1+...+Xjm serão mutuamente não correlacionados, i.e., k = 0 e vm = vm-1

No caso que k 0 e k=- k < , a variância da média

da amostra vm decai para zero proporcionalmente a m-1, i.e., vm vcm-1

Jorge Luiz

Page 114: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

O processo de Markov e as séries temporais conhecidas (AR,MA,ARMA) tem um vm decaindo dessa forma.

Existem processos em vm decai mais lentamente, i.e., a uma taxa menor que m -1. Por ex. vm poderia decair proporcionalmente a m-, para algum (0,1).

Se vm é proporcional a m-, então k=- k é

proporcional a m1-, i.e., k=- k Cm1-

Como < 1, implica que k=- k e que a auto-

correlação decai lentamente de uma forma não totalizável.

Jorge Luiz

Page 115: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

0 10 20 30 40 50

Modelo Auto-Similar

Jorge Luiz

1.0

0.8

0.6

0.4

0.2

0.0

Decaimento rápido da auto-correlação

Page 116: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

0 10 20 30 40 50

Modelo Auto-Similar

Jorge Luiz

1.0

0.8

0.6

0.4

0.2

0.0

Decaimento mais lento da auto-correlação

Page 117: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Dependências de Curto e Longo Alcance

Um processo {Xt} é dito ter dependência de curto alcance, se k=-

k < . Sua função de auto-correlação decai exponencialmente e os {Xj

(m)} tendem a um ruído puro qdo m .

Um processo {Xt} é dito ter dependência de longo alcance, se k=-

k . Sua função de auto-correlação decai mais lentamente (hiperbolicamente) e os {Xj

(m)} não formam um ruído puro.

Jorge Luiz

Page 118: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Processo Auto-Similar (definição)

Um processo {Xt} é dito ser exatamente auto-similar de segunda ordem, se k

(m) = k, m e k, i.e., a estrutura da correlação é preservada em diferentes escalas de tempo.

Um processo {Xt} é dito ser assintoticamente auto-similar se k

(m) k, para m e k grande. Exemplo de processos auto-similar: FBm

Jorge Luiz

Page 119: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

Modelo Auto-Similar

Como identificar um Processo Auto-Similar

O parâmetro H (Hurst) é um indicador de auto-similaridade.

É uma medida que verifica a “persistência”do processo em um longo período.

Processo que tem LRD: 0,5 < H < 1 Como estimar H

estatística R/S baseado na análise do pediograma estimador de Abry-Veit

Jorge Luiz

Page 120: Jornada de Atualização em Informática Curso de Modelagem Estocástica de Tráfego de Redes de Alta Velocidade Jorge Luiz de Castro e Silva Profa. Marcilia

FIM

Jorge Luiz

Muito obrigado