Homepage | DidatticaWEB - Universit a di Roma Tor …...Conjoint Analysis M. Naldi (URM2) Corso ATEP...

Preview:

Citation preview

Analisi tecnico-economica dei progetti ICTAnalisi della domanda

Maurizio Naldi

Universita di Roma Tor Vergata

A.A. 2012-13

Analisi della domanda

M. Naldi (URM2) Corso ATEP A.A. 2012-13 2 / 96

Analisi della domanda di un servizio

Modelli econometrici

Modelli di diffusione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 3 / 96

Modelli econometrici

Stimano la domanda in funzione di parametri socio economici (variabiliesplicative)Esempi di variabili esplicative

Prodotto interno lordo per persona

Teledensity

Eta del capofamiglia

Livello di istruzione del capofamiglia

Composizione della famiglia (numerosita, eta, . . . )

Possesso di apparecchi elettronici

Collocazione geografica (zona urbana o rurale)

Densita di adozione in ambito locale

Prezzo (costi fissi, canone, e costi variabili, a traffico)

Reddito

Indici di mobilita

M. Naldi (URM2) Corso ATEP A.A. 2012-13 4 / 96

Descrizione della domanda di un servizio

A livello d’utente la diffusione di un servizio puo essere descritta dauna variabile binaria

Il valore Y = 1 indica l’adesione al servizioIl valore Y = 0 indica la non adesione al servizio

Il numero di utenti e dato dalla somma delle variabili indicatriciNutenti =

∑Ni=1 Yi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 5 / 96

Variabili binarie e regressione

Obiettivo generale: Descrivere una variabile dipendente limitatamediante regressione

Obiettivo particolare: Descrivere una variabile dipendente binaria(adesione al servizio) mediante regressione

Problemi:

La gamma di valori ottenibile da una regressione non e limitataLa variabile indicatrice binaria e una variabile aleatoria

Soluzione:

Utilizzare il valore atteso della variabile indicatriceImpiegare una funzione di mappaggio dal risultato della regressione allapredizione del valore atteso

M. Naldi (URM2) Corso ATEP A.A. 2012-13 6 / 96

Modelli lineari per variabili dipendenti limitate

Il modello di regressione eE[Y |x1, x2, . . . , xM ] = G (β0 + β1x1 + . . .+ βMxM)

La funzione di mappaggio e G (z) : z ∈ (−∞,+∞) −→ G (z) ∈ (0, 1)

La predizione del valore atteso e anche una predizione di probabilitaP[Y = 1] = E[Y ]

M. Naldi (URM2) Corso ATEP A.A. 2012-13 7 / 96

Il modello logit

La funzione di mappaggio e G (z) = ez

1+ez , ovvero la funzione didistribuzione cumulativa logistica

M. Naldi (URM2) Corso ATEP A.A. 2012-13 8 / 96

Confronto tra distribuzione logistica e normale

Densita logistica (tratteggio)Densita normale (tratto solido)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 9 / 96

Il modello probit

La funzione di mappaggio e G (z) =∫ z−∞

1√2πe−w

2/2dw , ovvero la

funzione di distribuzione cumulativa normale standard

M. Naldi (URM2) Corso ATEP A.A. 2012-13 10 / 96

Influenza dei fattori sulla probabilita di adesione

Approssimazione del differenziale∆P[Y = 1] ' ∂P[Y=1]

∂xi∆xi = g(β0 + βx)βi∆xi

Indichiamo per semplicita p = P[Y = 1]

LOGIT

∆p ' p(1− p)βi∆xi

PROBIT

∆p ' 1√2π

exp(− (β0+βx)2

2

)βi∆xi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 11 / 96

Influenza di variazioni di variabili binarie

Variabile x1 binaria con valori 0 e 1Variazione della probabilita di adesione

∆p = G (β0 + β1 + β2x2 + . . .+ βMxM)− G (β0 + β2x2 + . . .+ βMxM)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 12 / 96

L’elasticita

Elasticita rispetto ad una variabile continuaεxi = xi

p∂p∂xi

= xip g(z)βi

LOGIT

εxi = βixi (1− p)

PROBIT

εxi = 1√2π

exp(−z2/2)βixip

M. Naldi (URM2) Corso ATEP A.A. 2012-13 13 / 96

La quasi-elasticita

Preferita perche la probabilita di adozione e gia una variabile priva di unitadi misura

εxi = xi∂p∂xi

= g(z)βixi

LOGIT

εxi = βixip(1− p)

PROBIT

εxi = 1√2π

exp(−z2/2)βixi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 14 / 96

Il modello di Cobb-Douglas

Serve per descrivere la relazione tra una variabile dipendente continuae divser variabili indipendenti anch’esse continue

La relazione e del tipo legge di potenza

Y = α0Xα11 · · ·X

αMM

E’ linearizzabile mediante una trasformazione logaritmica

lnY = lnα0 + α1 lnX1 + · · ·+ αM lnXM

M. Naldi (URM2) Corso ATEP A.A. 2012-13 15 / 96

L’elasticita nel modello di Cobb-Douglas

L’elasticita della grandezza di interesse rispetto ad una qualsiasi dellevariabili esplicative e sempre costante

εXk= Xk

Y∂Y∂Xk

= αk

M. Naldi (URM2) Corso ATEP A.A. 2012-13 16 / 96

Stima dei parametri del modello di Cobb-Douglas

I parametri del modello possono essere ottenuti per regressione linearemultipla dopo aver operato una trasformazione logaritmica delmodello

I coefficienti della regressione sono le elasticita, ovvero gli esponentidelle variabili indipendenti

M. Naldi (URM2) Corso ATEP A.A. 2012-13 17 / 96

Stima della variazione della domanda

La variazione percentuale della domanda e approssimativamenteproporzionale alle variazioni percentuali delle variabili esplicative, secondo

le rispettive elasticita

∆YY ' α1

∆X1X1

+ · · ·+ αM∆XMXM

M. Naldi (URM2) Corso ATEP A.A. 2012-13 18 / 96

Il modello di Bass

Descrive la diffusione delle innovazioni (prodotti o servizi)

Non usa variabili esplicative

Costituisce un modello autoregressivo

Descrive un fenomeno con saturazione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 19 / 96

La curva delle adozioni

M. Naldi (URM2) Corso ATEP A.A. 2012-13 20 / 96

Il modello analitico

Il modello analitico descrive la probabilita d’acquisto al tempo t se ilprodotto non e stato acquistato precedentemente

F′(t)

1−F (t) = p + qF (t)

F (t) = Probabilita d’acquisto del prodotto nell’intervallo [0, t)p ≥ 0 = Coefficiente d’innovazioneq ≥ 0 = Coefficiente d’imitazione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 21 / 96

La soluzione del modello di Bass

La probabilita cumulativa d’acquisto si ottiene per integrazionedell’equazione differenziale

F (t) = 1−e−(p+q)t

1+ qpe−(p+q)t

M. Naldi (URM2) Corso ATEP A.A. 2012-13 22 / 96

Le vendite attese al tempo t

In un mercato potenziale di dimensione m il numero di vendite attese altempo t e

S(t) = m · f (t) = m (p+q)2

pe−(p+q)t[

1+ qpe−(p+q)t

]2

M. Naldi (URM2) Corso ATEP A.A. 2012-13 23 / 96

Stima dei parametri del modello di Bass

La stima si effettua per regressione sul numero di vendite cumulative N(t)

Dalla equazione differenziale del modello si ottienef (t) = p + (q − p)F (t)− qF 2(t)Il numero di vendite al tempo t eS(t) = m · f (t) = mp + (q − p)N(t)− q

mN2(t) = a + bN(t) + cN2(t)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 24 / 96

Esempio di curve di Bass

Valori alti per p indicano una diffusione iniziale veloce ma anche unrapido abbassamento del tasso di crescita

Valori alti per q indicano una diffusione iniziale lenta ma in rapidacrescita

M. Naldi (URM2) Corso ATEP A.A. 2012-13 25 / 96

Possibili curve di nuove adozioni

M. Naldi (URM2) Corso ATEP A.A. 2012-13 26 / 96

Tecniche di previsione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 27 / 96

Contenuti

Quadro di impiego e classificazione

Metodi qualitativi

Serie storiche

Metodi di regressione

Metodi perequativi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 28 / 96

Utilita delle previsioni

Aspetti ingegneristici

Aspetti commerciali e di mercato

Rapporti con l’esterno

M. Naldi (URM2) Corso ATEP A.A. 2012-13 29 / 96

Aspetti ingegneristici

Scelte architetturali: Collocazione e gerarchizzazione dei nodi

Dimensionamento: Previsioni di traffico

Instradamento: Previsione della matrice di traffico

Affitto circuiti

M. Naldi (URM2) Corso ATEP A.A. 2012-13 30 / 96

Applicazioni commerciali

Segmentazione della clientela

Segmentazione del territorio

Schedulazione del lancio dei servizi

Collocazione dei punti vendita e determinazione del loro numero

Dimensionamento della forza vendita

Stesura del budget e analisi di redditivita (cash flow, pricing)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 31 / 96

Importanza delle previsioni per i rapporti con l’esterno

Rapporti con investitori: Posizionamento sul mercato e quotazione deltitolo

Rapporti con produttori: Co-gestione dei progetti di investimento edeterminazione dei volumi di produzione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 32 / 96

Quadro di impiego delle tecniche di previsione

M. Naldi (URM2) Corso ATEP A.A. 2012-13 33 / 96

Tecniche di previsione

Metodi qualitativi

Metodo DelphiFocus Group

Approccio sperimentale

Metodi quantitativi non sperimentali

RegressioneTecniche perequative e autoregressiveSondaggioConjoint Analysis

M. Naldi (URM2) Corso ATEP A.A. 2012-13 34 / 96

Il metodo Delphi

Per individuare gli scenari possibili relativi ai nuovi servizi si puoadottare il metodo Delphi:

1 Somministrazione di un questionario ad una selezione di esperti2 Analisi statistica delle risposte3 Invio dei risultati al gruppo di esperti4 Risomministrazione del questionario

Esempio: Progetto TITAN (Analisi tecnico-economica di retid’accesso a larga banda)

Questionario composto da 398 domande100 esperti da 10 paesi (10 per Paese, 5 da operatore dominante)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 35 / 96

Caratteristiche del metodo Delphi

Vantaggi

Fornisce un consenso su uno scenarioE’ utile per scenari con forte incertezza

Svantaggi

Gli esperti possono essere polarizzatiPuo essere costoso

M. Naldi (URM2) Corso ATEP A.A. 2012-13 36 / 96

Il Focus Group

La procedura e uguale a quella del metodo Delphi, ma opera supersone normali (non esperti)

Vantaggio: Considera gli utenti potenziali e non le opinioni degliaddetti al mestiere

Svantaggio: Gli utenti hanno una percezione vaga del futuro edell’impatto di servizi innovativi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 37 / 96

L’approccio sperimentale

Consiste nella variazione controllata delle variabili indipendentidurante la fornitura del servizio ad un gruppo di potenziali utenti

Richiede la selezione preliminare di un gruppo di utenti

M. Naldi (URM2) Corso ATEP A.A. 2012-13 38 / 96

Fasi dell’approccio sperimentale

1 Selezione casuale dei partecipanti all’esperimento (campionamentostratificato)

2 Suddivisione dei partecipanti in due gruppi

Gruppo dell’esperimento (soggetti alle variazioni)Gruppo di controllo (non soggetti alle variazioni)

3 Effettuazione di un pre-test ad entrambi i gruppi, per verificarnel’omogeneita statistica e le condizioni di partenza

4 Fornitura del servizio ad entrambi i gruppi (Somministrazione dellostimolo) in condizioni diverse

5 Post-test per verificare le differenze nelle risposte dei due gruppi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 39 / 96

Il sondaggio: Le fasi

1 Preparazione del questionario

Inserimento di domande sull’intenzione di acquisto e sul livello diutilizzoInserimento di domande su caratteristiche socio-demografiche e stili divita

2 Selezione del campione (in maniera totalmente casuale o concampionamento stratificato)

3 Svolgimento dell’intervista

Posta elettronicaPosta ordinariaTelefonoFaccia a faccia

4 Elaborazione statistica delle risposte

M. Naldi (URM2) Corso ATEP A.A. 2012-13 40 / 96

Il sondaggio: caratteristiche

Il campione deve essere rappresentativo dei potenziali utenti

Le risposte si riferiscono ad un solo istante temporale

E’ costoso e richiede una preparazione accurata del questionario

Il mezzo di intervista determina costi e percentuali di risposte

M. Naldi (URM2) Corso ATEP A.A. 2012-13 41 / 96

La conjoint analysis

Viene definita una gamma di servizi, con variazioni dellecaratteristiche (una alla volta), incluso il prezzo

Ai potenziali utenti viene richiesta una classificazione dei servizi inordine di preferenza

L’analisi dei risultati consente di valutare la sensibilita al prezzo ed iltrade-off tra prezzo ed altre caratteristiche

M. Naldi (URM2) Corso ATEP A.A. 2012-13 42 / 96

La conjoint analysis: Pregi e difetti

Vantaggio: Si ottiene una risposta relativa al servizio nel suocomplesso

Svantaggi

Richiede la costruzione di una gamma di servizi fittiziIl numero di alternative possibili (e quindi di confronti necessari) devecomunque essere limitatoIl costo e elevato perche richiede un approccio faccia a faccia

M. Naldi (URM2) Corso ATEP A.A. 2012-13 43 / 96

Le serie storiche

La serie storica e una sequenza di valori di una grandezza di interesseosservati in un certo arco di tempo

La grandezza di interesse viene in genere misurata ad intervalliregolari (campionamento equispaziato del fenomeno)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 44 / 96

Esempi di serie storiche

M. Naldi (URM2) Corso ATEP A.A. 2012-13 45 / 96

Rappresentazione grafica di una serie storica

Rappresentazione cartesiana (valore vs. tempo)

Rappresentazione cartesiana sovrapposta (Sequenza primasegmentata e poi rappresentazione cartesiana dei singoli segmenti)

Rappresentazione polare (Modulo del vettore determinato dal valoredella grandezze e fase del vettore determinato dal tempo), indicataper serie con componente ciclica

M. Naldi (URM2) Corso ATEP A.A. 2012-13 46 / 96

Esempi di rappresentazione grafica cartesiana

M. Naldi (URM2) Corso ATEP A.A. 2012-13 47 / 96

Esempi di rappresentazione grafica polare

M. Naldi (URM2) Corso ATEP A.A. 2012-13 48 / 96

Componenti di una serie storica

Trend o tendenza: componente media di lungo periodo (T)

Componente ciclica: puo trattarsi di una componente il cui periodo elegato al calendario oppure no; se e legata al calendario (ma nonnecessariamente alle stagioni o a fenomeni meteo) si parla dicomponente stagionale (C)

Componente accidentale: e definita per differenza, ovvero e cio che lacomponente di tendenza e quella ciclica non riescono a spiegare (E)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 49 / 96

La composizione delle componenti

Modello additivo: la serie storica S e il risultato della somma delle suecomponenti S = T + C + E

Modello moltiplicativo: la serie storica S e il risultato del prodottodelle sue componenti S = T · C · EConsiderando il logaritmo di un modello moltiplicativo si ottiene unmodello additivo (se le componenti sono positive)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 50 / 96

Primo esame della serie storica

Presenza di discontinuita

Presenza di outlier

Relazione tra fluttuazioni e livello della serie

M. Naldi (URM2) Corso ATEP A.A. 2012-13 51 / 96

Trasformazione logaritmica

M. Naldi (URM2) Corso ATEP A.A. 2012-13 52 / 96

Stima della tendenza

I metodi sono riconducibili a due categorie

Metodi di regressione

Metodi perequativi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 53 / 96

Le curve di regressione

Viene assunto un modello costituito da una funzione del tempo diforma nota a cui si aggiunge una componente accidentale (aleatoria)yt = f (t) + ε

Il problema consiste nell’adattare alla serie storica la curva di formanota, stimandone i parametri

Questi metodi vengono classificati secondo la forma della curva:

PolinomialiEsponenzialiSigmoidiEsplicativi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 54 / 96

Esempio di andamento dell’utenza radiomobile

M. Naldi (URM2) Corso ATEP A.A. 2012-13 55 / 96

Esempio di andamento dell’utenza a banda larga

M. Naldi (URM2) Corso ATEP A.A. 2012-13 56 / 96

La regressione per modelli polinomiali

L’andamento della tendenza e supposto di tipo polinomialef (t) = a0 + a1t + · · ·+ apt

p

Il grado e tipicamente non superiore a 3

Il caso particolare di grado 1 coincide con la regressione lineare

I coefficienti possono essere stimati mediante il metodo dei minimiquadrati

M. Naldi (URM2) Corso ATEP A.A. 2012-13 57 / 96

Determinazione dei coefficienti: La metrica

Supponiamo che la grandezza venga campionata ad istanti regolarit = 1, 2, . . . , n

Disponiamo di n coppie (1, y1), (2, y2), . . . , (n, yn)

Definiamo come metrica di qualita la somma degli scarti quadraticiQ =

∑nt=1 [yt − f (t)]2

M. Naldi (URM2) Corso ATEP A.A. 2012-13 58 / 96

Determinazione dei coefficienti: La soluzione

Troviamo i coefficienti che minimizzano la metrica ai : ∂Q∂ai = 0

Per un polinomio di grado p otteniamo p + 1 equazioni in p + 1incognite ∂Q

∂ai=∑n

t=1−2t i [yt − f (t)] = 0

Le equazioni risultanti vengono dette equazioni normali e sono linearinei parametri

∑nt=1 t

i [yt − (a0 + a1t + · · ·+ aptp)] = 0

M. Naldi (URM2) Corso ATEP A.A. 2012-13 59 / 96

Forma matriciale delle equazioni normali

n

∑t . . .

∑tp∑

t∑

t2 . . .∑

tp+1

......

......∑

tp∑

tp+1 . . .∑

t2p

a0

a1...ap

=

yt∑tyt...∑tpyt

AX = B =⇒ X = A−1B

M. Naldi (URM2) Corso ATEP A.A. 2012-13 60 / 96

La regressione esponenziale

La grandezza cresce (decresce) sempre con andamento esponenziale1 f (t) = a exp(bt)2 f (t) = abt

Il modello esponenziale puo essere ricondotto ad un modello linearemediante trasformazione logaritmica

1 ln f (t) = ln a + bt2 ln f (t) = ln a + t ln b

M. Naldi (URM2) Corso ATEP A.A. 2012-13 61 / 96

I modelli sigmoidali

La curva ha un andamento monotono fino ad un valore asintotico

Puo modellare sia fenomeni di crescita che di decrescita

La forma della curva e ad S allungata

Modelli principali

LogisticoGompertz

M. Naldi (URM2) Corso ATEP A.A. 2012-13 62 / 96

Definizione del modello logistico

Il modello logistico e definito mediante il suo tasso di crescitarl = dy

dt = ky(a− y)

Il tasso di crescita e sempre positivo ma prima cresce e poi decresce

Il massimo del tasso di picco si ha in y = a/2 e vale ka/4

Il valore asintotico della grandezza e a

M. Naldi (URM2) Corso ATEP A.A. 2012-13 63 / 96

Esempio di andamento del tasso di crescita

Valori dei parametri k = 2 e a = 1

M. Naldi (URM2) Corso ATEP A.A. 2012-13 64 / 96

Forma esplicita del modello logistico

Si ottiene dall’espressione del tasso di crescita risolvendo l’equazionedifferenziale col metodo della separazione delle variabili

1 Separazione dyy(a−y) = kdt =⇒

(1/ay + 1/a

a−y

)dy = kdt

2 Integrazione∫ y(t)y(0)

(1/ay + 1/a

a−y

)dy =

∫ t0 kdx =⇒ y(t) = a

1+(

ay(0)−1)

exp(−kat)

I parametri del modello si possono ottenere per regressione non lineare

M. Naldi (URM2) Corso ATEP A.A. 2012-13 65 / 96

Esempio di curva logistica

Valori dei parametri k = 2, a = 1 e y(0) = 0.1

M. Naldi (URM2) Corso ATEP A.A. 2012-13 66 / 96

Definizione del modello di Gompertz

Il modello logistico e definito mediante il suo tasso di crescitarG = dy

dt = ky(ln a− ln y)

Il tasso di crescita e sempre positivo ma prima cresce e poi decresce

Il massimo del tasso di picco si ha in y = a/e e vale ka/e

Il valore asintotico della grandezza e a

M. Naldi (URM2) Corso ATEP A.A. 2012-13 67 / 96

Esempio di andamento del tasso di crescita per il modellodi Gompertz

Valori dei parametri k = 2 e a = 1

M. Naldi (URM2) Corso ATEP A.A. 2012-13 68 / 96

Forma esplicita del modello di Gompertz

Si ottiene dall’espressione del tasso di crescita introducendo una variabileausiliaria u = ln y −→ dy = exp(u)du

1 Separazione duln a−u = kdt

2 Integrazione∫ u(t)u(0)

duln a−u =

∫ t0 kdx =⇒ y(t) = a exp

(− ln a

y(0) exp(−kt))

I parametri del modello si possono ottenere per regressione non lineare

M. Naldi (URM2) Corso ATEP A.A. 2012-13 69 / 96

Esempio di curva Gompertz

Valori dei parametri k = 2, a = 1 e y(0) = 0.1

M. Naldi (URM2) Corso ATEP A.A. 2012-13 70 / 96

Metodi perequativi

Si basano sul filtraggio della serie storica, smussandone le componentistagionali ed accidentali

Utilizzano gli ultimi dati osservati

Applicano un filtro tipicamente lineare ai dati della serie storica perricavare la stima della tendenza

M. Naldi (URM2) Corso ATEP A.A. 2012-13 71 / 96

La media mobile

Il metodo perequativo piu semplice e la media mobile

E’ la media (aritmetica) degli ultimi valori osservati

La finestra di osservazione si sposta nel tempo

M. Naldi (URM2) Corso ATEP A.A. 2012-13 72 / 96

La media mobile simmetrica semplice

La serie osservata e costituita da 2m + 1 valori:x−m, x−m+1, x−1, x0, x1, . . . , xm

La stima della tendenza per il tempo 0 e x0 = 12m+1

∑mi=−m xi

Richiede dati successivi al tempo per il quale si stima la tendenza

M. Naldi (URM2) Corso ATEP A.A. 2012-13 73 / 96

La media mobile asimmetrica semplice

La stima e ottenuta utilizzando solamente i valori passati

La stima della tendenza e ottenuta come media aritmetica degli ultimim valori

La stima per il tempo t e xt =∑m

i=1 xt−i

L’eta media S dei dati utilizzati per la stima eS = 1

m

∑mi=1 i = 1

mm(m+1)

2

Una memoria lunga rende piu lento l’adeguamento a nuovi livelli

M. Naldi (URM2) Corso ATEP A.A. 2012-13 74 / 96

Campo di utilizzo della media mobile asimmetrica

La media mobile asimmetrica semplice e adatta per stimare latendenza di serie storiche con tendenza costante o lentamentevariabile

Il modello della serie storica corrispondente e X (t) = α + εt

La componente aleatoria εt si suppone con valore atteso nullo evarianza σ2 costante

La serie storica ha momentiE[X (t)] = α V[X (t)] = σ2

M. Naldi (URM2) Corso ATEP A.A. 2012-13 75 / 96

Statistiche della previsione

La previsione per l’istante t e una somma di m variabili aleatorieindipendenti ed identicamente distribuite Xt−1(t) = 1

m

∑mi=1 X (t − i)

La previsione e quindi una media campionaria

Il valore atteso della previsione eE[Xt−1(t)] = 1

m

∑mi=1 E[X (t − i)] = 1

mmα = α

La varianza della previsione eV[Xt−1(t)] = 1

m2

∑mi=1 V[X (t − i)] = 1

m2mσ2 = σ2

m

M. Naldi (URM2) Corso ATEP A.A. 2012-13 76 / 96

L’errore quadratico medio di previsione

E’ definito come R = E[(

X (t)− Xt−1(t))2]

Il suo valore e R = E[X 2(t)

]+ E

[X 2t−1(t)

]− 2E

[X (t)Xt−1(t)

]=

α2 + σ2 + α2 + σ2

m − 2α2 = σ2(1 + 1

m

)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 77 / 96

Distribuzione dell’errore di previsione

La componente aleatoria si suppone con distribuzione normale

Anche la serie storica e la previsione hanno distribuzione normale

L’errore di previsione ha distribuzione normale con media nulla

E[X (t)− Xt−1(t)

]= 0

V[X (t)− Xt−1(t)

]= σ2

(1 + 1

m

)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 78 / 96

Intervalli di confidenza della previsioneVarianza nota

Utilizziamo i percentili z della distribuzione gaussiana standard

Effettuiamo una stima per intervalli di tipo bilatero

Consideriamo un livello di confidenza α

Il valore della grandezza al tempo t e

X (t) ∈{Xt−1(t)± zα/2σ

√1 + 1/m

}con probabilita 1− α

M. Naldi (URM2) Corso ATEP A.A. 2012-13 79 / 96

Intervallo di confidenza monolatero

Interessa tipicamente il limite superiore

Il valore della grandezza al tempo t eX (t) < Xt−1(t) + z1−ασ

√1 + 1/m

M. Naldi (URM2) Corso ATEP A.A. 2012-13 80 / 96

Intervalli di confidenza della previsioneVarianza incognita

La varianza incognita puo essere stimata come varianza campionaria

corretta σ2 = 1m−1

∑mi=1

[X (t)− Xt−1(t)

]2

Gli intervalli di confidenza si ottengono utilizzando i percentili delladistribuzione t di Student con m − 1 gradi di liberta

L’intervallo di confidenza bilatero eX (t) ∈

{Xt−1(t)± tα/2,m−1σ

√1 + 1/m

}L’intervallo di confidenza monolatero eX (t) < Xt−1(t) + t1−α,m−1σ

√1 + 1/m

M. Naldi (URM2) Corso ATEP A.A. 2012-13 81 / 96

Exponential Smoothing sempliceValore atteso della previsione

Si considera il modello con tendenza costante X (t) = α + εt

E’ uno stimatore non polarizzatoE[Xt−1(t)] =

∑ti=1

1−ω1−ωt ωi−1E[X (t − i)] = 1−ω

1−ωt α∑t

i=1 ωi−1 = α

M. Naldi (URM2) Corso ATEP A.A. 2012-13 82 / 96

Exponential Smoothing sempliceVarianza della previsione

V[Xt−1(t)] =∑t

i=1

(1−ω1−ωt

)2ω2(i−1)V[X (t − i)] =

σ2(

1−ω1−ωt

)2∑t−1j=0 ω

2j ' σ2 1−ω1+ω

M. Naldi (URM2) Corso ATEP A.A. 2012-13 83 / 96

Exponential Smoothing sempliceMemoria equivalente

Lo stimatore ES ha una memoria teoricamente infinita

I dati piu vecchi hanno un peso trascurabile

La memoria equivalente corrisponde al numero di dati di una mediamobile aritmetica con uguale varianza della previsione

σ2 1−ω1+ω = σ2

meq=⇒ meq = 1+ω

1−ω

M. Naldi (URM2) Corso ATEP A.A. 2012-13 84 / 96

Exponential Smoothing sempliceParametro di smoothing e memoria

L’eta mediadei dati e S =

1+meq

2 = 1ω

M. Naldi (URM2) Corso ATEP A.A. 2012-13 85 / 96

Exponential Smoothing sempliceDistribuzione dell’errore di previsione

La componente aleatoria si suppone con distribuzione normale

Anche la serie storica e la previsione hanno distribuzione normale

L’errore di previsione ha distribuzione normale con media nulla

E[X (t)− Xt−1(t)

]= 0

V[X (t)− Xt−1(t)

]= σ2 2

1+ω

M. Naldi (URM2) Corso ATEP A.A. 2012-13 86 / 96

Exponential Smoothing sempliceIntervalli di confidenza della previsione per varianza nota

Utilizziamo i percentili z della distribuzione gaussiana standard

Effettuiamo una stima per intervalli di tipo bilatero

Consideriamo un livello di confidenza α

Il valore della grandezza al tempo t e

X (t) ∈{Xt−1(t)± zα/2σ

√2

1+ω

}con probabilita 1− α

M. Naldi (URM2) Corso ATEP A.A. 2012-13 87 / 96

Exponential Smoothing sempliceIntervallo di confidenza monolatero

Interessa tipicamente il limite superiore

Il valore della grandezza al tempo t e X (t) < Xt−1(t) + z1−ασ√

21+ω

M. Naldi (URM2) Corso ATEP A.A. 2012-13 88 / 96

Exponential Smoothing Doppio

Consideriamo un andamento localmente lineare

Il modello della serie e X (t + h) = at + bth + εtApplichiamo un doppio smussamento

1 Alla serie storica2 Alla serie smussata (previsione del trend)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 89 / 96

Exponential Smoothing DoppioFormule di aggiornamento

Indichiamo la serie storica semplicemente smussata come S1(t)

Applichiamo la doppia smussatura1 S1(t) = (1− ω)X (t − 1) + ωS1(t − 1)2 S2(t) = Xt−1(t) = (1− ω)S1(t) + ω ˆXt−2(t − 1)

La relazione con i coefficienti del modello lineare e1 at = 2S1(t)− S2(t)2 bt = 1−ω

ω [S1(t)− S2(t)]

M. Naldi (URM2) Corso ATEP A.A. 2012-13 90 / 96

Exponential Smoothing DoppioConfronto con Exponential Smoothing Semplice

M. Naldi (URM2) Corso ATEP A.A. 2012-13 91 / 96

Previsione per istanti successivi

M. Naldi (URM2) Corso ATEP A.A. 2012-13 92 / 96

Il metodo di Holt-Winters

Assume un modello con tendenza lineare

Il modello della serie e X (t + h) = at + bth + εt

La previsione ad un passo e Xt(t + 1) = at + bt

M. Naldi (URM2) Corso ATEP A.A. 2012-13 93 / 96

Il metodo di Holt-WintersStima del livello e della pendenza

Si usa una stima con media pesata come nel metodo di ExponentialSmoothing

La stima del livello e at = αX (t) + (1− α)(at−1 + bt−1)

La stima della pendenza e bt = β(at − at−1) + (1− β)bt − 1

Le stime possono essere inizializzate come a2 = X (2) eb2 = X (2)− X (1)

M. Naldi (URM2) Corso ATEP A.A. 2012-13 94 / 96

Scelta dei coefficienti

I coefficienti α e β sono entrambi positivi e minori di 1

Valori molti piccoli conducono a smussamento elevato

Possono essere scelti minimizzando l’errore quadratico medio sullaserie storica osservata

M. Naldi (URM2) Corso ATEP A.A. 2012-13 95 / 96

Il metodo di Holt-WintersEsempio

I coefficienti usati sono α = 0.234 e β = 0.045

M. Naldi (URM2) Corso ATEP A.A. 2012-13 96 / 96