91
Introduzione all’Inferenza Statistica Fabrizio Cipollini Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) G. Parenti Universit di Firenze Firenze, 3 Febbraio 2015

Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione all’Inferenza Statistica

Fabrizio CipolliniDipartimento di Statistica, Informatica, Applicazioni (DiSIA) G. ParentiUniversità di Firenze

Firenze, 3 Febbraio 2015

Page 2: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 3: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 4: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 5: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 6: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 7: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 8: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Introduzione

Casi di studio

Velocità della luceI Nel 1880, Simon Newcomb la valuta in

base al tempo che la luce impiega perfare ' 7400m.

I Qual è il suo valore?I Campione di 66 misure.

Default nel mondo del creditoI Una società finanziaria presta denaro a

un cliente (prestito personale).I Qual è la probabilità che il cliente vada

in default (cioè non ripaghi il prestito)?I Campione di 5756 casi.

Cipollini 2/21 Firenze 2015

Page 9: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Situazione pratica

I Variabile: ‘misura della velocitàdella luce’

X

I Dati: n = 66 misurazioni espresse in km/s,

(x1 = 264286, x2 = 336364, . . . , x66 = 321739)

I Obiettivo: stimare la velocità della luce.

Cipollini 3/21 Firenze 2015

Page 10: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Situazione pratica

I Variabile: ‘misura della velocitàdella luce’

X

I Dati: n = 66 misurazioni espresse in km/s,

(x1 = 264286, x2 = 336364, . . . , x66 = 321739)

I Obiettivo: stimare la velocità della luce.

Cipollini 3/21 Firenze 2015

Page 11: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Situazione pratica

I Variabile: ‘misura della velocitàdella luce’

X

I Dati: n = 66 misurazioni espresse in km/s,

(x1 = 264286, x2 = 336364, . . . , x66 = 321739) = x

I Obiettivo: stimare la velocità della luce.

Cipollini 3/21 Firenze 2015

Page 12: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Situazione pratica

I Variabile: ‘misura della velocitàdella luce’

X

I Dati: n = 66 misurazioni espresse in km/s,

(x1 = 264286, x2 = 336364, . . . , x66 = 321739) = x

I Obiettivo: stimare la velocità della luce.

Cipollini 3/21 Firenze 2015

Page 13: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Statistica esplorativa

I Data cleaning: due valori negativi→ eliminare.I Calcolo di statistiche descrittive:

n min max mean median sd64 185000 462500 276234.3 269179.9 55311.5

I Grafici (istogrammi):

Cipollini 4/21 Firenze 2015

Page 14: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Statistica esplorativa

I Data cleaning: due valori negativi→ eliminare.I Calcolo di statistiche descrittive:

n min max mean median sd64 185000 462500 276234.3 269179.9 55311.5

I Grafici (istogrammi):

Cipollini 4/21 Firenze 2015

Page 15: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Statistica esplorativa

I Data cleaning: due valori negativi→ eliminare.I Calcolo di statistiche descrittive:

n min max mean median sd64 185000 462500 276234.3 269179.9 55311.5

I Grafici (istogrammi):

(a) Misurazione (b) ln(Misurazione)Cipollini 4/21 Firenze 2015

Page 16: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Statistica esplorativa

I Data cleaning: due valori negativi→ eliminare.I Calcolo di statistiche descrittive:

n min max mean median sd64 185000 462500 276234.3 269179.9 55311.5

I Grafici (istogrammi):

(a) Misurazione (b) ln(Misurazione)Cipollini 4/21 Firenze 2015

Page 17: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 18: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 19: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 20: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 21: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 22: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Velocità della luce

Dall’esplorazione all’inferenza

I Ogni misura può dare un valore diverso.

X = ‘misura della velocità della luce’

è una variabile casuale.I Ragionevole pensare che X si distribuisca intorno ad una

media µ con una certa standard deviation σ ,

X ∼ N(µ , σ

)I µ = velocità della luce (se l’esperimento è ben progettato!)I σ = grado di imprecisione dell’esperimentoI Media e sd di X , non del campione!I Potremmo anche assumere che X abbia una distribuzione

Normale (vedi grafico).

Cipollini 5/21 Firenze 2015

Page 23: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Gli ingredienti dell’inferenza

X

I Variabile casuale: X = ‘misura della velocità della luce’I Modello per X : meccanismo aleatorio che genera le

osservazioni. Nel caso in esame (µ, σ)

I Parametri: µ parametro d’interesse; σ parametro didisturbo. Si fa inferenza sui parametri.

I Campione: x , fatto da n osservazioni (x1, . . . , xn).

È l’informazione per fare inferenza sui parametri.

Cipollini 6/21 Firenze 2015

Page 24: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Gli ingredienti dell’inferenza

X ∼ (µ, σ)

I Variabile casuale: X = ‘misura della velocità della luce’I Modello per X : meccanismo aleatorio che genera le

osservazioni. Nel caso in esame (µ, σ)

I Parametri: µ parametro d’interesse; σ parametro didisturbo. Si fa inferenza sui parametri.

I Campione: x , fatto da n osservazioni (x1, . . . , xn).

È l’informazione per fare inferenza sui parametri.

Cipollini 6/21 Firenze 2015

Page 25: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Gli ingredienti dell’inferenza

X ∼ N(µ, σ)

I Variabile casuale: X = ‘misura della velocità della luce’I Modello per X : meccanismo aleatorio che genera le

osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ) .

I Parametri: µ parametro d’interesse; σ parametro didisturbo. Si fa inferenza sui parametri.

I Campione: x , fatto da n osservazioni (x1, . . . , xn).

È l’informazione per fare inferenza sui parametri.

Cipollini 6/21 Firenze 2015

Page 26: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Gli ingredienti dell’inferenza

X ∼ ( µ , σ )

I Variabile casuale: X = ‘misura della velocità della luce’I Modello per X : meccanismo aleatorio che genera le

osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ) .

I Parametri: µ parametro d’interesse; σ parametro didisturbo. Si fa inferenza sui parametri.

I Campione: x , fatto da n osservazioni (x1, . . . , xn).

È l’informazione per fare inferenza sui parametri.

Cipollini 6/21 Firenze 2015

Page 27: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Gli ingredienti dell’inferenza

X ∼ (µ, σ)

I Variabile casuale: X = ‘misura della velocità della luce’I Modello per X : meccanismo aleatorio che genera le

osservazioni. Nel caso in esame (µ, σ) oppure N(µ, σ) .

I Parametri: µ parametro d’interesse; σ parametro didisturbo. Si fa inferenza sui parametri.

I Campione: x , fatto da n osservazioni (x1, . . . , xn).

È l’informazione per fare inferenza sui parametri.

Cipollini 6/21 Firenze 2015

Page 28: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 29: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 30: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 31: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 32: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 33: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Inferenza statistica

Tipi di inferenza

I Stima puntuale: Uso x per (cercare di) indovinare il verovalore del parametro

I Es: Cerco di indovinare µ (velocità della luce).

I Stima per intervallo: Uso x per ricavare un intervallo che,con alta probabilità, include il vero valore del parametro

I Es: Calcolo l’intervallo che, col 95% di probabilità, include µ(velocità della luce).

I Test delle ipotesi: Uso x per accettare/rifiutare un’ipotesi suvalore del parametro (entro un certo margine di incertezza)

I Es: Confermo o respingo una certa ipotesi sul valore di µ(velocità della luce) fatta precedente da un altro studioso.

Cipollini 7/21 Firenze 2015

Page 34: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Statistica

I Un parametro è una quantità scalare; il campione x è fattoda tante osservazioni→ sintesi.

I Ogni sintesi di x è chiamata statistica.Es: min, max, media, mediana, sd, etc.

Cipollini 8/21 Firenze 2015

Page 35: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Statistica

I Un parametro è una quantità scalare; il campione x è fattoda tante osservazioni→ sintesi.

I Ogni sintesi di x è chiamata statistica.Es: min, max, media, mediana, sd, etc.

Cipollini 8/21 Firenze 2015

Page 36: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 37: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 38: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 39: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 40: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 41: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Azione

I (. . . ) è ragionevole ritenere che x = media(x) sia unabuona statistica per stimare µ (la media di X ).

I Dal campione a disposizione (vedi statistiche descrittive)

µ̂ = x = 276234.3 km/s .

I Commento (nel 2015): Sottostima dell’8.5%.I (. . . ) è ragionevole ritenere che s = sd(x) sia una buona

statistica per stimare σ (la sd di X ).I Dal campione a disposizione (vedi statistiche descrittive)

σ̂ = s = 55311.5 km/s .

I Commento: σ̂/µ̂ ' 20% dà un’idea del grado diimprecisione (come errore relativo) dell’esperimento.

Cipollini 9/21 Firenze 2015

Page 42: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Commenti

I L’inferenza è affetta da errore.I Se si cambia il campione si ottengono stime diverse.I Se si cambia statistica (esempio si usa mediana(x) per

stimare µ) si ottengono stime diverse. Meglio la media, lamediana o un’altra statistica?

I Come valutare il grado di incertezza/imprecisione dellastima effettuata a prescindere dal vero valore delparametro (che di solito non si conosce)?

Cipollini 10/21 Firenze 2015

Page 43: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Commenti

I L’inferenza è affetta da errore.I Se si cambia il campione si ottengono stime diverse.I Se si cambia statistica (esempio si usa mediana(x) per

stimare µ) si ottengono stime diverse. Meglio la media, lamediana o un’altra statistica?

I Come valutare il grado di incertezza/imprecisione dellastima effettuata a prescindere dal vero valore delparametro (che di solito non si conosce)?

Cipollini 10/21 Firenze 2015

Page 44: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Commenti

I L’inferenza è affetta da errore.I Se si cambia il campione si ottengono stime diverse.I Se si cambia statistica (esempio si usa mediana(x) per

stimare µ) si ottengono stime diverse. Meglio la media, lamediana o un’altra statistica?

I Come valutare il grado di incertezza/imprecisione dellastima effettuata a prescindere dal vero valore delparametro (che di solito non si conosce)?

Cipollini 10/21 Firenze 2015

Page 45: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Commenti

I L’inferenza è affetta da errore.I Se si cambia il campione si ottengono stime diverse.I Se si cambia statistica (esempio si usa mediana(x) per

stimare µ) si ottengono stime diverse. Meglio la media, lamediana o un’altra statistica?

I Come valutare il grado di incertezza/imprecisione dellastima effettuata a prescindere dal vero valore delparametro (che di solito non si conosce)?

Cipollini 10/21 Firenze 2015

Page 46: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima puntuale

Commenti

I L’inferenza è affetta da errore.I Se si cambia il campione si ottengono stime diverse.I Se si cambia statistica (esempio si usa mediana(x) per

stimare µ) si ottengono stime diverse. Meglio la media, lamediana o un’altra statistica?

I Come valutare il grado di incertezza/imprecisione dellastima effettuata a prescindere dal vero valore delparametro (che di solito non si conosce)?

distribuzione campionaria

Cipollini 10/21 Firenze 2015

Page 47: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 48: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 49: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 50: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 51: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 52: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 53: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 54: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 55: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di una statistica

I Definizione:Distribuzione della statistica

considerando tutti i possibili campioniI Capire il concetto (procedimento costruttivo):

1. Prendo una scatola, metto dentro tanti bigliettini numerati(es. 200) secondo la distribuzione di X che preferisco(es. N(µ = 5, σ = 8)).

2. Fisso la dimensione del campione (es. n = 10)3. Prendo il primo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 7.91).4. Prendo il secondo campione (con rimbussolamento), ne

calcolo la statistica, segno il risultato (es. x = 3.72).5. Continuo finché non mi stanco (non troppo presto!).6. Faccio l’istogramma. . . et voilà: quella è (una buonissima

approssimazione del-) la distribuzione campionaria.7. Potrei fare tutto con un calcolatore (numeri casuali).

Cipollini 11/21 Firenze 2015

Page 56: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Esempi

(a) X per X ∼ N(5, 8) (b) Mediana per X ∼ N(5, 8)

Cipollini 12/21 Firenze 2015

Page 57: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Esempi

(a) X 10 per X ∼ N(5, 8) (b) X 20 per X ∼ N(5, 8)

Cipollini 12/21 Firenze 2015

Page 58: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Esempi

(a) S2 per X ∼ N(5, 8) (b) X per X ∼ Be(p = 0.75)

Cipollini 12/21 Firenze 2015

Page 59: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Perchè è utile

I Indica la forma della distribuzione della statistica.I Posizione (è centrata sul vero valore del parametro?) e

variabilità (meno è, meglio è) della distribuzione dellastatistica.

I Comparando la distribuzione campionaria di statistichediverse posso capire qual è migliore.

I Indispensabile per valutare l’incertezza associata allastima effettuata:

standard error = stima della sd della statisticaI Indispensabile per stima per intervallo e test delle ipotesi.

Cipollini 13/21 Firenze 2015

Page 60: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Perchè è utile

I Indica la forma della distribuzione della statistica.I Posizione (è centrata sul vero valore del parametro?) e

variabilità (meno è, meglio è) della distribuzione dellastatistica.

I Comparando la distribuzione campionaria di statistichediverse posso capire qual è migliore.

I Indispensabile per valutare l’incertezza associata allastima effettuata:

standard error = stima della sd della statisticaI Indispensabile per stima per intervallo e test delle ipotesi.

Cipollini 13/21 Firenze 2015

Page 61: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Perchè è utile

I Indica la forma della distribuzione della statistica.I Posizione (è centrata sul vero valore del parametro?) e

variabilità (meno è, meglio è) della distribuzione dellastatistica.

I Comparando la distribuzione campionaria di statistichediverse posso capire qual è migliore.

I Indispensabile per valutare l’incertezza associata allastima effettuata:

standard error = stima della sd della statisticaI Indispensabile per stima per intervallo e test delle ipotesi.

Cipollini 13/21 Firenze 2015

Page 62: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Perchè è utile

I Indica la forma della distribuzione della statistica.I Posizione (è centrata sul vero valore del parametro?) e

variabilità (meno è, meglio è) della distribuzione dellastatistica.

I Comparando la distribuzione campionaria di statistichediverse posso capire qual è migliore.

I Indispensabile per valutare l’incertezza associata allastima effettuata:

standard error = stima della sd della statisticaI Indispensabile per stima per intervallo e test delle ipotesi.

Cipollini 13/21 Firenze 2015

Page 63: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Perchè è utile

I Indica la forma della distribuzione della statistica.I Posizione (è centrata sul vero valore del parametro?) e

variabilità (meno è, meglio è) della distribuzione dellastatistica.

I Comparando la distribuzione campionaria di statistichediverse posso capire qual è migliore.

I Indispensabile per valutare l’incertezza associata allastima effettuata:

standard error = stima della sd della statisticaI Indispensabile per stima per intervallo e test delle ipotesi.

Cipollini 13/21 Firenze 2015

Page 64: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Come si ricavaI Analiticamente in modo esatto, valido per n qualsiasi

(pochi casi fortunati)I Analiticamente in modo approssimato, valido per n→ +∞

(quasi sempre; approccio molto generale)I Numericamente, mediante simulazione al computerI Esempio: Distribuzione campionaria di X

X per X ∼ N(299792.5, 55000)Cipollini 14/21 Firenze 2015

Page 65: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Come si ricavaI Analiticamente in modo esatto, valido per n qualsiasi

(pochi casi fortunati)I Analiticamente in modo approssimato, valido per n→ +∞

(quasi sempre; approccio molto generale)I Numericamente, mediante simulazione al computerI Esempio: Distribuzione campionaria di X

X per X ∼ N(299792.5, 55000)Cipollini 14/21 Firenze 2015

Page 66: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Come si ricavaI Analiticamente in modo esatto, valido per n qualsiasi

(pochi casi fortunati)I Analiticamente in modo approssimato, valido per n→ +∞

(quasi sempre; approccio molto generale)I Numericamente, mediante simulazione al computerI Esempio: Distribuzione campionaria di X

X per X ∼ N(299792.5, 55000)Cipollini 14/21 Firenze 2015

Page 67: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Come si ricavaI Analiticamente in modo esatto, valido per n qualsiasi

(pochi casi fortunati)I Analiticamente in modo approssimato, valido per n→ +∞

(quasi sempre; approccio molto generale)I Numericamente, mediante simulazione al computerI Esempio: Distribuzione campionaria di X

X per X ∼ N(299792.5, 55000)Cipollini 14/21 Firenze 2015

Page 68: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ,

σ√n

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se ;I approssimata (valida per n ‘grande’) se ;I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 69: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ,

σ√n

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se ;I approssimata (valida per n ‘grande’) se ;I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 70: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ,

σ√n

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se X ∼ N(µ, σ) ;I approssimata (valida per n ‘grande’) se ;I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 71: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ,

σ√n

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se X ∼ N(µ, σ);I approssimata (valida per n ‘grande’) se X ∼ (µ, σ) ;I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 72: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ,

σ√n

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se X ∼ N(µ, σ);I approssimata (valida per n ‘grande’) se X ∼ (µ, σ);I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 73: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N(µ ,

σ√n

)n ‘grande’≈ N

(µ , se =

σ̂√n

)

I La distribuzione di X è:I esatta se X ∼ N(µ, σ);I approssimata (valida per n ‘grande’) se X ∼ (µ, σ);I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 74: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Distribuzione campionaria

Distribuzione campionaria di X

Si dimostra che

X ∼ N

(µ,

σ√n,

)n ‘grande’≈ N

(µ, se =

σ̂√n

)

I La distribuzione di X è:I esatta se X ∼ N(µ, σ);I approssimata (valida per n ‘grande’) se X ∼ (µ, σ);I per n ‘grande’ non cambia se si usa σ̂ (linea rossa nel

grafico) al posto di σ (linea blu nel grafico).I La distribuzione di X è centrata su µ .

I La sua sd e la sua stima (lo standard error ) vanno azero per n→∞.

Cipollini 15/21 Firenze 2015

Page 75: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima per intervallo

Stima per intervallo

I Poiché X ≈ N(µ, se =

σ̂√n

), in base alle caratteristiche

della normale, si ha

95% = P

(−1.96 ≤ X − µ

se≤ 1.96

)= P

(X − 1.96 · se ≤ µ ≤ X + 1.96 · se

)I La corrispondente stima per intervallo (al 95%) è

[x − 1.96 · se, x + 1.96 · se] = [262683.3,289785.4]

I Commento (nel 2015): Non include il vero valore di µ(299792.5 km/s). Verosimilmente, l’esperimento non eraben progettato.

Cipollini 16/21 Firenze 2015

Page 76: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Stima per intervallo

Stima per intervallo

I Poiché X ≈ N(µ, se =

σ̂√n

), in base alle caratteristiche

della normale, si ha

95% = P

(−1.96 ≤ X − µ

se≤ 1.96

)= P

(X − 1.96 · se ≤ µ ≤ X + 1.96 · se

)I La corrispondente stima per intervallo (al 95%) è

[x − 1.96 · se, x + 1.96 · se] = [262683.3,289785.4]

I Commento (nel 2015): Non include il vero valore di µ(299792.5 km/s). Verosimilmente, l’esperimento non eraben progettato.

Cipollini 16/21 Firenze 2015

Page 77: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Situazione pratica

I Variabile: X = ’cliente finanziato èandato in default?’

I Dati: n = 5756 casi di clienti precedentemente finanziati,

x = (x1 = No, x2 = No, x3 = Sì, x4 = No, . . . , x5756 = No)

x include 278 Sì e 5478 No.I Obiettivo: stimare la probabilità che un cliente vada in

default.

Cipollini 17/21 Firenze 2015

Page 78: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Situazione pratica

I Variabile: X = ’cliente finanziato èandato in default?’

I Dati: n = 5756 casi di clienti precedentemente finanziati,

x = (x1 = No, x2 = No, x3 = Sì, x4 = No, . . . , x5756 = No)

x include 278 Sì e 5478 No.I Obiettivo: stimare la probabilità che un cliente vada in

default.

Cipollini 17/21 Firenze 2015

Page 79: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Situazione pratica

I Variabile: X = ’cliente finanziato èandato in default?’

I Dati: n = 5756 casi di clienti precedentemente finanziati,

x = (x1 = No, x2 = No, x3 = Sì, x4 = No, . . . , x5756 = No)

x include 278 Sì e 5478 No.I Obiettivo: stimare la probabilità che un cliente vada in

default.

Cipollini 17/21 Firenze 2015

Page 80: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Gli ingredienti

X

I Variabile casuale: X = ’cliente finanziato è andato indefault?’ secondo la codifica 1 = Sì, 0 =No.

I Modello per X : Be(p) , che significa

P(X = 1) = p P(X = 0) = 1− p

I Parametri: p = P(X = 1) = P(default).I Campione: di n = 5756 osservazioni

x = (x1 = 0, x2 = 0, x3 = 1, x4 = 0, . . . , x5756 = 0)

In x ci sono 278 default (1) e 5478 bonis (0).

Cipollini 18/21 Firenze 2015

Page 81: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Gli ingredienti

X ∼ Be(p)

I Variabile casuale: X = ’cliente finanziato è andato indefault?’ secondo la codifica 1 = Sì, 0 =No.

I Modello per X : Be(p) , che significa

P(X = 1) = p P(X = 0) = 1− p

I Parametri: p = P(X = 1) = P(default).I Campione: di n = 5756 osservazioni

x = (x1 = 0, x2 = 0, x3 = 1, x4 = 0, . . . , x5756 = 0)

In x ci sono 278 default (1) e 5478 bonis (0).

Cipollini 18/21 Firenze 2015

Page 82: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Gli ingredienti

X ∼ Be( p )

I Variabile casuale: X = ’cliente finanziato è andato indefault?’ secondo la codifica 1 = Sì, 0 =No.

I Modello per X : Be(p) , che significa

P(X = 1) = p P(X = 0) = 1− p

I Parametri: p = P(X = 1) = P(default).I Campione: di n = 5756 osservazioni

x = (x1 = 0, x2 = 0, x3 = 1, x4 = 0, . . . , x5756 = 0)

In x ci sono 278 default (1) e 5478 bonis (0).

Cipollini 18/21 Firenze 2015

Page 83: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Gli ingredienti

X ∼ Be(p)

I Variabile casuale: X = ’cliente finanziato è andato indefault?’ secondo la codifica 1 = Sì, 0 =No.

I Modello per X : Be(p) , che significa

P(X = 1) = p P(X = 0) = 1− p

I Parametri: p = P(X = 1) = P(default).I Campione: di n = 5756 osservazioni

x = (x1 = 0, x2 = 0, x3 = 1, x4 = 0, . . . , x5756 = 0)

In x ci sono 278 default (1) e 5478 bonis (0).

Cipollini 18/21 Firenze 2015

Page 84: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Statistica e distribuzione campionaria

I (. . . ) è ragionevole ritenere che la ‘proporzione di 1 nelcampione’, che peraltro coincide con x = media(x) , siauna buona statistica per stimare p .

I In effetti, si dimostra che

X ≈ N

(p,

√p(1− p)√

n

)≈ N

(p, se =

√p̂(1− p̂)√

n

)ovvero:

I la distribuzione di X è centrata su pI la sua sd (che poi serve per il calcolo dello

standard error ) va a zero per n→∞.

Cipollini 19/21 Firenze 2015

Page 85: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Statistica e distribuzione campionaria

I (. . . ) è ragionevole ritenere che la ‘proporzione di 1 nelcampione’, che peraltro coincide con x = media(x) , siauna buona statistica per stimare p .

I In effetti, si dimostra che

X ≈ N

(p,

√p(1− p)√

n

)≈ N

(p, se =

√p̂(1− p̂)√

n

)ovvero:

I la distribuzione di X è centrata su pI la sua sd (che poi serve per il calcolo dello

standard error ) va a zero per n→∞.

Cipollini 19/21 Firenze 2015

Page 86: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Statistica e distribuzione campionaria

I (. . . ) è ragionevole ritenere che la ‘proporzione di 1 nelcampione’, che peraltro coincide con x = media(x) , siauna buona statistica per stimare p .

I In effetti, si dimostra che

X ≈ N

(p ,

√p(1− p)√

n

)≈ N

(p , se =

√p̂(1− p̂)√

n

)ovvero:

I la distribuzione di X è centrata su pI la sua sd (che poi serve per il calcolo dello

standard error ) va a zero per n→∞.

Cipollini 19/21 Firenze 2015

Page 87: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Statistica e distribuzione campionaria

I (. . . ) è ragionevole ritenere che la ‘proporzione di 1 nelcampione’, che peraltro coincide con x = media(x) , siauna buona statistica per stimare p .

I In effetti, si dimostra che

X ≈ N

p,

√p(1− p)√

n

≈ N

p, se =

√p̂(1− p̂)√

n

ovvero:

I la distribuzione di X è centrata su pI la sua sd (che poi serve per il calcolo dello

standard error ) va a zero per n→∞.

Cipollini 19/21 Firenze 2015

Page 88: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Stima puntuale e per intervallo

I Dal campione a disposizione (due slides fa)

p̂ = x = 278/5756 = 0.0483 ' 4.83% .

con uno standard error

se =√

p̂(1− p̂)/√

n = 0.00283 .

I In base alle caratteristiche della normale, si ha

95% = P

(−1.96 ≤ X − p

se≤ 1.96

)= P

(X − 1.96 · se ≤ p ≤ X + 1.96 · se

)I La corrispondente stima per intervallo (al 95%) è

[x − 1.96 · se, x + 1.96 · se] = [0.0428,0.0538]

Cipollini 20/21 Firenze 2015

Page 89: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Stima puntuale e per intervallo

I Dal campione a disposizione (due slides fa)

p̂ = x = 278/5756 = 0.0483 ' 4.83% .

con uno standard error

se =√

p̂(1− p̂)/√

n = 0.00283 .

I In base alle caratteristiche della normale, si ha

95% = P

(−1.96 ≤ X − p

se≤ 1.96

)= P

(X − 1.96 · se ≤ p ≤ X + 1.96 · se

)I La corrispondente stima per intervallo (al 95%) è

[x − 1.96 · se, x + 1.96 · se] = [0.0428,0.0538]

Cipollini 20/21 Firenze 2015

Page 90: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Default nel mondo del credito

Stima puntuale e per intervallo

I Dal campione a disposizione (due slides fa)

p̂ = x = 278/5756 = 0.0483 ' 4.83% .

con uno standard error

se =√

p̂(1− p̂)/√

n = 0.00283 .

I In base alle caratteristiche della normale, si ha

95% = P

(−1.96 ≤ X − p

se≤ 1.96

)= P

(X − 1.96 · se ≤ p ≤ X + 1.96 · se

)I La corrispondente stima per intervallo (al 95%) è

[x − 1.96 · se, x + 1.96 · se] = [0.0428,0.0538]

Cipollini 20/21 Firenze 2015

Page 91: Introduzione all'Inferenza Statistica · Introduzione Casi di studio Velocità della luce I Nel 1880, Simon Newcomb la valuta in base al tempo che la luce impiega per fare ’7400m

Epilogo

Grazie per l’attenzione!

Cipollini 21/21 Firenze 2015