21
Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi sono volutamente ripetuti nella soluzione ma non nel- l’enunciato. 1 Esercizio Per valutare l’efficacia di un contenitore di gas ` e stato misurato il suo peso una volta al mese. I valori ottenuti sono i seguenti Mese G F M A M G L A S O N D Peso in mg 60 68 63 56 57 47 46 56 63 55 69 56 1.1 Supponendo che le variazioni di peso D da un mese all’altro siano indipendenti e distribuite normalmente si valuti l’ipotesi che la media μ D sia 0 al livello di significativit` a del 5%. Le n = 11 variazioni di peso osservate sono Mese G F M A M G L A S O N D d 8 -5 -7 1 -10 -1 10 7 -8 14 -13 con media ¯ d =0.364 e scarto campionario ottenuta dalla radice della varianza campionaria s d = p S 2 d =9.036. Dobbiamo quindi testare H 0 : μ D =0 contro H 1 : μ D 6=0, la cui statistica test ` e T = ¯ d s d / n t-Student 10 e rifiutiamo se |T | >t 0.025=10 , cio` e se T> 2.23. Il valore osservato di T ` e t obs = 0.364 9.036 · 11 = 0.133 dunque non rifiutiamo l’ipotesi che le variazioni abbiamo media 0. 1

Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

  • Upload
    dodan

  • View
    224

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

Esercizi sull’Inferenza

Stefano Cabras

17 giugno 2009

Sommario

Alcuni esercizi sono volutamente ripetuti nella soluzione ma non nel-l’enunciato.

1 Esercizio

Per valutare l’efficacia di un contenitore di gas e stato misurato il suo peso unavolta al mese. I valori ottenuti sono i seguenti

Mese G F M A M G L A S O N DPeso in mg 60 68 63 56 57 47 46 56 63 55 69 56

1.1 Supponendo che le variazioni di peso D da un meseall’altro siano indipendenti e distribuite normalmentesi valuti l’ipotesi che la media µD sia 0 al livello disignificativita del 5%.

Le n = 11 variazioni di peso osservate sono

Mese G F M A M G L A S O N Dd – 8 -5 -7 1 -10 -1 10 7 -8 14 -13

con media d = 0.364 e scarto campionario ottenuta dalla radice della varianzacampionaria sd =

√S2d = 9.036. Dobbiamo quindi testare

H0 : µD = 0 contro H1 : µD 6= 0,

la cui statistica test e

T =d

sd/√n∼ t-Student10

e rifiutiamo se |T | > t0.025,ν=10, cioe se T > 2.23. Il valore osservato di Te tobs = 0.364

9.036 ·√

11 = 0.133 dunque non rifiutiamo l’ipotesi che le variazioniabbiamo media 0.

1

Page 2: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

1.2 Non conoscendo il modello parametrico delle varia-zioni di peso mensile D ed ipotizzando: (a) la loroindipendenza; (b) che la stima corretta ed efficientedella varianza di D coincida esattamente con V ar(D) eche (c) la media sia µD = 0, esistono variazioni mensiliD che si possano essere ritenute anomale? Ad esem-pio, variazioni osservate d per cui Pr(|D| ≥ d) ≤ 0.05 ?.Se si, quali ?

Sapendo che µD = 0 allora la stima non distorta ed efficiente della varianza σ2D

e data da

σ2D =

1n

n∑i=1

(di − 0)2 = 74.364,

infatti

E(σ2D) = E

(n∑i=1

(Di − µD)2

n

)= σ2

D.

Applicando la diseguaglianza di Tchebycheff

Pr(|D| ≥ kσD) ≤ k−2

con σD =√

74.364 ≈ 8.62 e k−2 = 0.05, tutte le variazioni |D| ≥ 4.47 ·8.62 sonoanomale. Poiche nel nostro caso tutte le variazioni sono comprese nell’intervallo(−38.53, 38.53) grammi concludiamo che non ci sono osservazioni anomale.

2 Esercizio

Per verificare la relazioni tra la malattia B e il contatto con la sostanza A e statoeffettuato uno studio su 100 persone i cui risultati sono riportati nella seguentetabella:

Sano Malatocontatto 20 30 50non contatto 25 25 50

45 55 100

2.1 Supponendo che le 100 persone siano l’intera popola-zione di riferimento dello studio e utilizzando la no-zione frequentista di probabilita, si dica di quanto au-menta la probabilita di ammalarsi venendo a contattocon la sostanza rispetto a chi invece non ne viene acontatto ?

Indichiamo con E l’evento persona a contatto con la sostanza e con M la personae malata. Dobbiamo calcolare il rapporto

k =Pr(M | E)Pr(M | E)

=3025

= 1.2,

quindi la probabilita aumenta del 20%.

2

Page 3: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

2.2 Verificare l’ipotesi di indipendenza ai livelli di signifi-cativita del 5% e 1% che la sostanza A sia relazionatacon la malattia B.

Dobbiamo effettuare un test χ2 e rifiuteremo l’ipotesi di indipendenza (ai livellidi significativita del 5% e 1%) se la statistica χ2

obs e superiore a χ20.05,ν=1 = 3.84

(dalle Tavole). Le frequenze teoriche n∗ij sono

Sano Malatocontatto 22.5 27.5 50non contatto 22.5 27.5 50

45 55 100

Quindi

χ2obs =

2∑i=1

2∑j=1

(nij − n∗ij)2

eij' 1.01,

che essendo piu piccolo di 3.84 non possiamo rifiutare l’ipotesi di indipendenza.

3 Esercizio

In un’indagine sulla pulizia di una spiaggia, il comune ha somministrato unquestionario ai residenti, chiedendo Pensa di passare le sue vacanze estive sullaspiaggia?. Da un campione casuale di 60 residenti su 60.000, 32 contenevanouna risposta positiva.

3.1 Si calcoli la stima di massima verosimiglianza del nu-mero di residenti che intendono passare le loro vacanzesulla spiaggia.

I 60 questionari sono un campione casuale, quindi il numero di risposte positive,X ∼ Bin(n = 60, p) e la stima di massima verosimiglianza di p, p = 32/60 dacui deriva che la stima di massima verosimiglianza del numero di residenti chehanno intenzione di passare le proprie vacanze sulla spiaggia e 32.000.

3.2 Si calcoli l’intervallo di confidenza per il numero diresidenti che intendono passare le loro vacanze sullaspiaggia.

In questo caso occorre calcolare un IC sulla proporzione p e moltiplicarne gliestremi per 60.000. Se scegliamo α = 0.05 abbiamo

(p− z1−α/2√p(1− p)/n, p+ z1−α/2

√p(1− p)/n)

= (3260− 1.96

√3260

(1− 3260

)/60,3260

+ 1.96

√3260

(1− 3260

)/60)

(0.4070973, 0.6595693)

Per cui al 95% di confidenza il numero di residenti che passeranno le vacanzesulla spiaggia e compreso tra 24426 e 39574.

3

Page 4: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

4 Esercizio

In un controllo di qualita su due linee di produzione A e B il numero di pezzidifettosi su lotti di 100.000 pezzi sono risultati i seguenti:

Linea A 13 11 6 7 16 13 9 12Linea B 21 24 28 24 28 25 19 20 18 29

Si ipotizzi che il numero di pezzi difettosi sia distribuito secondo la legge diPoisson.

4.1 Si proponga una stima non distorta delle varianze delnumero di pezzi difettosi nelle due linee.

La varianza di una Poisson e uguale alla media, quindi una stima non distortadella media e anche una stima non distorta della varianza. Dunque XA ∼Poisson(λA) e XB ∼ Poisson(λB), da cui xA = (13 + 11 + 6 + 7 + 16 + 13 + 9 +12)/8 = 10.875 e xB = (21+24+28+24+28+25+19+20+18+29)/10 = 23.6.

5 Esercizio

Avendo estratto un campione di acqua da un certo acquedotto e stato contatoil numero di batteri di un certo tipo in 40 gocce. I valori ottenuti sono riportatinella seguente tabella:

xk nk0 151 102 15

5.1 Assumendo che il numero di batteri si distribuisce se-condo una legge di Poisson, si proponga una stimacorretta della varianza.

La varianza della Poisson e uguale alla media, quindi una stima corretta dellamedia e anche una stima corretta della varianza. Dunque V ar(X) = λ e

λ =3∑k=1

xknkN

=1040

+ 21540

= 1

5.2 Possiamo assumere che il numero di batteri in unagoccia si distribuisce secondo una legge di Poisson diparametro sconosciuto? Se il parametro fosse notoλ = 1 cambierebbero le conclusioni?

La tabella riporta i risultati del raggruppamento in classi e il calcolo dellefrequenze teoriche.

4

Page 5: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

k Ak pk n∗k1 [0, 0) Pr(X = 0) = 0.37 14.82 [1, 2) Pr(X = 1) = 0.37 14.83 [2,∞) Pr(X ≥ 2) = 0.26 10.4

Dunque la regione di rifiuto per il test al livello del α = 5% e

XR = (χ22,1−0.05,∞) = (5.99,∞).

Si noti che in questo caso i gdl sono k−1 in quanto abbiamo stimato i parametroλ. Non essendo λ specificato abbiamo usato i dati due volte e per cautelarcidall’incertezza sulla stima di λ dobbiamo utilizzare una distribuzione χ2 con piuvariabilita rispetto a quella utilizzata per λ noto (χ2

ν=3).Le frequenze osservate sono n1 = 15, n2 = 10, n3 = 15 e il valore della

statistica test χ2 e

T =(15− 14.8)2

14.8+

(10− 14.8)2

14.8+

(15− 10.4)2

10.4= 3.59.

Essendo la statistica test caduta in XA non rifiutiamo l’ipotesi che il campioneprovenga dalla legge di Poisson. Se λ fosse stata stato pari a 1 le frequenzeteoriche non si modificano (in questo caso la stima di λ coincide con il valoreteorico assunto, mentre invece sarebbe aumentato il valore di soglia e la regionedi rifiuto sarebbe stata

XR = (χ23,1−0.05,∞) = (7.81,∞),

in quanto i gradi di liberta non sarebbero stati 2, ma 3.

6 Esercizio

Uno strumento di misurazione della consistenza di un giacimento petrolifero estato utilizzato in 10 pozzi diversi, ma con le stesse caratteristiche dimensionalie geologiche, ottenendo i seguenti risultati:

Pozzo 1 2 3 4 5 6 7 8 9 10Migliaia di Barili 1009 999 974 904 985 1043 1004 1027 1023 918

6.1 Si proponga una stima corretta della varianza dellostrumento sapendo solo che gli errori di misura sonoi.i.d con media e varianza finite.

Lo stimatore corretto della varianza sotto le ipotesi indicate nel testo e lavarianza campionaria:

S2 =1

n− 1

n∑i=1

(xi − x) = 2082.933.

5

Page 6: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

6.2 Supponendo che il numero di barili sia distribuito conlegge normale, si valuti l’ipotesi che la variabilta dellostrumento sia di 3 milioni di barili contro l’ipotesi chesia superiore a 3000 migliaia di barili. Scegliere unlivello di significativita.

Le ipotesi da verificare sono

H0 : σ2 = 3000 contro H1 : σ2 > 3000,

. La statistica test e

T =S2

σ20

(n− 1) ∼ χ2n−1 | H0

e quindi la la zona di rifiuto e

S2

σ20

(n− 1) > χ2n−1,1−α.

Per n−1 = 9 e α = 0.05 il valore χ2 di soglia e 16.92, mentre il valore osservatodella statistica test e

tobs =2082.933

3000· 9 = 6.24,

pertanto non si rifiuta l’ipotesi nulla.

7 Esercizio

Un’azienda produttrice di un certo materiale edile, volendo diminuire il peso diciascuna confezione del prodotto, decide di adottare uno specifico trattamentonella lavorazione. Per verificare l’efficacia del trattamento sceglie un campionedi 10 confezioni non trattate (X) e 9 trattate (Y ), rilevandone il peso medio ela varianza campionaria corretta:

x = 3, s2x = 4, y = 4, s2y = 6

Si assume che il peso sia distribuito con legge Normale.

7.1 Alla luce dei dati riportati si stabilisca se la diminuzio-ne di peso delle confezioni a seguito del trattamentosia significativo o meno al livello dell’1%. (Si assumache la varianza del peso sia la stessa senza e con iltrattamento).

Si tratta di una verifica di ipotesi sulla differenza delle medie di due popolazionicon varianze incognite ma uguali.Indichiamo con X ∼ N(µX , σ2) il peso primadel trattamento e con Y ∼ N(µY , σ2) quello dopo il trattamento. DunquenX = 10, nY = 9. Le ipotesi a confronto sono

H0 : µX = µY ,∀σ2 > 0 contro H1 : µX < µY ∀σ2 > 0

6

Page 7: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

la zona di rifiuto e

T =X − Y

Sp

√1nX

+ 1nY

< tnX+nY −2,1−α = −2.56,

dove la varianza comune e stimata tramite

Sp =

√(nX − 1)S2

X + (nY − 1)S2Y

nX + nY − 2,

Il valore osservato della statistica test e

3− 42.22/

√1/10 + 1/9

= −0.98

e quindi non rifiutiamo l’ipotesi nulla e dunque il metodo di riduzione del pesonon e efficace.

7.2 Alla luce dei dati riportati si costruisca l’intervallo diconfidenza sulla differenza di peso prima e dopo il trat-tamento al livello del 95%. (Si assuma che la varianzadel peso sia la stessa senza e con il trattamento).

Si tratta di determinare un IC sulla differenza di medie di due popolazioninormali con varianze incognite ma uguali.Indichiamo con X ∼ N(µX , σ2) ilpeso prima del trattamento e con Y ∼ N(µY , σ2) quello dopo il trattamento.Dunque nX = 10, nY = 9 e l’IC e(X − Y − tnX+nY −2,1−α/2Sp

√1nX

+1nY

, X − Y + tnX+nY −2,1−α/2Sp

√1nX

+1nY

),

dove la varianza comune e Sp = 2.22. Al livello del 5% l’IC e

(−1− 2.11 · 2.22 · 0.46,−1 + 2.11 · 2.22 · 0.46)

cioe(−3.15, 1.15)

che comprende ancora una differenza media nulla.

8 Esercizio

A un produttore di circuiti integrati e stato detto che piu del 7% dei suoi circuitisono difettosi. Poiche crede che questa proporzione sia esattamente pari al 7%,ha effettuato un test su 1000 circuiti scelti a caso, rilevando che 80 di essi sonodifettosi.

7

Page 8: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

8.1 In base ai dati campionari si costruisca un intervallodi confidenza al livello del 99% per la proporzione dipezzi difettosi.

Sia X la v.a. che conta il numero di pezzi difettosi, X ∼ Bin(1000, p). La nu-merosita campionaria e sufficientemente elevata per utilizzare l’approssimazionenormale. Quindi l’IC asintotico e

(p− z1−α/2√p(1− p)/n, p+ z1−α/2

√p(1− p)/n)

e per p = 0.08 e z1−0.005 = 2.576 si ottiene

(0.08−2.576√

0.08(1− 0.08)/1000, 0.08+2.576√

0.08(1− 0.08)/1000) = (0.0580, 0.102).

8.2 Si verifichi l’ipotesi del produttore ai livelli di signifi-cativita del 5% e del 10%.

Si tratta della verifica di ipotesi sul parametro p della legge binomiale:

H0 : p = 0.07 contro H1 : p > 0.07

la zona di rifiuto (asintotica, approssimata con il TLC) e

T =p− 0.07√

0.07(1− 0.07)/n> z1−α,

Quindi i valori di soglia della statistica test sono z0.05 = 1.645 e z0.1 = 1.28Il valore osservato di T e tobs = 1.23 quindi l’ipotesi del produttore non va

rifiutata. C’e evidenza a favore del fatto che la proporzione di pezzi difettosinon superi il 7%.

9 Esercizio

Per 20 cassette di 1000 DVD sono e stato rilevato il numero di pezzi difettosi:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 203 2 2 1 0 2 3 2 2 2 3 1 2 0 4 1 0 2 3 1

9.1 Determinare il rango della variabile aleatoria X, nu-mero di pezzi difettosi in una cassetta e confrontarlocon il rango osservato.

Il rango di X e (0, 1000), mentre quello osservato e (0,4).

9.2 Verificare l’ipotesi X ∼ Poisson(2).

Le frequenze teoriche sono n∗ = N Pr(X = x), dove Pr(X = x) = 2x

x exp(−2)dunque Vi sono alcune frequenze teoriche inferiori a 5, pertanto occorre ragr-ruppare le classi Quindi il valore osservato della statistica test e χ2 = 1.728

8

Page 9: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

classe n∗ nx = 0 20 Pr(X = 0) = 2.71 3x = 1 20 Pr(X = 1) = 5.41 4x = 2 20 Pr(X = 2) = 5.41 8x = 3 20 Pr(X = 3) = 3.61 4x ≥ 4 20 Pr(X ≥ 4) = 2.86 1

classe n∗ n (n−n∗)2n∗

x < 2 20 Pr(X < 2) = 8.12 7 0.154x = 2 20 Pr(X = 2) = 5.41 8 1.240x > 2 20 Pr(X > 2) = 6.47 5 0.334

che confrontato con il χ23 al quantile 90%, 6.25, indica che il numero di pezzi

difettosi si adatta alla distribuzione di Poisson con media 2 DVD difettosi percassetta.

10 Esercizio

Il peso in grammi relativo a 5 casse di frutta e misurato con lo scarto di 1 etto:

1 2 3 4 5100 200 300 200 100

10.1 Supponendo che il peso delle casse segua una distri-buzione normale, si dica se la media 300 grammi epiu verosimile della media 2 etti.

Se X ∼ N(µ, σ = 100), allora il valore massimo verosimile e la media campio-naria x = 180, quindi µ = 200 e piu versimile di µ = 300.

10.2 Produrre una stima intervallare del peso medio dellecasse.

Nel corso abbiamo utilizzato come stima intervallare gli Intervalli di Confidenza.Quindi possiamo calcolare l’IC al 95% per la media supponendo la varianzaincognita

x± t0.025,ν=483.67√

5= 180± 2.78

83.67√5

= (75.98, 284.02).

Se assumiamo la varianza nota σ0 = 100 il risultato sarebbe

x± z0.025100√

5= 180± 1.96

100√5

= (92.35, 267, 65).

9

Page 10: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

11 Esercizio

Le pile tipo AA hanno una durata media di 1 ora, mentre quelle AA+ di 2 ore.Una radio puo essere equipaggiata con uno dei due tipi di batterie, ma il tipoAA e 3 volte piu probabile del tipo AA+. La radio ha funzionato per una orae 30 minuti.

11.1 Supponendo che la durata delle pile segua una distri-buzione esponenziale, dire se e piu verosimile che laradio sia equipaggiata con le pile tipo AA.

Se le pile sono di tipo AA allora la durata X e X|AA ∼ Exp(λ = λAA) ≡Exp(1), mentre per le pile tipo AA+ X|AA+ ∼ Exp(λ = λAA+) ≡ Exp(2) laverosimiglianza di per x = 1.5 e

L(λ = 1) = 1−1 exp(−1.5) = 0.223 < L(λ = 2) = 2−1 exp(−1.5/2) = 0.236,

dunque e piu verosimile che la radio sia equipaggiata con pile tipo AA+ chetipo AA.

11.2 Calcolare la probabilita che la radio fosse equipag-giata con batterie tipo AA.

Si tratta di applicare il teorema di Bayes dove le probabilita a priori si ottengonorisolvendo il sistema di equazioni

Pr(AA) = Pr(λ = 1) = 3 Pr(AA+) = Pr(λ = 2)Pr(λ = 1) + Pr(λ = 2) = 1

Da cui Pr(λ = 1) = 3/4 e Pr(λ = 2) = 1/4. Le verosimiglianze sono statecalcolate nel punto precedente Pr(x = 1.5|λ) = L(λ)

Pr(λ = 1|x = 1.5) =Pr(x = 1.5|λ = 1) Pr(λ = 1)

Pr(x = 1.5|λ = 1) Pr(λ = 1) + Pr(x = 1.5|λ = 2) Pr(λ = 2)

=0.223 · 0.75

0.223 · 0.75 + 0.236 · 0.25

=0.1670.226

= 0.739

Quindi e piu probabile che la radio fosse equipaggiata con pile tipo AA.

12 Esercizio

Un produttore di computer vuole capire se la diffusione di due virus (A,B)e associato a un sistema operativo (W,M,L). A tal proposito raccoglie i datirelativi a 355 computer infettati

10

Page 11: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

W M LA 95 30 35B 95 32 68

12.1 Sulla base della risposta alla domanda del produtto-re si puo dire che il sistema operativo W causa ladiffusione di un virus ?

L’associazione tra due variabili non implica un nesso causale. Infatti vi possonoessere variabili confondenti come ad esempio l’operatore al computer, per cuipuo risultare che il sistema operativo sia associato al virus, mentre la causa didiffusione e una particolare azione dell’operatore.

12.2 Determinare se esiste associazione tra tipo di virus esistema operativo.

Si tratta di effettuare un test χ2 sull’indipendenza. La statistica χ2 osservatavale 7.26, da confrontare con il valore teorico al 95% χ2

ν=2,α=0.05 = 5.99, pertantoal 95% l’ipotesi di indipendenza tra sistema operativo e virus e rifiutata. Lostessa ipotesi pero non puo essere rifiutata al 99%, infatti χ2

ν=2,α=0.05 = 9.21 >7.26.

13 Esercizio

Due imprese si alternano nell’uso di un macchinario elettrico il cui consumo dimateria prima e rilevato in modo impreciso. Le rilevazioni dei consumi effettuatedalle due imprese sono le seguenti:

Mese Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov DicConsumo 6.0 6.8 6.3 5.6 5.7 4.7 4.6 5.6 6.3 5.5 6.9 5.6

13.1 Le due imprese decidono di non procedere al calcolodei compensi per il consumo se le variazioni di con-sumo a fine mese tra un’impresa e l’altra non sonosignificative al 5%. Supponendo che le variazioni diconsumo sia indipendenti e distribuite normalmentesi valuti se sia necessario procedere a compensi.

Le n = 11 variazioni di consumo osservate sono

Mese G F M A M G L A S O N Dd – 0.8 -0.5 -0.7 0.1 -1 -0.1 1 0.7 -0.8 1.4 -1.3

con media d = 0.0364 e scarto campionario ottenuta dalla radice della varianzacampionaria sd =

√S2d = 09036. Dobbiamo quindi testare

H0 : µD = 0 contro H1 : µD 6= 0,

11

Page 12: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

la cui statistica test e

T =d

sd/√n∼ t-Student10

e rifiutiamo se |T | > t0.025,ν=10, cioe se T > 2.23. Il valore osservato di T etobs = 0.0364

0.9036 ·√

11 = 0.133 dunque non rifiutiamo l’ipotesi che le variazioniabbiamo media 0.

13.2 Ipotizzando solamente che le variazioni di consumosiano indipendenti e identicamente distribuite conmedia 0 e scarto unitario esistono variazioni men-sili D che non siano compatibili con tali ipotesi ? Adesempio, variazioni osservate d per cui Pr(|D| ≥ d) ≤0.05 ?. Se si, quali ?

Sapendo che µD = 0 e σ2D = 1, applichiamo la diseguaglianza di Tchebycheff

Pr(|D| ≥ kσD) ≤ k−2

con σD = 1 e k−2 = 0.05, tutte le variazioni |D| ≥ 4.47 · 1 sono anomale.Concludiamo quindi che non ci sono osservazioni incompatibili con l’ipotesi dimedia nulla e varianza unitaria.

14 Esercizio

Per verificare l’associazione tra rendimento scolastico e un certo libro di testo estato effettuato uno studio su 100 scolari i cui risultati sono in parte riportatinella seguente tabella:

Mediocre BuonoTesto adottato 20 50Testo non adottato 50

45 55 100

14.1 Supponendo che l’insieme di tutti gli scolari sia esat-tamente composto dai 100 scolari intervistati e utiliz-zando la nozione frequentista di probabilita, si dicase diminuisce la probabilita di un rendimento buonoquando il testo e adottato.

La tebella completa e la seguente:

Mediocre BuonoTesto adottato 20 30 50Testo non adottato 25 25 50

45 55 100

Indichiamo con E l’evento il testo e adottato e con M lo scolaro ha un rendi-mento buono. Dobbiamo calcolare il rapporto

k =Pr(M | E)Pr(M | E)

=3025

= 1.2,

12

Page 13: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

quindi la probabilita aumenta del 20%.

14.2 Verificare l’ipotesi di indipendenza ai livelli di signi-ficativita del 5% e 1% tra rendimento e adozione dellibro.

Dobbiamo effettuare un test χ2 e rifiuteremo l’ipotesi di indipendenza (ai livellidi significativita del 5% e 1%) se la statistica χ2

obs e superiore a χ20.05,ν=1 = 3.84

(dalle Tavole). Le frequenze teoriche n∗ij sono

Mediocre BuonoTesto adottato 22.5 27.5 50Testo non adottato 22.5 27.5 50

45 55 100

Quindi

χ2obs =

2∑i=1

2∑j=1

(nij − n∗ij)2

eij' 1.01,

che essendo piu piccolo di 3.84 non possiamo rifiutare l’ipotesi di indipendenza.

15 Esercizio

In una campagna elettorale sono presenti solamente due schieramenti A e B. Daun exitpool casuale di 60 votanti su 10.000, 32 hanno dichiarato di aver votatoper lo schieramento A.

15.1 Si calcoli la stima di massima verosimiglianza delnumero di votanti per lo schieramento B.

I 60 questionari sono un campione casuale, quindi il numero X di voti perlo schieramento B nel campione intervistato segue la legge Binomiale: X ∼Bin(n = 60, p) e la stima di massima verosimiglianza di p e p = 28/60 da cui lastima di massima verosimiglianza del numero totale di voti per B e 4667.

15.2 Si calcoli l’intervallo di confidenza per il numero divoti per lo schieramento A.

In questo caso occorre calcolare un IC sulla proporzione p e moltiplicarne gliestremi per 10.000. Se scegliamo α = 0.05 abbiamo

(p− z1−α/2√p(1− p)/n, p+ z1−α/2

√p(1− p)/n)

= (3260− 1.96

√3260

(1− 3260

)/60,3260

+ 1.96

√3260

(1− 3260

)/60)

(0.4070973, 0.6595693)

Per cui al 95% di confidenza il numero di voti per lo schieramento A e compresotra 4071 e 6596.

13

Page 14: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

16 Esercizio

In un controllo di qualita dell’acqua sono stati estratti diversi campioni da duepozzi e su ogni campione e stato misurato il numero di colibatteri presenti. Idati sono riportati nella seguente tabella:

Pozzo A 130 110 60 70 160 130 90 120Pozzo B 210 240 280 240 280 250 190 200 180 290

Si ipotizzi che il numero di colibatteri sia distribuito secondo la legge di Poisson.

16.1 Si effettui una stima non distorta delle varianze delnumero di colibatteri.

La varianza di una Poisson e uguale alla media, quindi una stima non distortadella media e anche una stima non distorta della varianza. Dunque XA ∼Poisson(λA) e XB ∼ Poisson(λB), da cui xA = (130 + 110 + 60 + 70 + 160 +130 + 90 + 120)/8 = 108.75 e xB = (210 + 240 + 280 + 240 + 280 + 250 + 190 +200 + 180 + 290)/10 = 236.

17 Esercizio

Un produttore di vino possiede 40 ceppi d’uva. Per ogni ceppo ha contato ilnumero di grappoli avariati,Y . I valori ottenuti sono riportati nella seguentetabella:

yk nk0 151 102 15

17.1 Assumendo che il numero di grappoli avariati si di-stribuisce secondo una legge di Poisson, si propongauna stima corretta della media.

Una stima corretta della media e la media campionaria. Dunque E(Y ) = λ e

λ =3∑k=1

xknkN

=1040

+ 21540

= 1

14

Page 15: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

k Ak pk n∗k1 [0, 0) Pr(Y = 0) = 0.37 14.82 [1, 2) Pr(Y = 1) = 0.37 14.83 [2,∞) Pr(Y ≥ 2) = 0.26 10.4

17.2 Il produttore ritiene sia possibile assumere a) che ilnumero di grappoli avariati si distribuisca secondouna legge di Poisson e b) che la media della Poissonsia 1 grappolo per ceppo. Valutare la significativitadelle ipotesi del produttore.

Si tratta di effettuare due testi di adattamento per i dati alla distribuzione diPoisson. Nel caso a) con λ sconosciuto e nel caso b) con λ = 1. La tabella riportai risultati del raggruppamento in classi e il calcolo delle frequenze teoriche.

Dunque la regione di rifiuto per il test al livello del α = 5% e

XR = (χ22,1−0.05,∞) = (5.99,∞).

Si noti che in questo caso i gradi di liberta sono k − 1 in quanto abbiamostimato i parametro λ pari a 1. Non essendo λ specificato abbiamo usato i datidue volte e per cautelarci dall’incertezza sulla stima di λ dobbiamo utilizzareuna distribuzione χ2 con piu variabilita rispetto a quella utilizzata per λ noto(χ2ν=3).Le frequenze osservate sono n1 = 15, n2 = 10, n3 = 15 e il valore della

statistica test χ2 e

T =(15− 14.8)2

14.8+

(10− 14.8)2

14.8+

(15− 10.4)2

10.4= 3.59.

Essendo la statistica test caduta in zona di accettazione non rifiutiamo l’ipotesiche il campione provenga dalla legge di Poisson. Se λ fosse stata stato pari a1 le frequenze teoriche non si modificano (in questo caso la stima di λ coincidecon il valore teorico assunto, mentre aumenta il valore di soglia e la regione dirifiuto

XR = (χ23,1−0.05,∞) = (7.81,∞),

in quanto i gradi di liberta non sono 2, ma 3. Quindi entrambe le ipotesi delproduttore non possono essere rifiutate.

18 Esercizio

Un certo modello statistico produce la stima del terzo quartile della distribuzionedei mm di pioggia in una localita. Per 10 localita i dati riportati sono i seguenti:

Localita A B C D E F G H I Lquartili stimati (in mm) 1009 999 974 904 985 1043 1004 1027 1023 918

15

Page 16: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

18.1 Si proponga una stima corretta della varianzia, equindi della precisione, del modello supponendo chegli errori di previsione siano indipendenti e identica-mente distribuiti (i.i.d) con media e varianza finita.

Lo stimatore corretto della varianza sotto le ipotesi indicate nel testo e lavarianza campionaria:

S2 =1

n− 1

n∑i=1

(xi − x) = 2082.933.

Dunque la precisione e l’inverso della varianza cioe 1/2082.933 ≈ 0.0004, per-tanto il modello e poco preciso.

18.2 Supponendo che la stima dei quartili sia normale, sivaluti l’ipotesi che la precisione dello strumento siadi 0.0003 mm contro l’ipotesi che sia inferiore a 0.0003mm. Scegliere un livello di significativita.

E’ conveniente trasformare la verifica di ipotesi sulla precisione in verifica diipotesi sulla varianza, cioe l’inverso della precisione. Le ipotesi da verificaresono

H0 : σ2 = 3000 contro H1 : σ2 > 3000.

La statistica test e

T =S2

σ20

(n− 1) ∼ χ2n−1 | H0

e quindi la la zona di rifiuto e

S2

σ20

(n− 1) > χ2n−1,1−α.

Per n−1 = 9 e α = 0.05 il valore χ2 di soglia e 16.92, mentre il valore osservatodella statistica test e

tobs =2082.933

3000· 9 = 6.24,

pertanto non si rifiuta l’ipotesi nulla.

19 Esercizio

Due tecniche di produzione di barre d’acciaio sono messe a confronto. Entram-be le tecniche producono barre di acciaio con la stessa resistenza ma diversospessore. Il confronto dello spessore X viene effettuato su 9 barre prodotte conla tecnica A e 10 con la tecnica B. Per le 19 barre sono note le medie

xA = 3, xB = 4

e le varianze campionarie corrette:

s2xA= 4, s2xB

= 6.

Si assuma che lo spessore sia distribuito con legge Normale.

16

Page 17: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

19.1 Assumendo omoschedasticita degli spessori nei duetrattamenti, stabilire se la riduzione dello spessorecon il trattamento A e significativa al livello dell’1%.

Si tratta di una verifica di ipotesi sulla differenza delle medie di due popolazionicon varianze incognite ma uguali. Per semplificare la notazione poniamo X =XA e Y = XB . Quindi X ∼ N(µX , σ2) e Y ∼ N(µY , σ2). Dunque nX = 10,nY = 9. Le ipotesi a confronto sono

H0 : µX = µY ,∀σ2 > 0 contro H1 : µX < µY ∀σ2 > 0

la zona di rifiuto e

T =X − Y

Sp

√1nX

+ 1nY

< tnX+nY −2,1−α = −2.56,

dove la varianza comune e stimata tramite

Sp =

√(nX − 1)S2

X + (nY − 1)S2Y

nX + nY − 2,

Il valore osservato della statistica test e

3− 42.22/

√1/10 + 1/9

= −0.20

e quindi non rifiutiamo l’ipotesi nulla e dunque la riduzione dello spessore none significativa.

19.2 Assumendo omoschedasticita degli spessori nei duetrattamenti, si costruisca l’intervallo di confidenzasulla differenza di spessore tra la tecnica A e la tec-nica B.

Si tratta di determinare un IC sulla differenza di medie di due popolazioninormali con varianze incognite ma uguali.Indichiamo con X ∼ N(µX , σ2) lospessore con la tecnica A con Y ∼ N(µY , σ2) quello ottenuto con la tecnica B.Dunque nX = 10, nY = 9 e l’IC e(X − Y − tnX+nY −2,1−α/2Sp

√1nX

+1nY

, X − Y + tnX+nY −2,1−α/2Sp

√1nX

+1nY

),

dove la varianza comune e Sp = 2.22. Al livello del 5% l’IC e

(−1− 2.11 · 2.22 · 0.46,−1 + 2.11 · 2.22 · 0.46)

cioe(−3.15, 1.15)

che comprende ancora una differenza media nulla.

17

Page 18: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

20 Esercizio

Un veterinario stima che piu del 10% di un gregge sia stato contagiato da unamalattia infettiva. Poiche l’allevatore crede che questa proporzione sia esatta-mente pari al 10% perche ha esaminato personalmente 100 animali e ha trovatosolo 10 malati.

20.1 In base alla ricerca effettuata dall’allevatore calcola-re intervallo di confidenza al livello del 99% per laproporzione di animali malati.

Sia X la v.a. che conta il numero di animali malati, X ∼ Bin(100, p). La nu-merosita campionaria e sufficientemente elevata per utilizzare l’approssimazionenormale. Quindi l’IC asintotico e

(p− z1−α/2√p(1− p)/n, p+ z1−α/2

√p(1− p)/n)

e per p = 0.1 e z1−0.005 = 2.576 si ottiene

(0.1− 2.576√

0.1(1− 0.1)/100, 0.1 + 2.576√

0.1(1− 0.1)/100) = (0.0230, 0.177).

20.2 C’e evidenza a favore del veterinario ai livelli di si-gnificativita del 5% e del 10%?

Si tratta della verifica di ipotesi sul parametro p della legge binomiale:

H0 : p = 0.1 contro H1 : p > 0.1

la zona di rifiuto (asintotica, approssimata con il TLC) e

T =p− 0.1√p(1− p)/n

> z1−α,

Quindi i valori di soglia della statistica test sono z0.05 = 1.645 e z0.1 = 1.28Il valore osservato di T e tobs = 0 quindi l’ipotesi dell’allevatore non va

rifiutata e non c’e evidenza a favore del veterinario.

21 Esercizio

Sia X una variabile aleatoria continua distribuita con legge t-student centratacon 5 gradi di liberta e Y = X + 3.

21.1 Determinare il quinto decile della v.a. Y .

Il quinto decile e la mediana della distribuzione. Poiche la legge di X e sim-metrica allora la mediana e la media coincidono. Dunque se il valore atteso diX e E(X) = 0 allora E(Y ) = E(X + 3) = E(X) + 3 = 3. Aggiungendo osottraendo una costante da X la simmetria non cambia, quindi Y e ancora unav.a. continua centrata intorno alla media e dunque la mediana di Y e pari a 3.

18

Page 19: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

21.2 Calcolare il valore x > 0 tale che Pr(|X| < x) = 0.95.

Dobbiamo calcolare l’intervallo (−x, x) simmetrico attorno allo 0 nelle cui codela distribuzione di X lasci probabilita 0.025 a sinistra del valore −x (Pr(X <−x) = 0.025) e probabilita 0.025 a destra del valore x (Pr(X > x) = 0.025).Dalle tavole otteniamo che il valore di x ≈ 3.18.

22 Esercizio

Il tempo, X, necessario affinche un motore di un aereo necessiti di manutenzionee distribuito con legge esponenziale con media λ sconosciuta, X ∼ Exp(λ). Su5 motori sono stati misurati le seguenti ore di volo prima che venga decisa lamanutenzione.

1 2 3 4 5100 200 300 200 100

22.1 Calcolare una stima puntuale di λ.

Durante il corso abbiamo utilizzato due stimatori: lo stimatore dei momenti e lastima di massima verosimiglianza. Per la legge esponenziale entrambi coincidonocon la media campionaria λ = x = 180 ore.

22.2 Condizionatamente alla stima di λ calcolare la pro-babilita il motore abbia di meno di 100 ore di voloprima che venga decisa la manutenzione.

Per stimatore puntuale di λ, λ = 180 possiamo utilizzare la media campionaria,quindi

Pr(X < 100|λ = 180) =∫ 100

0

1180

exp{− 1180

x}dx ≈ 0.426.

23 Esercizio

Due avvocati utilizzano per alcune settimane un servizio di accesso ad archivilegislativi a pagamento. Le ore utilizzate sono le seguenti:

Settimana 1 2 3 4 5 6 7 8 9 10 11 12Consumo 6.0 6.8 6.3 5.6 5.7 4.7 4.6 5.6 6.3 5.5 6.9 5.6

19

Page 20: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

23.1 I due avvocati decidono di non procedere alla com-pensazione dei costi di utilizzo del servizio se le va-riazioni complessive di utilizzo tra una settimana el’altra non favoriscono nessuno dei due professionistial livello di significativita del 5%. Supponendo che levariazioni di consumo sia indipendenti e distribuitenormalmente si valuti se sia necessario procedere acompensi.

Le n = 11 variazioni di consumo osservate sono

Mese G F M A M G L A S O N Dd – 0.8 -0.5 -0.7 0.1 -1 -0.1 1 0.7 -0.8 1.4 -1.3

con media d = 0.0364 e scarto campionario ottenuta dalla radice della varianzacampionaria sd =

√S2d = 0.9036. Dobbiamo quindi testare

H0 : µD = 0 contro H1 : µD 6= 0,

la cui statistica test e

T =d

sd/√n∼ t-Student10

e rifiutiamo se |T | > t0.025,ν=10, cioe se T > 2.23. Il valore osservato di T etobs = 0.0364

0.9036 ·√

11 = 0.133 dunque non rifiutiamo l’ipotesi che le variazioniabbiamo media 0 e quindi non favoriscono nessuno dei due avvocati.

23.2 Ipotizzando solamente che le variazioni di consumosiano indipendenti e identicamente distribuite conmedia 0 e scarto unitario esistono variazioni men-sili D che non siano compatibili con tali ipotesi ? Adesempio, variazioni osservate d per cui Pr(|D| ≥ d) ≤0.05 ?. Se si, quali ?

Sapendo che µD = 0 e σ2D = 1, applichiamo la diseguaglianza di Tchebycheff

Pr(|D| ≥ kσD) ≤ k−2

con σD = 1 e k−2 = 0.05, tutte le variazioni |D| ≥ 4.47 · 1 sono anomale.Concludiamo quindi che non ci sono osservazioni incompatibili con l’ipotesi dimedia nulla e varianza unitaria.

24 Esercizio

Per verificare l’indipendenza tra il contatto con una sostanza tossica (C=Contatto,NC=Non Contatto) e una certa malattia (S=Sano, M=Malato) e stato effet-tuato uno studio su 100 persone. La meta degli individui e venuta a contattocon la sostanza. Tra gli individui che sono venuti a contatto con la sostanza, il40% e risultato sano, mentre tra coloro che non sono venuti a contatto con lasostanza la meta risulta malata.

20

Page 21: Esercizi sull’Inferenza - economia.unica.iteconomia.unica.it/statistica/dw/stat1/tu-inferenza1.pdf · Esercizi sull’Inferenza Stefano Cabras 17 giugno 2009 Sommario Alcuni esercizi

24.1 Supponendo che la popolazione di riferimento siacomposta da tutti gli intervistato si dica se la pro-babilita di ammalarsi aumenta con il contatto con lasostanza tossica.

La tebella completa e la seguente:

Sano MalatoContatto 20 30 50Non Contatto 25 25 50

45 55 100

Dobbiamo calcolare il rapporto

k =Pr(M | C)

Pr(M | NC)=

3025

= 1.2,

quindi la probabilita aumenta del 20%.

24.2 Verificare l’ipotesi di indipendenza ai livelli di signi-ficativita del 5% e 1% tra il contatto con la sostanzae la malattia.

Dobbiamo effettuare un test χ2 e rifiuteremo l’ipotesi di indipendenza (ai livellidi significativita del 5% e 1%) se la statistica χ2

obs e superiore a χ20.05,ν=1 = 3.84

(dalle Tavole). Le frequenze teoriche n∗ij sono

Sano MalatoContatto 22.5 27.5 50Non Contatto 22.5 27.5 50

45 55 100

Quindi

χ2obs =

2∑i=1

2∑j=1

(nij − n∗ij)2

eij' 1.01,

che essendo piu piccolo di 3.84 non possiamo rifiutare l’ipotesi di indipendenza.

21