16/03/2012
1
STATISTICA A – D (72 ore)Marco Riani
[email protected]://www.riani.it
Tipologia di v.a.
• v.a. discreta � numero finito di valori (infinità numerabile)
• x1 x2, …, xk
• con probabilità• p1 p2 …, pk
• Esempio: lancio di una moneta (dado)
16/03/2012
2
Es. v.c. associata al lancio di un dado
• Calcolare• Rappresentare
graficamente la funzione di ripartizione F(3,14)? F(-0,37)? F(3,57)? F(6,5)?
• E(X)?• VAR(X)?
Valori x i
Probabilità p i
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1
x
F(x)
F(3,14)? F(-0,37)? F(3,57)? F(6,5)?
Rappresentazione grafica di F(x)
16/03/2012
3
Soluzione
• F(3,14)=0,50• F(-0,37)=0• F(3,57)=0,50• F(6,5)=1
Es. v.c. associata al lancio di un dado
• E(X)= 1×1/6 + 2×1/6+…6×1/6=21/6=3,5
Valori x i
Probabilità p i
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1
16/03/2012
4
Es. v.c. associata al lancio di un dado
Valori x i
Probabilità p i
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1
Tipologia di v.a.
• v.a. continua� può assumere tutti i valori di un intervallo
• La probabilità di un singolo valore è 0• Si calcola la probabilità che X sia
compresa in un intervallo• a ≤ X ≤ b
16/03/2012
5
Area tratteggiata =
10
Proprietà di F(x)V.A DISCRETA
V.A CONTINUA
continua a destra
assolutamente continua
16/03/2012
6
Parametri di una v.a. (p. 192)
• Valore atteso (valore medio)– v.a. discreta
– v.a. continua (funzione di densità f(x))
In generale, dato g(x) (p.193)
• Valore atteso (valore medio)– v.a. discreta p1, p2, …
– v.a. continua (funzione di densità f(x))
16/03/2012
7
Nella varianza g(x) = (x-E(X))2
• VARIANZA– v.a. discreta p1, p2, …
– v.a. continua (funzione di densità f(x))
Esercizio• Punto 5 euro alla
roulette su un numero
X = “guadagno” ⇒⇒⇒⇒ prima del gioco è una v.a.
Distribuzione della v.c. guadagno
Calcolare il valore atteso e la varianza della v.c. guadagno
16/03/2012
8
Esempio
Distribuzione della v.c. X = “guadagno”
x i p i
- 5 36/37
175 1/37
1
E(X) = -5⋅⋅⋅⋅(36/37) + 175⋅⋅⋅⋅(1/37) = -0,135 €VAR(X) =[-5 – (-0,135)] 2⋅⋅⋅⋅(36/37) + [175-(-0,135)]2
⋅⋅⋅⋅(1/37) = 852 €σσσσ(X) = 29,19 €
Es. v.c. continua (p. 198)
• Verificare che – f(x)=2x se x ϵ [0 1] – f(x)=0 altrimenti è una funzione di densità
• E(X)? VAR(X)?
16/03/2012
9
Calcolo del valore atteso
• In alternativa utilizzando la formula
Calcolo della varianza
VAR(X)= E(X2)-[E(X)]2
16/03/2012
10
Analisi di alcune v.a. fondamentali
20
Variabile di Bernoulli p. 20 (bernoulliana)
Esperimento aleatorio con 2 possibili esiti:Insuccesso: 0Successo: 1
x p(x)0 1-π1 π
E(X) = ?
E(X) =0(1-ππππ)+1 ππππ = ππππ
16/03/2012
11
Richiami di matematica: potenze del binomio
Variabile binomiale (p. 20)
Si ripete n volte un esperimento bernoulliano
• indipendenza delle prove• probabilità costante di un successo (π) in
ciascuna provaX = numero di successi nelle n prove
v.a. binomiale: X ∼ B(n, π)
P(X=s) = p(s) = ?
16/03/2012
12
Variabile binomiale (p. 21)X = numero di successi nelle n prove
v.a. binomiale: X ∼ B(n, π)
s=0,1, 2, …., n
Dimostriamo che l’espressione che segue è una densità
Occorre dimostrare che
s=0,1, 2, …., n
16/03/2012
13
Valor medio e varianza della v.a. Binomiale
Relazione tra Binomiale e Bernoullina
• Binomiale = Somma di n v.a. Bernoulliane (X1 X2 …, Xn) indipendenti con Pr successo pari a π
• E(Binomiale)=E(X1+X2+…+Xn)= • E(X1) +E(X2) +…+E(Xn)= π+ π+…+ π• E(Binomiale)= nπ• VAR(Binomiale)=VAR(X1+X2+…+Xn)=• =VAR(X1)+VAR(X2)+…+VAR(Xn)• = nπ(1- π)
16/03/2012
14
Esempio
• v.a. X= {numero di facce testa in 3 lanci di una moneta}
• Qual è la distribuzione di probabilità del numero di successi Pr(X=x)
• X~B(3; 0,5)• Pr(X=x)? E(X)? VAR(X)?
3 lanci di una moneta; successo = “testa” (ππππ = 0,5):X ∼∼∼∼ B(3, 0,5)
x p(x)0 (1-0,5)3 = 0,1251 3⋅⋅⋅⋅0,5⋅⋅⋅⋅0,52=0,3752 3⋅⋅⋅⋅0,52⋅⋅⋅⋅0,5=0,3753 0,53 = 0,125
Esempi
E(X) = nπ =3· 0,5 = 1,5
VAR(X) = nπ(1- π)= 3 ·0,5 ·0,5 = 0,75
16/03/2012
15
Osservazioni sulla simmetria
n=5
n=10
n=8
alcuni grafici della distribuzione binomiale per π=0.4 e diversi valori di n
� la simmetria aumenta all’aumentare di n
ESERCIZIO
Si ritiene che una certa terapia medica abbia effetti positivi con probabilità 0,3. La terapia è somministrata a 20 pazienti (con le stesse caratteristiche).i) Prob. che la terapia abbia successo su
3 pazienti?ii) Si scriva l’espressione della probabilità
che la terapia dia effetti positivi per almeno 3 pazienti.
iii) Si dica per quanti pazienti ci si può attendere che la terapia dia effetti positivi.
16/03/2012
16
Soluzione
ππππ = 0,3 n = 20 X∼∼∼∼B(20; 0,3)
Pr(X=3)=
32
Soluzione
i) ππππ = 0,3 n = 20 X∼∼∼∼B(20; 0,3)
Pr (X≥≥≥≥3) =
16/03/2012
17
33
Soluzione
i) ππππ = 0,3 n = 20 X∼∼∼∼B(20; 0,3)
Pr (X≥≥≥≥3) =
ii)E(X) = n ⋅π⋅π⋅π⋅π = 20⋅⋅⋅⋅0,3 = 6
Frequenza relativa
La v.a. P = “ frequenza relativa di successi in n prove indipendenti " assume i valori
p = 0 p = 1/n p = 2/n … p = 1in corrispondenza dis = 0 s = 1 s = 2 … s = n
Pertanto, la v.a. P si interpreta come numero di successi / n
Ha distribuzione {Binomiale(n, π)}/nE(P)? VAR(P)?
16/03/2012
18
Relazione tra P e B (p. 22 e p. 23)
• Se X ~ B(n π)• E(P)= E(X/n)?• E(X/n)= (1/n) E(X) = (1/n) nπ= π• VAR(P)=?• VAR(P)=VAR(X/n)=(1/n2) VAR(X)= (1/n2)
n π (1-π)= π (1-π) / n
v.a. NORMALE (o GAUSSIANA)
• Modello degli errori accidentali (Gauss inizi dell’800)
• ERRORI ACCIDENTALI= errori che si commettono misurando più volte, in via indipendente e con il medesimo grado di accuratezza, una certa grandezza
• Es. misura dell’altezza di un monte• Es. conteggio manuale voti Bush-Gore
16/03/2012
19
Caratteristiche
µ-σ µ µ+ σ
Fun
zion
e di
den
sità
1. Ha una forma a campana2. Dipende dai parametri µ e σ
3. E’ massima quando x = µ4. Ha due punti di flesso in
corrispondenza di µ-σ e µ+σ
5. È simmetrica rispetto alla media
6. È asintotica rispetto all’asse delle ascisse
X∼∼∼∼N(µ, σ2)
Significato dei parametri: µ
• Stessa variabilità ma diversa media
16/03/2012
20
Significato dei parametri: σ
• Stessa media ma diversa variabilità
Normale e normale standardizzata
• Se X~N(µ, σ2)• Z=(X-µ)/σ come è distribuita?• E(Z)? VAR(Z)?• E(Z)=(1/σ) E(X-µ)= (1/σ) [E(X)-µ]=0• VAR(Z)= VAR[(X-µ)/σ]= 1/σ2 VAR(X)=1• Z~N(0,1)
-1 0 1
16/03/2012
21
Calcolo della probabilità associata ad un intervallo (x1,x2]
F(x2) – F(x1)dipende dai
parametri µµµµ e σσσσ2.
x1 x2 x z1 z2 z
Calcolo della probabilità associata ad un intervallo (x1,x2]
F(x2) – F(x1)dipende dai parametri µµµµ e σσσσ2.
La funzione di ripartizione della v.a. normale stan dardizzata, F(z), è funzione solo di z e il suo andamento coincide co n quello di F(x) ⇒⇒⇒⇒ la probabilità associata all’intervallo (x 1,x2] coincide con la probabilità dell’intervallo (z 1,z2]
x1 x2 x z1 z2 z
16/03/2012
22
Funzione di ripartizione della N(0,1) è tabulata
• Impiego della tavola della funzione di ripartizione della v.a. normale
standardizzata riportata in Appendice
per z variante da –4 a +4, con passo 0,01
Si calcolano i corrispondenti scostamenti standardizzati:
z1 = e z2 =
• si leggono sulla tavola i valori F(z1) e F(z2)
• La probabilità associata all’intervallo (z 1,z2] èF(z2) - F(z1)
• e coincide con la probabilità che la v.a. cada nell’intervallo (x 1,x2]
Probabilità associata ad un intervallo (x 1,x2] di una v.a. N( µµµµ, σσσσ2)
16/03/2012
23
Esempio 1Lunghezza dei pezzi prodotti da una macchina: µµµµ = 200 mm; σσσσ = 0,6 mm
X∼∼∼∼N(200; 0,62)Limiti di tolleranza: (199; 200,8]
Calcolo della percentuale di pezzi scartati
199 200 200,8
P(X<199)? P(X>200,8)?
X∼∼∼∼N(200; 0,62)
• Z=(X-200)/0,6 ~N(0,1)199 200
• Pr(X<199)=Pr((X-200)/0,6<(199-200)/0,6)=Pr(Z <(199-200)/0,6)=Pr(Z < -1,67)= 0,04746 ⇒⇒⇒⇒ 4,75% circa di
pezzi scartati perché inferiori alla tolleranza
16/03/2012
24
• Pr (X > 200,8)• Pr (Z>(200,8-200)/0,6)
F(z) = F(1,33) = 0,908241 – F(1,33) = 0,09176 ⇒⇒⇒⇒ 9,18% circa
• Pezzi rifiutati: 0,04746+0,09176 = 0,13922 (13,9% )• Pezzi accettati: F(1,33) – F(-1,67)== 0,90824 – 0,04746 = 0,86078 ⇒⇒⇒⇒ 86,1%
-1,67 0 1,33 z
199 200 200,8
Esercizi da svolgere per MAR 20 marzo
16/03/2012
25
Esercizio
• Esperimento aleatorio: lancio di due dadi.• v.a. X= somma dei numeri che appaiono
nelle due facce• Costruire
– lo spazio degli eventi – la distribuzione di probabilità della v.a. X e
rappresentarla graficamente– la funzione di ripartizione– E(X)? Moda? VAR(X)?
ESERCIZIO
• Un’azienda che assembla computer rileva difetti di assemblaggio nel 20% dei casi. Con riferimento ad un campione di 30 computer:
• si descrivano le caratteristiche delle variabili aleatorie “numero di difetti” e “frequenza relativa di difetti”;
• si scriva l’espressione (senza effettuare i calcoli) che consente di determinare la probabilità che nel campione vi sia un numero di pezzi difettosi maggiore di 2 e un numero di pezzi difettosi compreso fra 2 e 5.
50
16/03/2012
26
Esercizio
• Peso netto (in grammi) delle scatole di un prodotto: X ∼∼∼∼N(797; 16)
• Percentuale di scatole con peso nell’intervallo 790 – 800?
• Primo decile?
Esercizio
Durata di accensione di lampade di un certo tipo: X ∼∼∼∼N(µµµµ; σσσσ2).
Il 10% delle lampade dura meno di 700 ore
Il 4% delle lampade ha una durata superiore a 800 ore.
• Calcolo di media e varianza ( µµµµ?; σσσσ2?)