44
Variabili casuali e Distribuzioni di Probabilità

Distribuzioni di Probabilita

Embed Size (px)

DESCRIPTION

slide dell'universita di pisa dipartimento di statistica

Citation preview

Page 1: Distribuzioni di Probabilita

Variabili casuali e

Distribuzioni di Probabilità

Page 2: Distribuzioni di Probabilita

Variabili Casuali (v.c.)

Una variabile casuale X e’ una funzione definita

sullo spazio campionario Ω che associa ad ogni

evento E ⊂⊂⊂⊂ ΩΩΩΩ un unico numero reale.

9E

1E

2E

8E

7E4E

6E5E

3E

1x

6x

4x

5x

2x3x

X

Ω

Page 3: Distribuzioni di Probabilita

Variabili casuali discrete e continue

• Una variabile casuale discreta può assumere un insieme discreto (finito o numerabile) di numeri reali.

• Una variabile casuale continua può assumere tutti i valori compresi in un intervallo reale.

ΩΩΩΩ discreto V.C. discreta

ΩΩΩΩ continuo V.C. discreta o continua

Page 4: Distribuzioni di Probabilita

Variabili casuali discrete

P(X=xi) Probabilità che la v.c. X assuma il valore xi

La funzione di probabilità di una variabile casuale discreta X associa ad ognuno dei valori xi la corrispondente probabilità P(X=xi)

Proprietà

0

1

=∑)x(P

)x(P

i

i i

Page 5: Distribuzioni di Probabilita

Esempio

Corrispondenza tra eventi e valori della variabile casuale X “somma dei punteggi”, nella prova “lancio di due dadi”

Page 6: Distribuzioni di Probabilita

Data una v.c discreta X, la funzione che fa corrispondere ai valori x le probabilità cumulate

viene detta funzione di ripartizione ed indicata con

Funzione di Ripartizione

( )xXP ≤

( ) ( ) ( )∑≤

==≤=xw

wXPxXPxF

Page 7: Distribuzioni di Probabilita

Esempio

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

0

0,2

0,4

0,6

0,8

1

1 2 3 4 5 6 7 8 9 10 11 12 13 x

F(x)

Page 8: Distribuzioni di Probabilita

Funzione di Ripartizione: proprietà

( ) 0=−∞→

xFlimx

( ) 1=∞→

xFlimx

( ) ( )00

xFxFlimxx

=+→

• è non decrescente, ossia:

• è continua a destra, ossia

( ) ( )2121 xFxFxx ≤⇒<

• Inoltre

Page 9: Distribuzioni di Probabilita

Variabili casuali continue

Chiameremo Funzione di densità, la funzione matematica f(x) per cui l’area sottesa alla funzione, corrispondente ad un certo intervallo, è uguale alla probabilità che X assuma un valore in quell’intervallo.

Page 10: Distribuzioni di Probabilita

• f(x)≥≥≥≥0 sempre

• L’area totale sottesa alla funzione =1, ossia

Proprietà delle funzioni di densità

∫∞+

∞−= 1dx)x(f

• La probabilità che la v.c. assuma un particolare valore dell’intervallo è zero.

Page 11: Distribuzioni di Probabilita

Funzione di Ripartizione

Data una v.c. continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P(X≤≤≤≤ x) viene detta funzione di ripartizione.

∫∞−

=≤=x

dw)w(f)xX(P)x(F

Page 12: Distribuzioni di Probabilita

Variabili casuali continue

Esempio:

0,0

0,5

1,0

1,5

2,0

0,0 0,5 0,7 1,0

0,229

xf

X

[ ]

1)()(

229,0)(

1;0

)1(12)(

)(~

1

0

7,0

5,0

2

∫∫

==

=

∈−=

∞+

∞−

dxxfdxxf

dxxf

x

xxxf

xfX

P(0,5<X<0,7)

Page 13: Distribuzioni di Probabilita

Esempio

Funzioni di densità e corrispondenti funzioni di ripartizione

0,00

0,50

1,00

1,50

2,00

1,5 3,00,0

0,2

0,4

0,6

0,8

1,0

0,0 1,5 3,0 0,0

( )xF

( )xF

( )xf

( )xf

x

x x

x

Page 14: Distribuzioni di Probabilita

Valore atteso di una v.c.

Il valore medio di una v.c. X, è definito come

( ) ( )∑=i

ii xPxXE Se la v.c. è discreta

Se la v.c. è continua( ) ( )∫∞+

∞−= dxxfxXE

Page 15: Distribuzioni di Probabilita

Esempio: v.c. discreta

( )

7 361

12362

11363

10

364

9365

8366

7365

6364

5363

4362

3361

2

=+++

+++++++=XE

X 2 3 4 5 6 7 8 9 10 11 12

P(x)

F(x) 136

136

236

336

436

536

636

536

436

336

236

1

361

363

366

3610

3615

3621

3626

3630

3633

3635

Page 16: Distribuzioni di Probabilita

Esempio: v.c. continua

Consideriamo la v.c.

con lambda una costante positiva e (Esponenziale). Il valore atteso è dato da

0≥x

xe~X λ−λ

( )λ

=λ= ∫∞+

∞−

λ− 1dxexXE x

0,0 0,5 1,0 1,5 2,0 2,5 3,00,0

0,4

0,8

1,2

1,6

2,0

Page 17: Distribuzioni di Probabilita

La varianza di una v.c.

La varianza V(X) di una variabile casuale X è definita da

( ) ( )( ) ( )∑ −=i

ii xPXExXV 2Se la v.c. è discreta

Se la v.c. è continua( ) ( )( ) ( )∫∞+

∞−−= dxxfXExXV 2

Page 18: Distribuzioni di Probabilita

Varianza di una v.c.

Notazioni alternative:

( ) ( )[ ] 2 XEXEXV −=

( ) ( ) ( )[ ] 2 2 XEXEXV −=

( ) ( )XVXSD =

oppure, dopo alcuni passaggi

La deviazione standard è definita

Page 19: Distribuzioni di Probabilita

V.c. Standardizzate

I valori standardizzati esprimono la distanza tra ivalori osservati e la media in termini di deviazionestandard.

Se X è una v.c. con valore E(X) e SD(X) allora:

)X(SD)X(EX

Y−=

È una v.c. standardizzata con E(Y)=0 e V(Y)=1

Page 20: Distribuzioni di Probabilita

Teorema di Chebyshev

Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza:

( ) ( )( )2

1

kXSDkXEXP ≤⋅≥−

Indipendentemente dalla distribuzione della v.c. , la probabilità che X assuma valori distanti dalla media piùdi k deviazioni standard è al più 1/k2

Page 21: Distribuzioni di Probabilita

Distribuzioni di probabilità

• Sono una estensione delle distribuzioni di frequenza

• Il caso più semplice da trattare è relativo a distribuzioni di probabilità di variabili discrete– Variabili discrete:

• Fenomeni di conteggio• Esperimenti con modalità limitate

– Variabili continue:• Misurazioni• Esperimenti con modalità nel continuo

Page 22: Distribuzioni di Probabilita

Metodi di sintesi delle distribuzioni• In analogia con quanto detto circa le distribuzioni

di frequenze, anche per le distribuzioni di probabilità abbiamo la necessità di sintetizzare i dati

• In particolare ci interessa una sintesi di centralità– Valore atteso

• Ed una sintesi della variabilità– Varianza– Scarto quadratico medio– Coefficiente di variazione

Page 23: Distribuzioni di Probabilita

Modelli probabilistici• Per modello si intende una legge di probabilità

in grado di misurare l’incertezza circa ilfenomeno reale sotto studio

Fenomeno realeFenomeno reale:

Numero di figli per famiglia

Modello matematicoModello matematico:

Distribuzione di probabilità da associare al fenomeno di interesse

per analizzarloRisultati dal lancio di un dado

Page 24: Distribuzioni di Probabilita

• In funzione del fenomeno reale sotto studio, si cerca di associare un modello opportuno a descriverne la variabilità

• I modelli si dividono in:– Modelli discreti, alcuni dei quali sono:

• Modello uniforme discreto• Modello binomiale• Modello poisson

– Modelli continui• Modello normale• Modello esponenziale

Page 25: Distribuzioni di Probabilita

Modello uniforme (1)

• Si tratta della distribuzione più semplice• Consente di valutare la probabilità di un

fenomeno per il quale ognuno degli kpossibili risultati sia equamente probabile.

• Ad esempio, la probabilità che un numero sia estratto al lotto è descritta dal modello Uniforme, perché ciascuno dei 90 numeri ha una probabilità pari a 1/90 di essere estratto.

Page 26: Distribuzioni di Probabilita

Modello bernoulliano (1)• Questo particolare modello è adatto a descrive la probabilità

associata a variabili dicotomiche, cioè fenomeni che assumono soltanto uno tra due possibili valori: x = 1 (si verifica un certo evento di interesse E, ed x = 0 se non si verifica l’evento E).

• Esempio: (morto vs vivo, maschio vs femmina; presenza di un evento di interesse contrapposto a tutti gli altri)

)1()var()(

1)0()1(

ppXpXE

pXPpXP

−==

−====

Page 27: Distribuzioni di Probabilita

Distribuzione di Bernoulli

Una v.c. di Bernoulli può assumere il valore 1 con probabilità ππππ e il valore 0 con probabilità 1-ππππ

La sua funzione di probabilità può essere espressa come

( ) ( ) 10 1 1 ,per xxXP xx =π−π== −

Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il sesso di un nascituro, il superamento o meno di un certo livello di inflazione….

Page 28: Distribuzioni di Probabilita

Modello Binomiale

• Il modello binomiale, descrive la probabilità il numero x di successi ottenuti in un campione di n prove (osservazioni):

)1()var()(

)1(

)1()!(!

!)|Pr(

pnpXnpXE

ppxn

ppxnx

npxX

xnx

xnx

−==

=

−−

==

Page 29: Distribuzioni di Probabilita

Modello Binomiale (2)• La formulazione Pr(X = x) indica che su n osservazioni si

sono verificati esattamente x successi e, di conseguenza, n – x insuccessi

• Poiché le prove sono indipendenti e la probabilità di successo è costante pari a p per ogni prova, osserveremo su n tentativi:– x con probabilità p– n – x con probabilità 1 – p

• Rimane da considerare il fatto che l’ordine in cui le prove sono osservate è variabile e noi siamo interessati solo al totale dei successi-insuccessi, non all’ordine

Page 30: Distribuzioni di Probabilita

Modello Binomiale (3)• Infatti, si potrebbero verificare:

– tutti i successi e poi tutti gli insuccessi– oppure un successo e un insuccesso in sequenza– oppure tutti gli insuccessi e poi tutti i successi …

• Per tenere conto di queste possibilità, le probabilità sono moltiplicate per il numero di possibili combinazioni di k

12...)1(!con )!(!

!×××−×=

−=

nnnxnx

nxn

Page 31: Distribuzioni di Probabilita

N=10 p=0.4

Page 32: Distribuzioni di Probabilita

Calcolo delle probabilità nel modellobinomiale

• Calcolare Pr(X = 3|n = 4, p = 0.1)

003609000104

901011231234

10110343

43X

13

343

...

..

).(.)!(!

!)Pr(

=××=

××××××××

=

−−

== −

Page 33: Distribuzioni di Probabilita

• Calcolare Pr(X ≥ 3) con n = 4 prove e p = 0.1

00370000100036010001019000104

901011234

1234901011231234

10110444

410110343

44X3X3X

0413

444343

......

....

).(.)!(!

!).(.)!(!

!)Pr()Pr(

=+=××+××=

××××××

×××+××

××××××

=

−−

+−−

=

=∪==≥

−−

Poiché le prove sono indipendenti per Hp

Perché 0! = 1 per definizione

Page 34: Distribuzioni di Probabilita

• Calcolare Pr(X < 3) con n = 4 prove e p = 0.1

∑=

==

=+=+===∪=∪==<

2

0i

iX

2X1X0X2X1X0X3X

)Pr(

)Pr()Pr()Pr()Pr()Pr(

6561010110040

40X 040 .).(.)!(!

!)Pr( =−−

== −

2916010110141

41X 141 .).(.)!(!

!)Pr( =−−

== −

0486010110242

42X 242 .).(.)!(!

!)Pr( =−−

== −

Page 35: Distribuzioni di Probabilita

N=4 p=0.1

Page 36: Distribuzioni di Probabilita

Esempi di Binomiale

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Binomiale(20;0,5)

Binomiale(7;0,5)

Page 37: Distribuzioni di Probabilita

Modello Poisson (1)

• Il modello Poisson si adatta a rappresentare esperimenti aleatori che danno luogo ad un numero discreto di eventi in un intervallo continuo (es. arrivi in un aeroporto in un’ora di tempo, )

• Le realizzazioni degli eventi devono avere le seguenti caratteristiche:– L’intervallo (di tempo o di spazio) è suddivisibile in n sotto-

intervalli all’interno dei quali la probabilità di manifestarsi di un evento è piccola e la probabilità di manifestarsi di più eventi tende a zero

– La probabilità di manifestarsi degli eventi nei sottointervalli è costante

– Eventi relativi a sotto intervalli differenti sono stocasticamente indipendenti (processo senza memoria)

Page 38: Distribuzioni di Probabilita

Modello Poisson (2)

• In termini matematici il modello è specificato come:

• Il parametro λ rappresenta il numero medio di eventi che si verificano nell’intervallo (numero atteso di successi)

Pr( | )!

xeX xx

λλλ−

= =

Page 39: Distribuzioni di Probabilita

Distribuzione di Poisson

Una v.c. di Poisson, è una v.c. discreta che può assumere qualsiasi valore intero non-negativo. La distribuzione di probabilità della Poisson è data da

K 2 1 0 ,,,xe!x

)x(Px

=λ= λ− ∞<λ<0

( ) λ=XE

( ) λ=XV

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Poisson(1)

Poisson(3)

Poisson(7)

Page 40: Distribuzioni di Probabilita

Modello Poisson (3)

• L’esperimento aleatorio di interesse è il “numero di arrivi di clienti presso una banca”

• Supponiamo che mediamente arrivino 3 clienti ogni minuto

• Ci interessa calcolare: – la probabilità che nello stesso intervallo arrivino

esattamente 2 clienti– la probabilità che nello stesso intervallo arrivino più

di 2 clienti

Page 41: Distribuzioni di Probabilita

Modello Poisson (4)

• Utilizzando la funzione della distribuzione Poisson, si ha che:

224012

718282923e2X

323

.)(

).(!

)Pr(

×===

−−

Page 42: Distribuzioni di Probabilita

Modello Poisson (5)

• Invece, per determinare

è più comodo notare che:

dove queste tre probabilità sono “semplici” da calcolare

∑∞

=

==>3i

iX2X )Pr()Pr(

)Pr()Pr()Pr()Pr()Pr(

2X1X0X2X12X

=+=+==≤−=>

Page 43: Distribuzioni di Probabilita

Modello Poisson (6)

049801

71828210

3e0X303

.

).(!

)Pr(

=

×===

−−

149401

718282313e1X

313

.

).(!

)Pr(

=

×===

−−

224012

718282923e2X

323

.)(

).(!

)Pr(

×===

−−

57702X .)Pr( =>

Page 44: Distribuzioni di Probabilita

Modello Poisson (7)• NB nel modello Poisson, il parametro λ

rappresenta anche la varianza oltre che il numero atteso di eventi

• Dunque, all’aumentare della media, aumenta anche la varianza della distribuzione

• Questo fa sì che nella pratica si possa ricorrere a formulazioni alternative del modello Poisson, che permettono di “modellare” in modo indipendente il termine di variabilità