Upload
others
View
19
Download
0
Embed Size (px)
Citation preview
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
SCIENZE NATURALI - MODULO DI STATISTICA
A.A. 2011/12 – Esercizi di Probabilità e Statistica NOTA: gli esercizi seguenti sono da svolgere in preparazione dell'esame del modulo di Statistica, ma
alcuni sono pensati da svolgere con l'ausilio di strumenti di calcolo o di software superiori a quelli richiesti per la prova scritta.
1. Se in una specie animale le nascite di maschi e femmine hanno la stessa probabilità
e se ogni nascita non influenza le altre, qual è la probabilità che di otto figli,
cinque siano femmine e tre maschi? E quella che le femmine siano almeno cinque?
2. Qual è la probabilità di vincere giocando l'ambo 1,2{ } sulla ruota di Milano? E'
diversa dalla probabilità di vincere giocando l'ambo 31,49{ }?
3. Se si gioca un ambo su tutte e dieci le ruote del lotto, si vince se esce in almeno una
di esse. Qual è la probabilità di vincere? (Suggerimento: si calcoli prima la
probabilità di non vincere).
4. Un mazzo di carte piacentine da briscola è composto da quattro "semi" di 10 carte
ciascuna: asso, due, tre, quattro, cinque, sei, sette, fante, cavallo, re. I semi sono:
denari, coppe, spade e bastoni. Ad un giocatore sono date tre carte. Che
probabilità c'è che siano tre re? E che siano un re, un fante ed un asso? O che siano
di tre semi diversi?
5. La densità di probabilità di una grandezza è una gaussiana di media µ = 6 e
deviazione standard ! = 1. Qual è la probabilità di trovare una grandezza di
misura inferiore a 4?
6. In un pollaio ci sono 12 anatre, 15 galline faraone, 16 galline e 9 tacchini. Si
traccino diagrammi a colonne, a torta e a ideogrammi per illustrare questi dati.
7. Secondo la formula di Poisson, se la media delle misure di una grandezza è m = 9,
che probabilità c'è di trovare una misura uguale a 7?
8. Mediante alcuni esperimenti sono state ricavate le seguenti coppie di dati:
x !2 !1 0 1 2 3y 3 4 5 6,5 8 10,5
. Si provi dapprima a calcolarne il polinomio
interpolatore, (di 5° grado). Si trovi poi la retta di regressione ed il coefficiente di
correlazione. Infine, passando per un diagramma semilogaritmico, si trovi la
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
regressione esponenziale y = a !em!x ed il coefficiente di correlazione. Quale dei
tre modelli sembra "migliore" per rappresentare matematicamente i dati?
9. Mediante alcuni esperimenti sono state ricavate le seguenti coppie di dati:
x !2 !1 0 1 2 3y !5 !2 0 2 3 4
. Si trovi la retta di regressione ed il coefficiente di
correlazione. Seguendo poi il procedimento geometrico illustrato negli appunti, si
provi a trovare anche la regressione quadratica y = a !x2 + b ! x + c . Si riporti poi il
tutto su un grafico cartesiano.
10. A due gruppi di volontari malati di una stessa patologia sono stati somministrati
un farmaco ed un placebo (ossia uno pseudo-farmaco senza principio attivo). Il
farmaco è stato somministrato a 60 pazienti e ne sono migliorati 42. Il placebo
invece è stato somministrato a 54 pazienti e ne sono migliorati 20. Qual è la
probabilità che l'effetto sia lo stesso, ossia che il farmaco sia inutile?
11. Un conteggio di ragnatele in una vecchia ala di 10 aule di una scuola ha dato il
risultato seguente. La distribuzione è da considerarsi casuale?
!
aula 1 2 3 4 5 6 7 8 9 10ragnatele 78 18 64 24 30 70 59 10 15 22
.
12. Decidiamo di "investire" denaro giocando al lotto su un numero fisso (il 30) sulla
ruota di Genova. Il "budget" a disposizione è 50.000 euro. In caso di uscita del
nostro numero (a proposito, che probabilità ha?) la Sisal paga 11,2 volte l'importo
che abbiamo giocato: se puntiamo un euro, ne vinceremmo 11,20, quindi il
guadagno netto è 10,20 euro. Decidiamo però di non volere guadagnare, ma solo
di non rimetterci, perciò cominciamo con un euro e, se non esce per 11 volte, la
dodicesima aumentiamo la giocata in modo che in caso di vincita recuperiamo per
intero la somma spesa fino a quel momento (12 euro). E così ci comporteremo
anche nelle giocate successive finché non vinceremo o fino a che avremo denaro
sufficiente. Se siamo sfortunati, dopo quante giocate al massimo dovremo
interrompere il gioco perché non abbiamo più denaro sufficiente per la giocata
successiva? E se volessimo guadagnare alla fine 10,2 �?
13. Si stabilisca la frequenza delle 21 lettere del nostro alfabeto nella poesia “San
Martino” di G. Carducci (1835-1907) (professore ordinario a Bologna e premio
Nobel per la lettereratura). (Suggerimento: si scriva il testo in Word e una per una
si sostituiscano le 21 lettere con il simbolo =; automaticamente Word fornisce il
numero di sostituzioni).
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
Risposte
1. Secondo la formula di Bernoulli, la probabilità di cinque femmine e tre maschi è
85
!
" # #
$
% & & '
12
!
" # #
$
% & &
5'
12
!
" # #
$
% & &
3=
83
!
" # #
$
% & & '
12
!
" # #
$
% & &
8=
8 '7 '63'2 '1 '256
=732
= 0,21875 ( 21,9% . La probabilità che
almeno cinque siano femmine, oltre al caso precedente, comprende anche sei,
sette od otto femmine, quindi, ricordando che
nk
!
" # #
$
% & & =
nn ' k
!
" # #
$
% & & , si ottiene:
1256
!83
"
# $ $
%
& ' ' +
82
"
# $ $
%
& ' ' +
81
"
# $ $
%
& ' ' +
80
"
# $ $
%
& ' '
"
#
$ $
%
&
' ' =
56 + 28 + 8 + 1256
=93
256( 36,3%
2. La probabilità di un ambo su una ruota si calcola prendendo come spazio
campionario l'insieme delle cinquine possibili, che sono
905
!
" # #
$
% & & e considerando come
evento l'uscita di una cinquina con i due numeri che abbiamo giocato: queste
devono avere oltre ai nostri due numeri, altri tre fra i 90-2 = 88 rimanenti, ossia ce
ne sono
883
!
" # #
$
% & & . Pertanto la probabilità di vincere giocando un qualunque ambo è:
883
!
" # #
$
% & &
905
!
" # #
$
% & & =
88 '87 '86 '5' 4 '3'2 '13 '2'1' 90 '89 '88 '87 '86
=5' 4
90 '89=
104005
( 0,25% . Un approccio
alternativo: il primo numero deve essere uno dei cinque numeri estratti sui 90
disponibili, quindi ha probabilità 5/90 di uscire; se esce, il secondo deve essere uno degli
altri quattro numeri estratti sui restanti 89, quindi ha probabilità 4/89. Pertanto, la
probabilità è: 590
!489
=10
4005.
3. Calcoliamo la probabilità dell'evento complementare, ossia la non uscita del nostro
ambo su nessuna delle 10 ruote. Dall'esercizio precedente, su ogni ruota la
probabilità di non uscita è 1! 10
4005=
39954005
" 99,75% . Il risultato su una ruota non
influenza quello sulle altre, perciò la probabilità di perdere è pari a
39954005
!
" # #
$
% & &
10' 97,53% . Dunque, la probabilità di vincere è 100 !97,53( )% " 2, 47% .
4. Dal testo appare chiaro che ogni carta estratta non viene rimessa nel mazzo. Ciò
posto, la probabilità che prima carta sia un re è 4/40 = 1/10; se la prima è un re,
la probabilità che lo sia anche la seconda è 3/39 = 1/13; se le prime due sono dei
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
re, la probabilità che lo sia anche la terza è 2/38 = 1/19. Dunque, la terna di tre re
ha probabilità 1
10!
113
!119
=1
2470" 0, 04% . (Un approccio alternativo: le terne
possibili sono
403
!
" # #
$
% & & ; quelle formate da tre re sono
43
!
" # #
$
% & & =
41
!
" # #
$
% & & = 4; allora la probabilità di tre
re è 4 40
3
!
" # #
$
% & & =
4 '640 '39 '38
=1
2470). Ragionando come sopra, se l'ordine di estrazione
è (re, fante, asso) il re ha probabilità 4/40, il fante 4/39 e l'asso 4/38, quindi
4 !4 !4
40 !39 !38=
43705
" 0,1% . Se invece l'ordine di estrazione non ha importanza, ma
contano le tre carte che il giocatore ha in mano, allora occorre moltiplicare per
3! = 6, ottenendo
43705
!6 =8
1235" 0, 65% . (Un approccio alternat ivo: ci sono
43 = 64 terne ordinate costituite ciascuna da un re, un fante ed un asso; le terne non
ordinate di carte sono
403
!
" # #
$
% & & e quindi abbiamo, come sopra,
64 40
3
!
" # #
$
% & & =
64 '640 '39 '38
=8
1235). Nell'ultimo caso, la prima carta è indifferente
(probabilità = 1), la seconda deve essere una delle 30 su 39, di seme diverso dalla
prima (30/39 = 10/13), e la terza una delle 20 su 38, di seme diverso dalle prime
due (20/38 = 10/19); ne segue 1 !10
13!1019
=100247
" 40,5% . (Un approccio
alternativo: una terna con tre semi diversi, quindi uno escluso, ha 103 possibili scelte;
poiché le scelte del seme escluso sono 4, ci sono 4000 terne possibili con tre semi
diversi. Ne segue 4000 40
3
!
" # #
$
% & & =
4000 '640 '39 '38
=100247
).
5. La funzione gaussiana di media µ = 6 e scarto quadratico medio σ = 1 ha equazione:
y =
12!
" e# 1
2x#6( )2 . E' noto che nell'intervallo µ !2", µ +2"[ ] = 4, 8[ ] è racchiuso
circa il 95% dell'area tra la gaussiana e l'asse x, (più precisamente, il 95,45%) che
in totale vale 1; pertanto, per simmetria, nell'intervallo !", 4] ] è racchiusa metà
dell'area residua, ossia 12
1 ! 0, 95( ) = 0,025 ; allora la probabilità dell'evento !", 4] ], ossia di trovare un dato di misura minore di 4 è del 2,5%. (Più precisamente, la
probabilità è p(E) ≈ 2,275%).
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
6. Per rappresentare 12 anatre, 15 faraone, 16 galline e 9 tacchini del pollaio
mediante istogrammi possiamo servirci di carta millimetrata o di un banale
software da disegno o Excel. Per un diagramma a torta occorre calcolare il totale
del pollame, ossia 52, poi (se si lavora in gradi) fare le 4 proporzioni: per le anatre,
12:52 = x:360, da cui x ! 83° ; idem per gli altri tre tipi di animali da cortile (o ne
bastano altri due?) ed infine col goniometro o con software apposito tracciare un
cerchio e i quattro angoli al centro trovati. Oppure, con Excel si fa in automatico
ed è calcolata la percentuale di ogni categoria sul totale. Per gli ideogrammi,
occorrerebbe trovare una figurina per ciascuno dei quattro tipi di pollame e
ripeterla tante volte quant'è il numero di capi. Potete provare per divertimento!
7. La formula di Poisson, dice che la probabilità che una variabile aleatoria x di media
m sia uguale ad un valore h è
!
p x = h( ) =mh
h!"e#m. Allora,
!
p x = 7( ) =97
7!"e#9 $ 0,117.
8. Il polinomio interpolatore della tabella
x !2 !1 0 1 2 3y 3 4 5 6,5 8 10,5
è del tipo
!
y = a5 " x5 + a4 " x4 + a3 " x3 + a2 " x2 + a1 " x + a0 . Si impone il passaggio di questa
curva per i sei punti
!
"2, 3( ), K , 3, 10.5( ), ottenendo un sistema lineare di sei
equazioni nelle sei incognite
!
a0,K, a5. Chi, come me, preferisce i calcoli in forma
simbolica, al posto di 6,5 si scriva 13/2, e al posto di 10,5 si scriva 21/2.
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
!
"32a5 +16a4 "8a3 + 4a2 "2a1 + a0 = 3"a5 + a4 " a3 + a2 " a1 + a0 = 4
a0 = 5a5 + a4a3 + a2 + a1 + a0 = 13 2
32a5 +16a4 + 8a3 + 4a2 + 2a1 + a0 = 8243a5 + 81a4 + 27a3 + 9a2 + 3a1 + a0 = 21 2
#
$
% % %
&
% % %
!
" C =
#32 16 #8 4 #2 1 3#1 1 #1 1 #1 1 40 0 0 0 0 1 51 1 1 1 1 1 13 232 16 8 4 2 1 8
243 81 27 9 3 1 21 2
$
%
& & & & & & &
'
(
) ) ) ) ) ) )
Il sistema si risolve applicando alla matrice C l’algoritmo di Gauss-Jordan (conviene
prima scambiare di posto la prima e la quarta riga e poi portare la terza riga all’ultimo
posto)(1). Alla fine si ottiene il polinomio
!
y =148
x5 "124
x4 "5
48x3 +
724
x2 +43
x + 5. La
retta di regressione si ottiene invece come indicato nel cap. 3:
!
x = 1 2 = 0,5;
!
"x =196
#14
=1056
$ 1,7078 $ 1,7. Poi,
!
y = 37 6 " 6,17 e
!
"y =2306
# 2,5276 # 2,53.
Infine,
!
cxy =446
"3712
=174
= 4,25.
Allora la retta è:
!
m = cxy "x2
=174
#36
105=
5135
$ 1,457
q = y %m # x = 376
%5135
#12
=571105
$ 5,438
&
' ( (
) ( (
* y = 1,457x + 5,438.
Il coefficiente di correlazione è
!
r =cxy
"x # "y=
174
#6
105#
6230
$ 0,9845.
Infine, per calcolare la regressione
esponenziale, facciamo uso di un diagramma
semilogaritmico, sostituendo ai dati y i loro
logaritmi:
!
x "2 "1 0 1 2 3y# = ln y( ) 1,10 1,38 1,61 1,87 2,08 2,35.
Allora
!
y " # 1,73,
!
"y# $ 0,5 e
!
cxy" # 0,72. Ne
segue
!
y" = 0,246x +1,61, con
!
r " 0,999.
Allora,
!
y = e1,61 "e0,246x # 5 "e0,246x .
I grafici sono eseguiti con Geogebra: in rosa
il polinomio interpolatore; in nero la retta e
in blu l’esponenziale. Quest’ultima
approssima meglio i dati rispetto alla retta.
(1) Esiste però una formula di Lagrange per calcolarlo.
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
9. Nella tabella
x !2 !1 0 1 2 3y !5 !2 0 2 3 4
i dati x sono gli stessi dell’esercizio precedente,
pertanto
!
x = 1 2 = 0,5;
!
"x =196
#14
=1056
$ 1,7078 $ 1,7. Poi,
!
y = 13" 0,33,
!
"y =586
#19
=863
$ 3,09 . Infine,
!
cxy =316
" 5,17. La retta di regressione ha
quindi
!
m =316
"36
105=
6235
# 1,77,
!
q =13"
6235
#12
= "58
105$ "0,55, ed il coefficiente di
correlazione è
!
r =316
"6
105"
386
# 0,979. Per trovare la parabola di regressione,
poniamo:
!
X =
"2"10123
#
$
% % % % % % %
&
'
( ( ( ( ( ( (
,
!
T = X2 =
410149
"
#
$ $ $ $ $ $ $
%
&
' ' ' ' ' ' '
,
!
Y =
"5"20234
#
$
% % % % % % %
&
'
( ( ( ( ( ( (
,
!
U =
111111
"
#
$ $ $ $ $ $ $
%
&
' ' ' ' ' ' '
,
!
" Y = a #T + b # X + c #U.
Imponiamo ora che il vettore Y’-Y sia
perpendicolare ai vettori T, X, U,
ponendo = 0 il loro prodotto scalare.
Otteniamo il sistema:
!
T " # Y $ Y( ) = 0
X " # Y $ Y( ) = 0
U " # Y $ Y( ) = 0
%
& ' '
( ' '
)
T " # Y = T " YX " # Y = X " YU " # Y = U " Y
%
& '
( '
.
Sostituiamo
!
" Y = a #T + b # X + c #U:
!
T "T( ) #a + T " X( ) #b + T " U( ) #c = T " Y
X "T( ) #a + X " X( ) #b + X " U( ) #c = X " Y
U "T( ) #a + U " X( ) #b + U " U( ) #c = U " Y
$
% & &
' & &
.
Ora eseguiamo quei prodotti scalari:
!
115a + 27b +19c = 2827a +19b + 3c = 3219a + 3b + 6c = 2
"
# $
% $
&
a = '1 4b = 283 140c = 4 35
"
# $
% $
.
Pertanto, in forma approssimata abbiamo
la retta
!
y = 1,77x " 0,55 e la parabola
!
y = "0,25x2 + 2,02x + 0,114.
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
10. Dei due gruppi di volontari malati, col farmaco sono migliorati 42 e non migliorati
60-42 = 18; col placebo sono migliorati 20 e non migliorati 54-20 = 34. Abbiamo
allora la seguente tabella di contingenza:
!
migliorati non m. totalifarmaco 42 18 60placebo 20 34 54totali 62 52 114
. Se il
farmaco ha circa lo stesso effetto del placebo, la probabilità di miglioramento è
62/114, mentre quella di non miglioramento è 52/114. Allora, i numeri attesi nei
due casi sono:
!
migliorati non m. totalifarmaco 32,63 27,37 60placebo 29,37 24,63 54totali 62 52 114
. La matrice delle differenze è
!
H "H0 =9,37 "9,37"9,37 9,37
#
$ %
&
' ( ; eleviamo al quadrato:
!
H "H0( )2 #87,80 87,8087,80 87,80
$
% &
'
( ) , poi
dividiamo per
!
H0:
!
H "H0( )2 : H0 #2,69 3,212,99 3,56
$
% &
'
( ) e poi sommiamo:
!
"2 = 12,45. C’è un
solo grado di libertà, perciò dalla prima riga della tavola troviamo che la
probabilità di avere
!
"2 = 12,45 è fuori tabella, ossia minore dello 0,005. Allora,
come del resto era intuibile, l’ipotesi nulla è respinta ed il farmaco è efficace.
11. Valutiamo la distribuzione col test di Poisson calcolando il rapporto v/m tra
varianza e media:
!
aula 1 2 3 4 5 6 7 8 9 10ragnatele 78 18 64 24 30 70 59 10 15 22
. Si ha:
!
m =1
10" 78 +18 + ...+ 22( ) = 39 ;
!
v =1
10 "1# 78 "38( )2 + 18 "38( )2 + K + 22"38( )2$
% & &
'
( ) ) =
59609
* 662.
Allora
!
vm
" 16,97 >> 1, e quindi la distribuzione è di tipo aggregato.
12. Questo non è un esercizio di Probabilità e neppure di Statistica, ma lo vediamo
ugualmente, perché qualche attinenza ce l’ha e come esempio di creazione di un
modello matematico per affrontare un problema. Per cominciare, osserviamo che
la probabilità di uscita di un numero è 5/90 = 1/18, ma la Sisal paga 11,2 volte
l'importo che abbiamo giocato. Ciò posto, poiché stabiliamo di uscirne alla pari,
vediamo che cosa succede: fino alla undicesima giocata la vincita è superiore alla
somma spesa fino a quel momento. Dalla dodicesima in poi dobbiamo aumentare
man mano la quota. Infatti, la spesa totale di 12 euro sarebbe superiore alla
eventuale vincita di 11,2 euro. Sia x la somma giocata alla dodicesima estrazione:
la spesa è 11+x, la vincita eventuale 11,2⋅x, quindi abbiamo l’equazione
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
!
11+ x = 11,2 " x # x =11
10,2$ 1,07843. Per ottenere una formula generale, sia
!
sn, n " 11, la somma complessivamente giocata alla n-esima puntata. Allora alla
successiva, detta x la somma puntata, si ha
!
sn + x = 11,2 " x # x =sn
10,2, quindi:
!
sn+1 = sn +sn
10,2= sn " 1+
110,2
#
$ % %
&
' ( ( = sn "
11,210,2
) 1,098 " sn
Poiché
!
s11 = 11, allora
!
s11+k = 11 "1,098k . Supponiamo che il nostro numero non esca
per varie volte; a che punto finiremo i 50.000 euro? Risolviamo l’equazione
!
50000 = 11 "1,098k # 1,098k =50000
11$ 4545,45 # k =
ln 4545,45( )ln 1,098( )
$ 90.
Pertanto, se il numero non esce per 90+11 = 101 estrazioni, avremo speso circa 49614
euro, ossia quasi tutto, e non avremo abbastanza denaro per un’ulteriore giocata.
Per curiosità, se fossimo partiti con 115.000 €, li avremmo finiti dopo 110 giocate...
Si può generalizzare ipotizzando di voler vincere qualcosa di più di quanto speso,
diciamo
!
m " sn + q , con m ≥ 1 e q ≥ 0. Sia
!
s1 la somma giocata alla prima puntata.
Alla n+1-esima si ha l’equazione:
!
m " sn + q + x = 11,2 " x # x =m " sn + q
10,2,
!
" sn+1 = m # sn + q +m # sn + q
10,2= m # sn + q( ) #11,2
10,2" sn+1 = 1,098 # m # sn + q( ) .
Poniamo ora
!
s1 = 1, m = 1, q = 10,2. Poniamo poi
!
r = 1,098. Allora
!
s2 = r " 1+ q( ) , poi:
!
s3 = r " s2 + q( ) = r " r " 1+ q( ) + q( ) = r2 + q " r " 1+ r( ) ,
!
s4 = r " s3 + q( ) = r " r2 + q " r " 1+ r( ) + q#
$ %
&
' ( = r3 + q " r " 1+ r + r2#
$ %
&
' ( … ,
!
sn+1 = rn + q " r " ri
i=0
n#1$ = rn + q " r " r
n #1r #1
= 11,2 "1,098n + 0,9955
L’equazione
!
11,2 "1,098x + 0,9955 = 50.000 ha per soluzione x = 89,89. Per voler
vincere appena 10,2€ i 50.000 € finiscono dopo solo 90 giocate.
Ne segue che il denaro finisce tanto più in fretta quanto più m o q sono grandi, ossia quanto
più siamo avidi …
Modulo di Statistica per Scienze Naturali, A.A. 2011/112, esercizi per casa.
13. Per stabilire la frequenza delle 21 lettere del nostro alfabeto nella poesia “San
Martino” di G. Carducci, 4 strofe di 4 versi ciascuna, seguiamo il suggerimento.
Intanto vediamo il testo della poesia:
La nebbia a gl’irti colli
piovigginando sale,
e sotto il maestrale
urla e biancheggia il mar;
ma per le vie del borgo
dal ribollir de’ tini
va l’aspro odor de i vini
l’anime a rallegrar. Gira su’ ceppi accesi
lo spiedo scoppiettando:
sta il cacciator fischiando
sull’uscio a rimirar
tra le rossastre nubi
stormi d’uccelli neri,
com’esuli pensieri,
nel vespero migrar.
Ecco il risultato, escluso il titolo:
a b c d e f g h i l m n o p q r s t u v z 31 6 14 10 29 1 9 2 40 27 8 13 22 10 0 27 19 12 7 5 0
Ecco qualche elaborazione e qualche grafico:
Si contano 292
lettere (escluso
il titolo), delle
quali 129 sono
vocali, il 44%
del totale.
La moda è la
vocale “i”,
seguita dalla
“a” e dalla “e”.
vocale frequenza a 31 e 29 i 40 o 22 u 7
Le consonanti
più usate sono
la “l” e la “r”.
La “q” e la “z”
non ci sono.
NOTA: ci sono
anche ben 8
apostrofi.