11
1 Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati. Il termine STATISTICA deriva dalla parola STATO, già gli antichi Romani facevano censimentiper contare gli abitanti e per conoscere le loro caratteristiche: età, professione,ecc. I censimenti sono indagini statistiche che riguardano l’intera popolazione residente nello stato. Si chiama POPOLAZIONE STATISTICA l’insieme su cui si fa l’indagine statistica. Il termine “popolazione” si usa anche quando tale insieme non è costituito da persone, ad esempio le auto immatricolate in Italia nel 2011 potrebbero essere oggetto di una indagine statistica e quindi costituire la “popolazione” oggetto dell’indagine. Per ragioni economiche spesso le indagini statistiche riguardano un CAMPIONE e non l’intera popolazione, in tal caso è essenziale che il campione sia rappresentativo altrimenti l’indagine statistica darebbe risultati errati. Esempio: per stimare quante persone vanno al cinema in un mese, non bisogna rilevare i dati nelle vicinanze di una sala cinematografica perché il campione non sarebbe rappresentativo ( alcune persone potrebbero percorrere quella strada proprio perché vanno al cinema!). Un grave errore in questo senso è stato commesso negli Stati Uniti quando si stava facendo una sondaggio telefonico, pre-elettorale, per capire quale dei due candidati alla Casa Bianca avesse maggiore probabilità di vincere. Poiché in quegli anni, solo la popolazione più ricca e istruita aveva un telefono in casa, il campione intervistato non era rappresentativo avendo privilegiato la parte più abbiente della popolazione che era spesso repubblicana. Il risultato del sondaggio infatti, si rivelo’ completamente errato. ( 1936- Landon ( repubblicano), Roosevelt ( democratico), vinse Roosevelt mentre il sondaggio aveva previsto la vittoria di Landon) Per effettuare una INDAGINE STATISTICA bisogna: rilevare i dati, fare lo spoglio dei dati e correggere, se possibile, eventuali errori, elaborare i dati con strumenti matematici adatti interpretare i risultati ottenuti Il nostro studio riguarda prevalentemente gli ultimi due punti dell’indagine statisti ca: l’elaborazione dei dati con strumenti matematici e l’interpretazione dei risultati dell’indagine statistica. Si dice UNITA’ STATISTICA ogni elemento della popolazione, di ciascuna unità statistica si studia almeno un CARATTERE: un CARATTERE QUALITATIVO è espresso con attributi, detti modalità del carattere: sesso: maschio / femmina colore dei capelli: castano, rosso, biondo,… un CARATTERE QUANTITATIVO è frutto di un conteggio o di una misura ed è espresso con un numero intero o con un numero reale: paghetta settimanale(euro): [10, 20), [20,30) numero di ore di lezione al giorno: 6, 8

Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

1

Capitolo zero: STATISTICA DESCRITTIVA UNIVARIATA

La STATISTICA è la scienza che si occupa di fenomeni collettivi che richiedono lo studio di un grande numero di dati.

Il termine STATISTICA deriva dalla parola STATO, già gli antichi Romani facevano “censimenti” per contare gli abitanti e per conoscere le loro caratteristiche: età, professione,ecc. I censimenti sono indagini statistiche che riguardano l’intera popolazione residente nello stato.

Si chiama POPOLAZIONE STATISTICA l’insieme su cui si fa l’indagine statistica. Il termine “popolazione” si usa anche quando tale insieme non è costituito da persone, ad esempio le auto immatricolate in Italia nel 2011 potrebbero essere oggetto di una indagine statistica e quindi costituire la “popolazione” oggetto dell’indagine.

Per ragioni economiche spesso le indagini statistiche riguardano un CAMPIONE e non l’intera popolazione, in tal caso è essenziale che il campione sia rappresentativo altrimenti l’indagine statistica darebbe risultati errati. Esempio: per stimare quante persone vanno al cinema in un mese, non bisogna rilevare i dati nelle vicinanze di una sala cinematografica perché il campione non sarebbe rappresentativo ( alcune persone potrebbero percorrere quella strada proprio perché vanno al cinema!). Un grave errore in questo senso è stato commesso negli Stati Uniti quando si stava facendo una sondaggio telefonico, pre-elettorale, per capire quale dei due candidati alla Casa Bianca avesse maggiore probabilità di vincere. Poiché in quegli anni, solo la popolazione più ricca e istruita aveva un telefono in casa, il campione intervistato non era rappresentativo avendo privilegiato la parte più abbiente della popolazione che era spesso repubblicana. Il risultato del sondaggio infatti, si rivelo’ completamente errato. ( 1936- Landon ( repubblicano), Roosevelt ( democratico), vinse Roosevelt mentre il sondaggio aveva previsto la vittoria di Landon)

Per effettuare una INDAGINE STATISTICA bisogna:

rilevare i dati,

fare lo spoglio dei dati e correggere, se possibile, eventuali errori,

elaborare i dati con strumenti matematici adatti

interpretare i risultati ottenuti

Il nostro studio riguarda prevalentemente gli ultimi due punti dell’indagine statistica: l’elaborazione dei dati con strumenti matematici e l’interpretazione dei risultati dell’indagine statistica.

Si dice UNITA’ STATISTICA ogni elemento della popolazione, di ciascuna unità statistica si studia

almeno un CARATTERE:

un CARATTERE QUALITATIVO è espresso con attributi, detti modalità del carattere: sesso: maschio / femmina colore dei capelli: castano, rosso, biondo,…

un CARATTERE QUANTITATIVO è frutto di un conteggio o di una misura ed è espresso con un numero intero o con un numero reale: paghetta settimanale(euro): [10, 20), [20,30) numero di ore di lezione al giorno: 6, 8

Page 2: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

2

Per studiare i dati statistici si costruiscono delle tabelle dove, accanto ad ogni modalità del

carattere, si riporta la frequenza di quella modalità.

Tali tabelle si chiamano:

SERIE se vi sono caratteri qualitativi SERIAZIONI se vi sono caratteri quantitativi.

Si dice MUTABILE X , la tabella costituita dalle modalità qualitative e dalla relative frequenze (

assolute o relative o percentuali)

X x1 x2 x3

fa f1 f2 f3

Si dice VARIABILE X , la tabella costituita dalle modalità quantitative e dalla relative frequenze (

assolute o relative o percentuali)

X x1 x2 x3

fa f1 f2 f3

Noi studieremo prevalentemente le VARIABILI STATISTICHE e le seriazioni statistiche, ma vediamo

alcune serie significative come esempio di mutabili statistiche.

Tra le serie statistiche, le più importanti e diffuse sono le serie storiche:

la serie che descrive l’andamento del costo della benzina negli ultimi dieci anni, la serie che

descrive il numero di multe date dai vigili urbani nei primi sette giorni dell’anno in corso, ecc.

Esempio: serie storica della produzione annua di olio, in quintali, e rappresentazione grafica con il

diagramma cartesiano :

Anno Produzione

In quintali

2003 2.508.084

2004 2.678.201

2005 2.458.396

2006 1.914.535

Esempio si di serie : serie delle materie scolastiche preferite dai ragazzi e dalle ragazze e loro

rappresentazione con diagramma a colonne

Materia preferita maschi femmine

Italiano 5 3

Storia 4 7

Geografia 4 2

Matematica 2 3

Scienze 6 4

Ed. Fisica 5 5

Page 3: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

3

LE SERIAZIONI

Esempio 1 Con uno strumento, si è rilevato, per 40 minuti consecutivi, il numero delle particelle

cosmiche al minuto:

0 2 1 4 3 1 2 3 8 2 5 2 1 3 3 1 3 2 2 5

4 4 4 2 3 5 5 1 1 2 4 4 2 3 3 3 3 3 3 2 Possiamo chiederci:

Qual è il minor numero di particelle rilevato in un minuto?

Qual è il maggior numero di particelle rilevato in un minuto?

Quale numero di particelle è stato rilevato più frequentemente?

Per quanti minuti sono state rilevate meno di 5 particelle al minuto ?

Qual è il numero medio di particelle rilevate al minuto?

Ad alcune domande si può rispondere anche con i dati grezzi, ad altre no.

La variabile statistica che dobbiamo studiare la indichiamo con X.

X ha come modalità il numero di particelle cosmiche rilevate al minuto, essa può assumere i valori interi

da 0 ( il valore minore rilevato) a 8 ( il valore massimo rilevato ), con una determinata frequenza assoluta.

Il RANGE dei valori è 8-0=8

Ad ogni valore di X corrisponde una frequenza assoluta fa( il numero di volte che si è ottenuto quel valore)

Ad ogni valore di X corrisponde una frequenza relativa fr = fa/n , n è il numero dei dati, in questo caso

n=40.

La frequenza può anche essere espressa in modo percentuale fr*100 %

Molto interessante è la frequenza cumulata: per ogni valore della variabile X , la frequenza cumulata é la

somma delle frequenze assolute minori o uguali al valore di X considerato.

In modo analogo si può costruire la tabella delle frequenze relative cumulate o di quelle percentuali

cumulate.

X fa fr f% fa cumulata

0 1 0,025 2,5% 1

1 6 0,15 15% 7

2 10 0,25 25% 17

3 12 0,3 30% 29 4 6 0,15 15% 35

5 4 0,1 10% 39

6 0 0 0% 39

7 0 0 0% 39

8 1 0,025 2,5% 40

Totale: 40 1 100% 40 numero dati vale sempre 1 vale sempre 100 numero dei dati

Istogramma che rappresenta la distribuzione della frequenza assoluta del numero di particelle al minuto.

Frequenza assoluta cumulata del numero di particelle al minuto rilevate

Page 4: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

4

Ora che i dati sono stati ordinati e rappresentati, possiamo rispondere ad alcune domande relative al

fenomeno su cui è stata fatta l’indagine statistica.

Qual è il minor numero di particelle rilevato in un minuto? 0 (nessuna particella)

Qual è il maggior numero di particelle rilevato in un minuto? 8 particelle

Quale numero di particelle è stato rilevato più frequentemente? 3 particelle

Per quanti minuti sono state rilevate meno di 5 particelle ? 35 minuti

Per quanti minuti sono state rilevate più di 4 particelle al minuto? 40-35= 5 minuti

Qual è il numero medio di particelle rilevate al minuto?

circa 3 particelle al minuto

La variabile X appena studiata è numerica e discreta perché i valori che assume sono il risultato di

un conteggio.

La variabile Y che assume come valore l’altezza dei giocatori del Novara Calcio è numerica e

continua, perché i valori sono frutto di una misura.

Talvolta è necessario suddividere l’intervallo dei valori da rappresentare in classi.

Divideremo l’intervallo in classi della stessa ampiezza, il numero delle classi può variare tra 3 e 15,

solo in casi eccezionali il numero delle classi può arrivare a 20.

Per ottenere una buona distribuzione statistica si può usare la regola seguente:

se N è il numero dei dati, si calcola e si approssima il risultato:

se i dati sono 80, con la formula si ottiene = 8.9 → 8 classi

Esempio 2

Gli ottanta dati seguenti indicano le emissioni giornaliere di gas inquinante da un impianto

industriale espresse nella stessa unità di misura.

Il Range dei valori è R=31.8-6.2=25.6

Poiché i dati sono 80 decidiamo di dividere l’intervallo [6.2 , 31.8] in 7 parti uguali dette classi.

L’ampiezza di ciascuna classe è a=(32-6.2)/7=3,7

NB: il valore maggiore è stato arrotondato per eccesso. A volte, prima di suddividere le classi si

aggiunge uno, per essere certi di avere tutti i dati distribuiti nelle 7 classi.

Quando la distribuzione statistica è suddivisa in classi, bisogna calcolare il valore centrale di ogni classe: classe [c,d[

Page 5: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

5

Il valore centrale è (c+d)/2

Classe Valore centrale Fa Fr F % F cumulata

8.05 7 0.0875 8.75 7

11.75 10 0.125 12.5 17

15.45 12 0.15 15 29

19.15 23 0.2875 28.75 52

22.85 16 0.2 20 68

26.55 8 0.1 10 76

30.25 4 0.05 5 80

totale 80 1 100 80

Istogramma delle frequenze assolute : i valori sull’asse x sono quelli centrali di ogni classe

Grafico delle frequenze cumulate, detto anche “ogiva” Sull’asse x vanno riportati i valori massimi di ogni classe e sull’asse y la frequenza cumulativa della rispettiva classe

Qual è il valor medio della distribuzione?

18,73

Indici di posizione centrale di una distribuzione di frequenze: valori medi

MODA: il dato, o la classe di dati, che ha maggiore frequenza. La moda si calcola sia con caratteri

qualitativi che con caratteri quantitativi.

La moda può non esistere (se tutti i dati o tutte le classi hanno la stessa frequenza) o non

essere unica ( se ci sono più dati o più classi con la massima frequenza)

la moda può essere molto lontana dal centro della distribuzione

la MODA è utile quando è importante conoscere quale sia il valore che si ottiene con maggiore

frequenza e si usa se, il dato o la classe, hanno una frequenza notevolmente superiore agli altri

dati o classi.

ESEMPIO: In una città l’orario dei negozi di alimentari è libero. Uno straniero appena giunto in città

chiede quale sia l’orario di apertura dei negozi di alimentari. Conviene rispondere indicando la

MODA cioè l’orario rispettato dalla maggior parte dei negozi di alimentari.

Page 6: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

6

MEDIANA: è un valore che divide a metà i dati, ordinati in maniera crescente o decrescente. La

mediana si calcola con i caratteri quantitativi o con quelli qualitativi ordinabili ( ad esempio la

modalità titolo di studio è ordinabile, la modalità colore degli occhi non è ordinabile).

La MEDIANA non risente dei valori estremi perché si determina indicando il valore centrale

se la distribuzione ha un numero dispari di dati, oppure indicando la media aritmetica tra i

due valori centrali se la distribuzione ha un numero pari di dati.

La MEDIANA è l’indice centrale da considerare quando c’è molta variabilità tra i dati.

La MEDIANA è il valore che divide a metà l’intervallo della distribuzione statistica e

corrisponde al cinquantesimo percentile e anche al secondo quartile. I quartili sono dei punti

che dividono l’intervallo dei dati in quattro parti, ognuna delle quali contiene il 25% dei dati.

ATTENZIONE: se la distribuzione e divisa in classi, si stima come mediana il valore centrale

della classe in cui cade il dato centrale ( o la media dei due dati centrali)

La MEDIA ARITMETICA è quel valore che sostituito a tutti i termini della distribuzioni lascia

invariata la somma. La media si calcola solo se i caratteri sono quantitativi.

La MEDIA ARITMETICA risente dei valori estremi della distribuzione e non conviene

utilizzarla quando c’è molta variabilità tra i dati .

LA MEDIA PESATA è la media aritmetica calcolata considerando i pesi ( la frequenza ) di

ogni xi

dove xi è il dato di indice i e pi il suo peso

Nel caso in cui i dati siano raggruppati in classi si usa il valore centrale di ogni classe:

xi è il valore centrale della classe i-esima ed fi la frequenza della classe i-esima

classe

Valore

centrale fa fC

[155-160[ 157,5 3 3

[160-165[ 162,5 4 7

[165-170[ 167,5 4 11

[170-175[ 172,5 3 14

[175-180[ 177,5 6 20

[180-185[ 182,5 4 24

totale 24

Mediana= (x13+x12)/2 = (172,5+172,5)/2= 172,5

Page 7: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

7

Indici di variabilità di una distribuzione di frequenze

IL RANGE o CAMPO DI VARIAZIONE: la differenza tra il massimo valore dei dati e il minimo valore

dei dati oppure la differenza tra l’estremo superiore dell’ultima classe e l’estremo inferiore della

prima classe se i dati sono suddivisi in classi. NB: se tutti i dati sono uguali RANGE=0

Lo SCARTO è la differenza tra ogni valore della distribuzione e la media aritmetica xi - .

Lo SCARTO SEMPLICE MEDIO è la media aritmetica dei valori assoluti degli scarti

S=

La VARIANZA è il valor medio degli scarti al quadrato

o

Se i dati sono raggruppati in classi si considera come xi il valore centrale di ogni classe

o

Lo SCARTO QUADRATICO MEDIO o DEVIAZIONE STANDARD è la radice quadrata della varianza

Quando i dati sono suddivisi in classi, si utilizza come xi il valore centrale di ogni classe

Il COEFFICIENTE DI VARIABILITA’ ( che si può calcolare solo se la media non è nulla) è il rapporto

tra lo scarto quadratico medio e la media aritmetica in valore assoluto σ/|μ| e viene espresso in

percentuale. E’ un numero puro che permette di confrontare tra loro la variabilità di diverse

distribuzioni statistiche.

Esempio: Giacomo ha preso questi voti: 5,7,6,8,9,7 il coeff. di variabilità è σ/|μ|=1,29/7=0,18=18% Luca ha preso questi voti: 4,5,6,5,6 il coeff. di variabilità è σ/|μ|=0,75/5,2=0,14=14%

Marco ha preso questi voti : 7,7,7,7,7,7,7 il coeff. di variabilità è σ/|μ|=0/7=0

TABELLE CONSIGLIATE PER CALCOLARE LO SCARTO SEMPLICE MEDIO E LO SCARTO QUADRATICO MEDIO

X Scarto (xi-μ)

Valore assoluto dello scarto |xi - μ |

Scarti al quadrato

(xi-μ)2

… -8,5 8,5 72,75

… ……. …………. …………. Tot. 0 27 189,5

CLASSI fi Xi valore centrale

della classe

xi*fi | xi – μ |*fi (xi-μ)2*fi

0-4 5 2

4-8 7 6

tot

SCARTO SEMPLICE MEDIO : S= | x1 - μ |+………………| xn - μ | = 27/6 =4,5 (6 è il numero dei dati)

N

Page 8: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

8

SCARTO QUADRATICO MEDIO : = = 5,6

DISTRIBUZIONE SEMPLICE: un esempio Si rileva la temperatura alle ore 12 ( mezzogiorno) in una certa località, per sette giorni consecutivi

giorni Temperature in °C

lunedì -3 Media μ=(-3+1+0-1+2-2+3)/7=0

Mediana: (dispongo i dati in ordine crescente: -

3,-2,-1,0,1,2,3) = 0

Range: 3-(-3)=6

S=(3+1+0+1+2+2+3)/7=1,71

σ 2=(9+1+0+1+4+4+9)/7=4

σ = 2 σ/|μ| non si può calcolare, media nulla

martedì 1

mercoledì 0

giovedì -1

venerdì 2

sabato -2

domenica 3

DISTRIBUZIONE PONDERATA: un esempio Costruire la tabella statistica e determinare la media, la mediana,la moda, il range, lo scarto

semplice medio, la varianza, lo scarto quadratico medio e il coefficiente di variabilità relativi alla

rilevazione statistica: su un campione di 100 famiglie si studia il numero di automobili di proprietà

Moda: 1 auto

Media: μ=(0*15+1*48+2*29+3*8)/ 100 =1.3

Mediana: è la media tra il 50esimo e il 51esimo dato

(1+1)/2=1

Range: min 0 , max 3 R=3-0=3

S=[|-1.3|*15+|-0.3|*48+|0.7|*29+|1.7|*8]/100=0,678

Varianza:

σ2=[(-1.3)2*15+(0.3)2*48+(0.7)2*29+(1.7)2*8]/100=0.67

Scarto quadratico medio σ=√0.67=0.82 ; σ/|μ|=0.82/1.3=0,63=63%

DISTRIBUZIONE PER CLASSI: un esempio

Costruire la tabella statistica delle altezze, suddivise in classi, degli alunni di una classe

secondaria e calcolare: la media, la moda , la mediana, il range, la varianza,lo scarto

quadratico medio

Classi di

altezza

v.c. fa fr f% fc Scarto *fa

[135-140[ 137,5 4 0.14 14 4 -6,96*4

[140-145[ 142,5 12 0.43 43 16 -1.96*12

[145-150[ 147,5 9 0.32 32 25 3.04*9

[150-155[ 152,5 3 0.11 11 28 8.04*3

tot 28 1 100 circa 0

Moda: la classe [140-145[

Media: 137,5*4+142,5*12+147,5*9+152,5*3=144,46

Range : R= 155-135=20

σ2=[(6.96)2*4+(1.96)2*12+(3,04)2*9+(8,04)2*3]/28

=18.46

σ= √18.46=4.2 ; σ/|μ|=4.29/144.46=0,03%

Mediana= 142,5

n. auto di

proprietà fa fr f% fc scarto

0 15 0.15 15% 15 -1.3

1 48 0.48 48% 63 -0.3

2 29 0.29 29% 92 0.7

3 8 0.8 8% 100 1.7

Tot. 100 1 100

Page 9: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

9

Page 10: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

10

19) I voti riportati in un compito di matematica sono:

2 4 7 5 4 3 7 5 3 5 7 7 5 5 4 6 6 5 6 6 7 8 8 6

6 8 6 6 5 4 Costruire una tabella con le frequenze assolute, relative, percentuali e cumulate.

20) I dati relativi al numero di componenti per un campione di famiglie sono riportati in tabella:

N. componenti N. famiglie

1 160

2 257 3 381

4 478

5 127

6 61

7 37

totale 1501

Calcola la frequenza relativa, la frequenza cumulata e la frequenza percentuale, la deviazione standard e il coefficiente di variabilità. Quante famiglie sono formate da più di 4 persone? Qual è la percentuale di famiglie formate da più di 4 persone?

21 )All’esame di stato 45 studenti hanno conseguito i voti seguenti: 62 83 92 100 92

100 92 90 84 86 92 82 77 84 88 96 86 83 88 92 82 84 86 90 83 81 88 79 76 91 96 100 92 90 86 82 78 93 65 69 82 78 93 66 69

Costruire una tabella con le frequenza assolute e relative riportando:

a) i dati divisi in 5 classi b) i dati divisi in 9 classi

22) Si considerino li dati relativi alle altezze di 28 studenti : 163 163 175 170 175 171 158 171 162 173 164 180 150 163 177 149 183 183 168 168 178 181 147 164 174 180 158 171 Dopo aver raggruppato i dati in classi di frequenza pari a 10cm ( 140-149…) costruire i grafici delle frequenze assolute, relative e cumulate. Si chiede inoltre :

a. Quanti studenti sono alti meno di 160cm? b. Quale classe contiene il maggior numero di dati? [a. 5; b. 170-179]

23) I dati relativi al peso corporeo di 28 studenti di una classe sono i seguenti: 67 52 74 51 84 52 77 62 52 82 58 88 59 79 48 74 47 61 49 54 81 45 59 50 77 51 60 48 Dopo aver raggruppato in classi di ampiezza pari a 5Kg , calcolare: a)Frequenza assoluta, b)Frequenza relativa c)Frequenza percentuale d)Frequenza cumulata

Page 11: Capitolo zero : STATISTICA DESCRITTIVA UNIVARIATA

11

e) range, f) scarto semplice medio g) varianza h) deviazione standard i) coefficiente di variabilità

24) Nella corsa dei 200m , 30 ragazzi hanno fatto registrare i tempi misurati sino ai decimi di

secondo:

29,3 31,2 28,5 37,6 30,9 26,0 38,0 37,0 22,8 35,2 35,8 37,7

29,6 26,9 36,9 39,6 29,9 30,0 36,6 34,1 38,2 35,0 28,8 37,8

32,4 31,8 38,1 34,0 36,0 36,1

Costruire una tabella raggruppando i dati in 5 classi : determinare frequenza, frequenza relativa e

frequenza percentuale, media, moda , mediana, range, scarto semplice medio, varianza,deviazione

standard, coefficiente di variabilità . Disegnare il diagramma delle frequenze. Determinare quale

percentuale dei ragazzi ha corso i 200 m in meno di 29 secondi.

25) Le temperature massime in gradi Celsius registrate in una località sono

Tracciare l’istogramma, il poligono delle frequenze, il poligono delle frequenze cumulate. Determinare moda, media, mediana, deviazione standard

ESERCIZIO 1-Un entomologo sta studiando un bruco divoratore di foglie; esaminando 300 foglie ha trovato

dei bruchi secondo i numeri riportati in tabella

n° dei bruchi 0 1 2 3

n° delle foglie 167 98 30 5

Calcolare il numero medio di bruchi per foglia e la relativa deviazione standard.

[ media=173/300 = 4%, σ2=(263/300)-(173/300)2 ; σ= radq(48971/90000)= 0,74]

ESERCIZIO 2- Si consideri il numero di giorni che un unguento impiega per far guarire di una dermatite:

n° giorni 1 2 3 4 5 6

frequenza 2 7 9 27 11 5

Determina la media e la varianza. [media= 236/61=3,87; σ2=998/61-(3,87)2=1,38]

ESERCIZIO 3- Due ditte pubblicizzano le loro pile “ministilo “ a 4,5 Volt e entrambe dicono che le pile hanno

una carica di 1,25 A/h. Si scelgono due campioni di 50 pile da ciascuna ditta e si compila la tabella delle

frequenze assolute con cui sono stati osservati i valori di carica: carica in A/h 1,15 1,20 1,25 1,30

Prima ditta 1 16 25 8

Seconda ditta 17 0 9 24

Stabilire per quale ditta il valore medio di carica è più attendibile.

[prima ditta media=1,24 A/h, σ2=0,065/50=0,0013, σ=0,036---- seconda ditta media=1,24 A/h, σ2= 0,045,σ=0,067]