36
Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Embed Size (px)

Citation preview

Page 1: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Esercizi del capitolo 3

di biostatistica

Pagano - Gauvreaux

Page 2: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es1-5

1. Definire e confrontare media, mediana e moda.2. In quali casi e preferibile I'utilizzo della media? Delia mediana?

Delia moda?3. Definire a confrontare Ire misure di dispersione utilizzate

comunemente: il range, il range interquartile e la deviazione standard.

4. E’ possibile calcolare misure di sintesi nu merica per le osservazioni di una distribu zione di frequenza, nella quale le misurazioni originali non sono più disponibili? Spiegare brevemente. Perché le informazioni di caratteri personale - come il reddito annuo - sono di solito presentate in questo modo?

5. Qual'é l'utilità della disuguaglianza di Chebychev per descrivere una serie di osservazioni? In quali casi e induce possibile utilizzare la regola empirica?

Page 3: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 6

6. E stato condotto uno studio per esami-nare la prognosi a lungo termine di bambini che hanno contratto una meningite batterica acuta, un processo infiammatorio della mem brane che avvolgono il cervello ed il midollo spinale. Di seguito sono riportati i tempi di insorgenza di paralisi in 13 bambini the hanno partecipato alto studio (10). Le misurazioni espresse in mesi sono:

0,10 0,25 0,50 4 12 12 24 24 31 36 42 55 96.

a. Calcolare le scguenti misure di sintesi numerica dei dati:media

range

mediana

range interquartile

moda

deviazione standard.

b. Dimostrare che è uguale a 0.n

ii=1

(x -x)

Page 4: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 7

Nel Massachusetts, otto soggetti riportarono un episodio inspiegato di intossicazione da vitamina D che richiese il ricovero in ospedale; si pensa che questo evento insolito potesse essere il risultato di un'eccessiva aggiunta di vitamina D al latte fresco (11). La tabella di seguito riportata illustra i livelli ematici di calcio e albumina - un tipo di proteina - per ogni soggetto al momento del ricovero in ospedale.

Page 5: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

I dati - Cap 3 es 7Albumina<- c( 43, 42, 42,40,42,38,34,42)

(g/I)Calcio<-c(2.92,3.84,2.37,2.99,2.67,3.17,3.74,3.44)

(mmol/l)summary(Albumina) Min. 1st Qu. Median Mean 3rd Qu. Max. 34.00 39.50 42.00 40.38 42.00 43.00 > summary(Calcio) Min. 1st Qu. Median Mean 3rd Qu. Max. 2.370 2.857 3.080 3.143 3.515 3.840 > quantile(Calcio) 0% 25% 50% 75% 100% 2.3700 2.8575 3.0800 3.5150 3.8400 > quantile(Albumina) 0% 25% 50% 75% 100% 34.0 39.5 42.0 42.0 43.0 >

Page 6: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 7

• Calcolare la media, la mediana, la deviazione standard e il range dei livelli di calcio.

• Calcolare la media, la mediana, la deviazione standard e il range dei livelli di albumina.

• Nei soggetti sani il range dei valori di calcio 2,12 e 2,74 mmol/l, mentre il range dei livelli di albumina a 32 e 55 g/l. Ritenete che i pazienti colpiti da intossicazione da vitamina D avessero livelli ematici normali di calcio e di albumina?

Page 7: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

summ,detail albumine------------------------------------------------------------- Percentiles Smallest 1% 34 34 5% 34 3810% 34 40 Obs 825% 39 42 Sum of Wgt. 8

50% 42 Mean 40.375 Largest Std. Dev. 3.02076175% 42 4290% 43 42 Variance 9.12595% 43 42 Skewness -1.31465699% 43 43 Kurtosis 3.44875 calcium------------------------------------------------------------- Percentiles Smallest 1% 2.37 2.37 5% 2.37 2.6710% 2.37 2.92 Obs 825% 2.795 2.99 Sum of Wgt. 8

50% 3.08 Mean 3.1425 Largest Std. Dev. .510678875% 3.59 3.1790% 3.84 3.44 Variance .260792995% 3.84 3.74 Skewness -.00234499% 3.84 3.84 Kurtosis 1.874623

Page 8: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 8

E’ Stato condotto uno studio per confrontare adolescenli di sesso femminile affette da bulimia con adolescenti sane con simile struttura corporea e simile abitudini ajja attivitàò fisica. Di seguito sone riportati i valori relativi all'assunzione calorica giornaliera, in Kcal/kg, per campioni di adolescenti di ciascuno dei due gruppi (12).

Page 9: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

I DATI di Cap 3 es 8

Adolescenti AdolescentiBulimiche sane15.9 18.9 25.1 20.7 30.616.0 19.6 25.2 22.4 33.216.5 21.5 25.6 23.1 33.717.0 21.6 28.0 23.8 36.617.6 22.9 28.7 24.5 37.118.1 23.6 29.2 25.3 37.418.4 24.1 30.9 25.7 40.818.9 24.5 30.6

Page 10: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 8

1. Calcolare l’assunzione ealorica giornaliera (Kcal/Hg) per il gruppo di Adolescenti bulimiche e Adolescenti sane

2. Calcolare il range inter-quartile di ciascun gruppo.

3. Il valore tipico di assunzione calorica giornaliera e maggiore nelle adolescenti affette da bulimia o nelle adolescenti sane? Quale gruppo presenta una maggiore variabilità nelle misurazioni?

Page 11: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

b<-c(15.9 , 18.9 , 25.1 , 16.0 , 19.6 , 25.2 , 16.5 , 21.5 , 25.6 , 17.0 ,21.6 , 28.0 , 17.6 , 22.9 , 28.7 , 18.1 , 23.6 , 29.2 , 18.4 , 24.1 ,30.9 , 18.9 , 24.5)

nb<-c(20.7 , 30.6 , 22.4 , 33.2 , 23.1 , 33.7 , 23.8 , 36.6 , 24.5 , 37.1 ,25.3 , 37.4 , 25.7 , 40.8 , 30.6 )

summary(b) Min. 1st Qu. Median Mean 3rd Qu. Max. 15.90 18.25 21.60 22.08 25.15 30.90> summary(nb) Min. 1st Qu. Median Mean 3rd Qu. Max. 20.70 24.15 30.60 29.70 35.15 40.80

Page 12: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 9

• Le Figurc 3.6 c 3.7 illustrano il tasso di mortaliti infantile per 111 Paesi in tre continenti: Africa, Asia ed Europa (13). Il tasso di mortalità infantile di un passe e il numero di decessi in bambini di età inferiore a a 12 mesi in un anno diviso per il numero totale di nati vivi in quell'anno. La Figura 3.6 presenta degli istogranuni che illustrano la distribuzione dei tassi di mortalità infantile per ciascun continence. La Figura 3.7 iliustra Egli stessi dati utilizzando diagrammi di dispersione a una dimensione a diagrammii a scatola.

Page 13: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux
Page 14: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 9

• Senza eseguire alcun calcolo, quale continente pensate presenti la media più bassa? Quale la mediana più elevata? Quale la deviazione standard più piccola? Spiegare.

• Per Africa, vi aspettate che la media e la mediana del tasso di mortalità infantile siano uguali? E in Asia? Perchè si , perché no?

Page 15: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 10

Di seguito sono riportate le distribuzioni di fre-quenza dei livelli di cotinina sierica in un grup-po di fumatori ed in un gruppi di non fumatori (14). Questa misurazioni sane state raccolte in uno studio che ha valutato diversi fattori di rischio per le malattie cardiovascolari.

Page 16: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 10

Livello di cotinina

ng/ml

Fumatori Non fumatori

0 - 13

14 - 49

50 - 99

100 - 149

150 - 199

200 - 249

250 - 299

300

78

133

142

206

197

220

151

412

3.300

72

23

15

7

8

9

11

totale 1.539 3.445

Page 17: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 10

A Calcolare la media e la deviazione standard raggruppata per le misurazioni dei livelli di cotinina sierica nei due gruppi. Per I'uItimo intervallo - 300 ng/ml - si assune che il punto medio dell'intervallo sia 340 ng/mI.

B In quale intervallo si riduce il livello di cotinina sierica mediante nei fumatori? E nei non fumatori?

C Confrontare Ie distribuzioni dei livelli di cotinina sierica nei fumatori e nei non fumatori.

Page 18: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

summ fuma [weight=fuma],detail (analytic weights assumed) fuma------------------------------------------------------------- Percentiles Smallest 1% 78 78 5% 78 13310% 133 142 Obs 825% 151 151 Sum of Wgt. 153950% 206 Mean 237.8993 Largest Std. Dev. 118.788475% 412 19790% 412 206 Variance 14110.6895% 412 220 Skewness .689604599% 412 412 Kurtosis 1.990651

.summ nonfuma [weight=fuma],detail (analytic weights assumed) nonfuma------------------------------------------------------------- Percentiles Smallest 1% 3.3 3.3 5% 3.3 710% 7 8 Obs 825% 8 9 Sum of Wgt. 153950% 11 Mean 16.38687 Largest Std. Dev. 18.9649275% 15 1190% 23 15 Variance 359.668395% 72 23 Skewness 2.5981699% 72 72 Kurtosis 8.38565

Page 19: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

3-11

• I dati relativi al livelto di zinco sierico in 462 maschi di eta compresa tra 15 e 17 sono rcgistrati net CD ailegato al libro in un file chiamato serzinc (Appendice B, Tabelia B.1); le misurazioni di zinco sierico in microgrammi per decilitro sane registracc nella variabilc zinc (151).

Page 20: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

zinc 50 51 53 55 56 58 60 60 60 61 61 61 61 62 62 62 62 63 63 63 64 6464 64 64 65 65 65 66 66 66 67 67 67 67 67 68 68 68 68 69 70 70 70 70 7070 70 70 70 71 71 71 71 71 71 71 71 71 71 71 72 72 72 72 72 72 72 72 7272 72 72 72 73 73 73 73 73 73 73 73 73 74 74 74 74 74 74 74 74 74 74 7474 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75 76 76 76 76 76 76 76 7676 76 76 76 76 77 77 77 77 77 77 77 77 77 77 78 78 78 78 78 78 78 78 7878 78 78 79 79 79 79 79 79 80 80 80 80 80 80 80 80 80 80 80 81 81 81 8181 81 81 81 81 81 82 82 82 82 82 82 82 82 82 82 82 82 82 83 83 83 83 8383 83 83 83 83 83 84 84 84 84 84 84 84 84 84 84 84 84 84 84 85 85 85 8585 85 85 85 85 85 85 86 86 86 86 86 86 86 86 86 86 86 86 86 87 87 87 8787 87 87 87 87 87 88 88 88 88 88 88 88 88 88 88 88 88 88 88 89 89 89 8989 89 89 89 89 90 90 90 90 90 90 90 90 91 91 91 91 91 91 91 91 91 91 9292 92 92 92 92 92 92 93 93 93 93 93 93 93 93 93 94 94 94 94 94 94 94 9494 94 94 95 95 95 95 95 95 95 95 95 95 95 96 96 96 96 96 96 96 96 96 9697 97 97 97 97 97 97 97 97 98 98 98 98 98 98 98 98 98 99 99 99 99 99 99100 100 100 100 100 101 101 101 101 101 101 101 102 102 102 102 102 102102 102 103 103 103 103 103 103 104 104 104 104 104 104 104 105 105 105105 105 105 105 105 106 106 106 106 106 106 107 107 107 107 107 107 107108 108 108 108 108 108 108 109 109 110 110 111 111 111 111 112 112 112113 113 113 114 114 114 114 115 115 115 116 116 116 116 117 117 117 118118 119 119 121 123 124 125 128 131 135 142 147 151 153

Page 21: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

3-11

• Calcolare la media, la mediana la deviazione standard, il range ed il range inter-quartile dei dati.

• Utilizzare la disuguaglianza di Chebychev per descrivere la distribuzione dei valori.

• Quale percentuale di valori ritenete the rientri in 2 deviazioni standard dalla media? E in 3 deviazioni standard dalla media? Quale percentuale dells 462 misura xioni rientri in questi range?

• Ritenete che la regoia empirica sia piu efficace delia disuguaglianza di Chebychev per sintetizzare questi; dati? Spiegare.

Page 22: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Histogram of zinc

zinc

Fre

quen

cy

60 80 100 120 140 160

020

4060

8010

0

Page 23: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

summary(zinc) Min. 1st Qu. Median Mean 3rd Qu. Max. 50.00 76.00 86.00 87.94 98.00 153.00

• > sum(x)• [1] 323• > sum(zinc)• [1] 40627• > sum(zinc^2)• [1] 3690711• > (sum(zinc^2)-sum(zinc)^2/length(zinc))/(length(zinc)-1)• [1] 256.1501• > length(zinc)• [1] 462• quantile(zinc)• 0% 25% 50% 75% 100% • 50 76 86 98 153

Page 24: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 12

• Le percentuali di neonati con basso peso alla nascita - peso inleriore a 2300 granuni - in diversi Paesi sono registratc, nel CD ailegato al libro, nella variabilc lowbwt in un file chianuto unicef (13) (Appendices B, Tabella 13.2).

Page 25: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

0.0

2.0

4.0

6.0

8.1

Den

sity

0 10 20 30 40 50percent low birth weight

Page 26: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

0.0

2.0

4.0

6D

ensi

ty

30 40 50 60 70life expectancy at birth, 1960

Page 27: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

0.0

2.0

4.0

6.0

8D

ensi

ty

40 50 60 70 80life expectancy at birth, 1992

Page 28: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 12

• Calcolare la media e la mediana di queste osservazioni.

• Calcolare la media troncata al 5%.

• Per questa serie di dati, quale di queste misure numeriche preferite come misura di tendenza centrale? Spiegare.

Page 29: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 13

La concentrazione di nicotina in milligrammi dichiarata da 35 marche di sigarette canadesi e registrate, net CD allegato al libro, nella variabile nicotine in un file chiamato cigarett (16) (Appendice B, Isabella 13.4).

• Calcolare la media e la mediana delle concentrazioni di nicotina.

• Disegnare un istogramma delle misurazioni di nicotina. Descrivere la forma della distribuzione dei valori.

• Quale numero ritenete fornisca la migliore misura di tendenza centrale per quale concentrazioni, la media o la mediana? Spiegare.

Page 30: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 13 [i dati per R]

Nicotine<-

c(0.30, 1.20, 1.30, 1.00, 1.40, 1.20, 0.10, 0.90, 1.30, 1.10, 1.20, 1.00, 0.90, 1.30, 1.20, 1.30, 0.89, 1.20, 1.30, 0.40, 1.10, 0.40, 0.20, 1.10, 1.30, 1.00, 1.30, 1.30, 1.40, 1.10, 1.20, 1.20, 1.00, 0.50, 0.09)

Page 31: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

summary(Nicotine) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0900 0.9000 1.1000 0.9909 1.3000 1.4000

Histogram of Nicotine

Nicotine

Fre

qu

en

cy

0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4

02

46

81

0

Page 32: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

05

10

15

20

25

Den

sity

0.00 0.50 1.00 1.50concentration per cig (mg)

Page 33: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 14

Di seguito è illustrata una distribuzione di frequenza che sintetizza i valori di pressione sistolica a riposo in un campione di 35 pazienti con ischemia cardiaca, doe assenza di flusso ematico al cuore (17).

Page 34: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Cap 3 es 14

Pressione NumeroSistolica mmHg di pazienti

115-124 4125-134 5135-144 5145-154 7155-164 6165-174 4175-184 5TOTALE 35

• Calcolare la media e la deviazione standard raggruppata dei dati.• Le 35 misurazioni della pressione sistolica sono registrate nol CD

allegato al libro in un file chiamato ischemia (Appendices B, Isabella 13.6); i valori sono registrati nella variabile bp. Calcolare la media e la deviazione standard non raggruppata di questi dati.

• Le misure di sintesi numerica raggruppate e non raggruppate sono uguali? Perché si o perche no?

Page 35: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

sbp duration time 170 640 105 128 670 118 150 560 130 148 510 150 160 212 178 154 260 180 175 228 192 140 335 200 140 460 200 120 440 201 172 210 240 178 359 245 122 438 252 158 270 270 132 781 277 130 802 278 175 360 300 140 1775 300 150 524 322 180 441 330 160 1084 345 122 505 360 170 75 375 150 823 386 168 780 440 134 1065 480 160 1080 540 154 308 562 125 860 570 140 60 578 154 765 720 120 396 729 162 328 780 140 540 1200 178 130 1430

Cap 3 es 14

Page 36: Esercizi del capitolo 3 di biostatistica Pagano - Gauvreaux

Misurazione della velocità della luceSimon Newcomb misur`o il tempo necessario affich´e la luce andasse dal suolaboratorio sul fiume Potomac ad uno specchio alla base del WashingtonMonument e ritornasse indietro, per una distanza totale di circa 7400 metri.Egli fece 66 misurazioni qui sotto riportate.28 24 27 30 29 2422 33 32 33 36 2536 21 34 29 32 2726 36 30 27 28 2428 32 25 29 40 1628 31 26 28 19 2926 25 26 22 37 2024 24 25 26 23 2832 25 -44 27 32 2730 28 23 16 29 3927 36 21 31 -2 231. Si rappresenti la distribuzione dei dati mediante un diagramma a scatola.2. Si stimi la velocita’ della luce.