elemente de biostatistica

Preview:

DESCRIPTION

sociologie medicala

Citation preview

Elemente de Biostatistica

FMAM an II Lp1

STATISTICA

• Domeniu ştiinţific care permite studiul fenomenelor, parametrilor a căror proprietate fundamentală este variabilitate

BIOSTATISTICA

• - studiul fenomenelor biologice şi medicale

• Se ocupă de – culegerea, – centralizarea şi gruparea datelor– prelucrarea datelor

permite determinarea unor indicatori pentru descrierea fenomenelor biomedicale studiate, pe baza unor regularităţi sau variabilităţi statistice

2. NOTIUNI DE STATISTICA

• -colectivitate statistică (populaţie statistică)

• -unitate statistică

• -variabilă statistică

• -varianta statistica

• -serie statistică

• 2.1. Colectivitatea statistică (populaţia

statistică) formează obiectul analizei

statistice şi este reprezentată de totalitatea

elementelor care au anumite caracteristici

(însuşiri sau atribute) comune.

• Numărul elementelor populaţiei reprezinta

volumul sau talia populaţiei.

• O populaţie statistică poate fi:• -în medicină, mulţimea bolnavilor internaţi,

mulţimea hematiilor din sângele unei persoane, mulţimea microbilor dintr-o cultură etc.

• -într-un studiu demografic, populaţia unei ţări

• -un grup de indivizi (populaţia şcolară dintr-un oraş la un moment dat, populaţia vârstnică dintr-o anumită regiune la un moment dat)

• -un grup de evenimente sau fenomene

• -o mulţime de obiecte

• Colectivitatea statistică generală sau populaţia este reprezentată de totalitatea elementelor de un anumit tip existente teoretic sau practic.– criterii de includere– criteriile de excludere

• Elementele unei populaţii statistice se numesc unităţi statistice (unităţi de observare) sau indivizi ai populaţiei statistice.

• 2.2. Unitatea statistică este reprezentată de fiecare element component al colectivităţii statistice.

• Ea este supusă observării, i se determină şi i se înregistrează valoarea caracteristicii sau caracteristicilor studiate.

• Unităţi statistice pot fi: persoana, familia, căsătoria, născutul viu, gravida, cabinetul medicului de familie etc.

• Trăsătura comună a tuturor unităţilor unei populaţii care poate să prezinte interes în cadrul unei analize statistice se numeşte caracteristică variabilă.

• 2.3. Caracteristica (variabila) este una din însuşirile prin care se manifestă unitatea de observare, este acea însuşire comună unităţilor unei populaţii investigate. O variabila trebuie sa poata lua cel putin doua stari (variante)

• Analiza studiului unei populaţii se poate face după una sau mai multe variabile.

• Ex. Să presupunem că interesează studiul numărului de leucocite la bolnavii internaţi într-un spital de boli infecţioase

Populaţia statistică este formată din mulţimea bolnavilor internaţi într-o anumită perioadă (un an),

O unitatea statistică este constituită din fiecare bolnav,

Caracteristica studiată este numărul de leucocite ale bolnavului la internare,

Un eşantion din această populaţie statistică poate fi, de exemplu mulţimea alcătuită din 100 de bolnavi internaţi luaţi din doi în doi în ordinea internării.

• Ex. Să presupunem că într-un studiu prezintă interes numărul de pacienţi consultaţi zilnic în cabinetele medicilor de familie dintr-o anumită zonă. Atunci:

• -Populaţia statistică este reprezentată de mulţimea cabinetelor,

• -O unitate statistică este reprezentată de oricare cabinet,

• -Numărul de pacienţi consultaţi zilnic reprezintă o caracteristică.

• Variabila este o funcţie-• X: M C • unde M este populaţia statistică • C este o mulţime în care caracteristica

ia valori.

• Variabilele statistice pot fi de două tipuri: De natură cantitativă, asociate unor

caracteristici susceptibile de a fi măsurate, De natură calitativă, asociate unor

caracteristici care nu pot fi măsurate, sunt rezultatul aprecierii

Sunt asociate unor caracteristici măsurabile,exprimabile numeric.

Sunt însuşiri măsurabile ale unităţilor de observare şicare pot fi exprimate printr-o unitate de măsură (cm,g,ore etc.).

Ele pot fi:-continue-discrete

Variabilele cantitative

Tipuri de variabile cantitative

Variabile continue asociate unor caracteristici măsurabile care pot lua orice formă numerică (inclusiv o fracţiune zecimală sau ordinală).

Calculul mediei are întotdeauna semnificaţie.

Variabile discontinue sau discrete asociate unor caracteristici măsurabile care iau valori numai numere întregi

Valoarea mediei nu are întotdeauna semnificaţie.

– sunt asociate unor caracteristici care nu se exprimă în unităţi de măsură.

– Sunt nemăsurabile, finite, iar calculul mediei valorilor ei nu are sens.

Variabile calitative

Tipuri de variabile calitative– Variabilele calitative pot fi:

Nominale – grupează subiecţii în categorii ce nu pot fi ordonate dupa un criteriu logic

Ordinale – subiecţii sunt grupati în categorii ce pot fi ordonate dupa un criteriu logic

Dihotomiale – nu accepta decat doua alternative pt. gruparea subiectilor

• 2.4. Varianta este valoarea concretă sub care se înregistrează o variabilă.

• Calitatea măsurării datelor este dată de:– Acurateţe: gradul în care măsurătoarea efectuată redă valoarea

adevărată a variabilei în studiu

– Validitatea: măsura în care ceea ce se măsoară este exact ce trebuie măsurat

– Precizia: măsura în care măsurătoarea efectuată este consistentă şi reproductibilă

– Siguranţa: măsurătoarea este stabilă şi demnă de încredere

• 2.5. Frecvenţa este numărul de repetiţii sub care se înregistrează aceeaşi variantă.

• 2.6. Seria statistică (sau repartiţia statistică) este şirul de valori numerice ale unei variabile, ordonate după un anumit criteriu, în funcţie de şirul valorilor altei caracteristici, reprezentând corespondenţa dintre două şiruri de date.

• Repartiţia statistică este caracterizată de legea de repartiţie.

• 2.7. Parametrul statistic este valoarea reprezentativă, dedusă dintr-un calcul numeric aplicat unei repartiţii statistice (adică din legea de repartiţie). De exemplu, media, dispersia, frecvenţa unui caracter etc.

• 2.8. Indicatorul statistic este mărimea statistică, cu ajutorul căruia se poate caracteriza un fenomen - în cazul nostru, un fenomen bio sau socio-medical – sub raportul structurilor interdependenţelor ori modificărilor în timp sau spaţiu.

• 2.9. Indicele statistic este valoarea numerică relativă ce rezultă din compararea valorilor unui indicator statistic, fie la diferite momente de timp fie în spaţii diferite, fie pentru categorii diferite constituite în raport cu o caracteristică oarecare.

3. INDICATORI AI TENDINŢEI CENTRALE, DE DISPERSIE, LOCALIZARE ŞI SIMETRIE

• 3.1. CARACTERISTICI CANTITATIVE• INDICATORI AI TENDINŢEI CENTRALE

• 3.1.1. Seria de variaţie sau distribuţia de frecvenţă

• Variantele sub care se înregistrează caracteristica sunt dispuse în sens crescător, alăturat se notează frecvenţa lor de apariţie. Se alcătuieşte astfel o serie de variaţie simplă sau o distribuţie de frecvenţă.

• O distribuţie de frecvenţă se obţine prin observarea frecvenţei de apariţie a unui eveniment.

• Seriile de variaţie pot fi: Serii de variaţie simple

• Exemplu: – Tabel I. Vârsta persoanelor dintr-un lot supus cercetării

Variabila Xi

Frecvenţa fi

0 1 2 3 4 5 . .

95 96 97 98 99

0 20 13 14 21 . . 2 0 0 0 1

fi =1.000

Serii de variaţie cu clase• Clasa Centrul Frecvenţa fi

• clasei xi

• 0-4 2,5 58• 5-9 7,5 32• 10-14 12,5 48• 15-19 17,5 36• 20-24 22,5 40• 25-29 27,5 58• 30-34 32,5 67• 35-39 37,5 73• 40-44 42,5 80• 45-49 47,5 84• 50-54 52,5 85• 55-59 57,5 83• 60-64 62,5 75• 65-69 67,5 67• 70-74 72,5 64• 75-79 77,5 32• 80-84 82,5 6• 85-89 87,5 7• 90-94 92,5 5• 95-99 97,5 3

• - - fi =1.000

• Centrul clasei (valoarea centrală a intervalului) care se notează cu Xi .– Pentru variabilele cantitative continue, centrul clasei

este egal cu semisuma valorii minime a clasei respective şi a valorii minime a clasei următoare.

– Pentru variabilele cantitative discontinue, centrul clasei este egal cu semisuma valorilor extreme ale clasei. Nu este obligatoriu ca centrul clasei să fie o valoare întreagă.

– Pentru variabilele cantitative continue, cu mai multe valori (peste 10) se observă că o mare parte dintre observaţii se concentrează în jurul unei valori centrale.

• Această concentrare este denumită tendinţa centrală a distribuţiei de frecvenţă.

• Principalii indicatori de tendinţă centrală sunt:

media, Xmediana, Memodul.Mo

• 3.1.2. Media • 3.1.2.1. Media aritmetică (x )• Media aritmetică este o măsură a tendintei centrale a seriei de date în jurul căreia se

aglomereaza datele acesteia. • Media nu dă nici o indicaţie asupra gradului de fluctuaţie (de abatere) de la tendinta

centrala, adică asupra a ceea ce se numeşte frecvent dispersia datelor.• Media aritmetică a seriei de date asociate unui eşantion x1 , x2 , ….., xn, este raportul

dintre suma acestora şi numărul lor:• n

• xi

• i=1 x1 + x2 + …..+ xn

x = = • n n

x – media aritmetică,• n

– xi suma valorilor seriei de date (a variabilei)• i=1

– n – numărul valorilor (seriei de date); i = 1, 2,…, n

• 3.1.3. Mediana (Me)Valoarea care împarte şirul ordonat de variante în

două părţi egale, situându-se la mijlocul seriei de variaţie, astfel încât jumătate dintre valori îi sunt inferioare (sau egale) şi cealaltă jumătate îi sunt superioare (sau egale).

Rangul medianei; se disting două situaţii:• Pentru serii cu număr impar de valori (2k

+1), mediana este valoarea de rang k+1.• Pentru serii cu număr par de valori (2k),

mediana se află între valorile de rang k şi k+1, convenindu-se a fi reprezentată de media aritmetică a celor două valori.

• Exemplu:

• Caracteristicile lungimii la naştere sunt: 48, 49, 50, 52, 54 cm. Se observă că valoarea 50 este mediana. Ea a împărţit şirul de valori astfel încât numărul valorilor mai mici decât ea însăşi să fie egal cu numărul valorilor mai mari, în exemplu existând valorile inferioare 48, 49 şi valorile superioare 52, 54.

• 3.1.4. Modul (Mo)

• Modul (sau valoarea modală) este definit ca fiind varianta cu numărul cel mai mare de apariţii, deci cu frecvenţa observata cea mai mare.

• Modul este o valoare observată şi nu una calculată, ca în cazul mediei şi a medianei.

• Se vorbeşte de:distribuţie de frecvenţe unimodală dacă distributia

de frecvenţa are o singura valoare maxima distribuţie de frecvenţe multimodală dacă are mai

multe maxime. (ex. bimodale dacă are două valori maxime ale frecvenţelor corespunzând a două valori diferite ale variabilei)

– Pentru seriile unimodale, K.Pearson a stabilit că valoarea apropiată a modului, poate avea expresia:

Mo = x + 3 (Me - x )– Grafic modul reprezintă abscisa căreia îi corespunde

ordonata maximă.– Modul poate oferi indicaţii asupra omogenităţii seriei de

variaţie.

Exemplu: Determinări ale uricemiei la 100 de pacienţi 

xi fi xi fi

33 1 33

38 5 190

43 10 430

48 27 1296

53 25 1325

58 11 638

63 8 504

68 7 476

73 3 219

78 1 78

83 1 83

88 1 88

- 100 5360

   xifi 5360

x = = = 53,60 Media aritmetică este fi 100  53,60.

Rg Me = = = 50,5 Rangul medianei este 50,5.

2 2  x50 = 53, x51 = 53

   x50 + x51 53 + 53

Me = = = 53 Mediana este 53.

2 2  Mo = 48 (corespunde frecvenţei cea mai mare 27) Modul este 48.

fi + 1 101

3.2. Indicatori de dispersie pentru caracteristici cantitative• Indicatorii de dispersie oferă informaţii asupra

extinderii variabilitatii (împrăştierii) variantelor observate.

• Indicatorii de dispersie sunt utili în caracterizarea generala a seriei.

• Principalii indicatori de dispersie sunt:      amplitudinea absolută şi relativă,      varianţa,      abaterea (deviaţia) standard,      coeficientul de variaţie.

Tabele statistice

• Def – Document statistic cu ajutorul căruia se

urmăreşte asigurarea caracterului unitar al prezentării informaţiilor statistice, uşurarea operaţiunilor statistice, evidenţierea sistematizată a rezultatelor cercetării

Elemente: – macheta– datele numerice– notele explicative

• Macheta cuprinde: – Titlul– Capul de tabel (titlurile interioare)– Reţeaua tabelului

• Coloane• Rânduri• Rubrici

Titlul tabelului• Trebuie să indice:

– Conţinutul tabelului– Locul– Perioada la care se referă informaţiile respective

• Ex. Născuţii vii din anul X după greutatea la naştere şi sex, în Spitalul Clinic Judeţean Sibiu

• Titlul trebuie să indice:– Problema la care se referă tabelul– Modul de abordare a acestei probleme– Locul şi perioada în care s-a petrecut fenomenul

• NU SE SCRIE CUVÂNTUL TABEL în titlu• Tabelul se numerotează de obicei în colţul din dreapta

sus

• Capul de tabel – Indică conţinutul fiecărui rând şi al fiecărei

coloane

• Reţeaua tabelului cuprinde:– Coloanele- spaţiile între 2 linii verticale– Rândurile- spaţiile între 2 linii orizontale– Rubricile- suprafeţele rezultate din intersecţia

unei coloane cu un rând

• Datele numerice înscrise pot fi: – Valori absolute– Valori relative– Valori medii

• Totaluri • Subtotaluri – de reportat

• Părţile componente ale tabelului este indicat să fie delimitate cu linii de grosimi diferite

• Sub capul de tabel trebuie să existe un rând mai îngust în care să se numeroteze coloanele

• Notele explicative indică:– Sursa datelor– Metodologia de calcul folosită– Lămuriri suplimentare

Tipuri de tabele

• Simple

• De grupare

• Corelative

Tabele simple

CAUZE DE DECES Nr. Decese Procentaj %

Asfixia la nastere 527 26,1

Traumatisme obstreticale 92 4,6

Stare septica 7 0,3

Pneumonie 181 9

Malformaţii congenitale 598 29,6

Alte cauze 606 30

Total 2019 100

Cauzele deceselor neonatale in România în 1994

Clasificarea născuţiilor vii după nivelul de educaţie al tatălui

NIVELUL DE EDUCAŢIE AL TATĂLUI NUMĂR NĂSCUŢI VII

Absolventi de liceu 50,684

Sub 12 clase 31,774

TOTAL 82,458

Tabele de grupare

• Colectivitatea se grupează după două sau mai multe caracteristici (criterii) şi se centralizează numai frecvenţele de apariţie ale valorilor caracteristicilor

Clasificarea născuţiilor vii după educaţia tatălui şi timpul de asistenţă la naştere, în statul x, 1996

EDUCAŢIA ASISTAT DETOTAL

 TATĂLUIMEDIC ÎN SPITAL

MEDIC, DAR NU ÎN

SPITAL MOAŞĂALTE/

NESPECIFICAT

Absolvent de liceu 46606 3014 910 154 50684

Sub 12 clase 14334 3094 13930 416 31774

TOTAL 60940 6108 14840 570 82458

Tabel “master”de sinteză cuprinde o clasificare completă a datelor cât şi totaluri

Internări în spitalul x în anul 1968, Clasificate după vârstă, rezidenţă şi sex

VÂRSTA URBAN RURAL TOTAL

IN ANI MASC FEM TOTAL MASC FEM TOTAL MASC FEM TOTAL

<1             18 23 41

1-4             46 40 86

5-9             12 14 26

10-14             18 16 34

15-19             20 12 32

20-29             23 32 55

30-39             55 66 121

40-49             12 24 36

50-59             12 32 44

>59             66 50 116

TOTAL                  

Tabele corelative (cu dublă intrare)

• Unităţile sunt exprimate în acelaşi timp în funcţie de două caracteristici, fiecare dintre acestea reprezentând o intrare

Tabel de contingenţă cu frecvenţele cazurilor după sex şi după starea de sănătate

Sex Masculin Feminin Total

Stare      

Bolnav 241 446 687

Sănătos 302 511 813

Total 543 957 1500

Rezultatele cercetării efectelor medicamentului A

Efect

Medica

ment adm

Efect prezent Efect absent total

Lot experim

(adm medicam A)

250 150 400

Lot martor(adm placebo)

25 75 100

Total 275 225 500

Schema tabelului de corelaţie pentru caracteristicile alternative a

două loturi de cercetareVariantele caracteristicii X

Variantele caracteristicii Y

Total

Y1 Y2

X1 a b a+b

X2 c d C+d

Total a+c b+d a+b+c+d

Grafice sau prezentarea prin imagini a datelor

Elementele de bază ale unui grafic:

• Titlul–redă conţinutul graficului, obiectul reprezentării, timpul, locul

• Scara de reprezentare–prezintă problemele observate, prezentarea intervalelor şi a valorilor respective

• Reţeaua graficului–reţele rectangulare sunt cele mai utilizate, care se construiesc în sistemul coordonatelor carteziene

Tipuri de reprezentări grafice după formă:

• diagrame

• reprezentări grafice pe hartă

Diagramele

• Sunt reprezentări grafice prin suprafeţe şi prin linii

• Tipuri:– Prin coloane– Prin benzi– Structurale– Liniară (historiograma)– De distribuţie cantitativă– Cumulativă

Diagrama prin coloane

• Dreptunghiuri – dispuse paralel cu scala

de reprezentare– cu suprafaţa proporţională

cu nivelul fenomenului

• se foloseşte când se reprezintă grafic mai multe fenomene în acelaşi loc şi la acelaşi moment de timp sau acelaşi fenomen în mai multe locuri şi la acelaşi moment.

Numărul internărilor în spitalul X în funcţie de vârstă ( anul 2004)

41

86

26 34 32

55

121

36 44

116

020406080

100120140

<1 1-4 5-9 10-14 15-19 20-29 30-39 40-49 50-59 >59

vârsta pacienţilor

Diagrama prin benzi

• Dreptunghiuri cu linie de bază verticală

• Aranjate în ordine crescătoare a mărimii indicatorilor sau după un alt criteriu logic

• Trebuie să nu fie disproporţionate

Cauzele deceselor neonatale in România în 1994

527

92

7

181

598

606

0 100 200 300 400 500 600 700

Asfixia la nastere

Traumatisme obstreticale

Stare septica

Pneumonie

Malformaţii congenitale

Alte cauze

Nr decese

0 10 20 30 40 50 60 70 80 90

NorwaySpain

EU members before May 2004 Luxembourg

AustriaEur-AMalta

FinlandGreece

United KingdomEU

SloveniaCzech Republic

CroatiaPoland

European RegionMontenegro

EU members since 2004 or 2007Hungary

SerbiaRomaniaLithuaniaEur-B+C

Republic of MoldovaRussian Federation

Life expectancy at birth, in years, 2005

Populaţia României pe vârste la 1 iulie 2005

Diagrama structurală• Se foloseşte pentru evidenţierea părţilor componente ale

fenomenului reprezentat.

• Poate fi sub formă de cerc sau dreptunghi

Diagrama structurală -ex

Structura deceselor prin boli ale aparatului respirator, România, 2000

49

44

9.6

0%

20%

40%

60%

80%

100%

120%

140%

Altele

BPOC

Pneumonie

Cauzele Deceselor Neonatale in România în 1994

Asfixia la nastere; 26,10%Alte cauze;

30%

Traumatisme obstreticale;

4,60%

Stare septica; 0,30%

Pneumonie; 9%Malformaţii

congenitale; 29,60%

Diagrama liniară

• Numită şi cronograma, historiograma

• Se utilizează pentru prezentarea seriilor dinamice, a succesiunii în timp a unui fenomen.

• Pe abscisă se trece timpul

• Pe ordonată- valoarea indicatorilor

SPORUL NATURAL AL POPULAŢIEI,

ROMÂNIA, 1990 – 2005

Recommended