4-Variabile statistice

Embed Size (px)

Citation preview

Variabile statistice

(clasificare, indicatori)

Definiiicaracteristic sau variabil statistic proprietate n functie de care se cerceteaza o populatie statistica i care, n general, poate fi msurat, cptnd valori diferite de la un individ la altul; valoare (stare, realizare) forma concret de manifestare a unei variabile statistice pentru un individ; scal totalitatea valorilor diferite ale unei caracteristici sau intervalul n care se conin acestea (domeniu de valori al variabilei); msurare procesul prin care se obin valorile variabilelor sau atribuirea de valori caracteristicilor indivizilor potrivit unor reguli; cercetare studiul variabilelor i a relaiilor dintre ele.

Clasificarea variabilelor dup modul de exprimarevariabile calitative variabile, valorile crora sunt exprimate prin cuvinte care desemneaz apartenena individului la una din categoriile scalei (exemple: sexul, calificativul, profesia, starea civil etc.). Variabilele calitative sunt de 2 tipuri: nominale i ordinare. variabile cantitative variabile, valorile crora se exprim numeric (exemple: vrsta, salariul, inaltimea etc.). Variabilele cantitative sunt de 2 tipuri: de interval i de raport.

Clasificarea variabilelor dup numrul de valori (sau a variantelor de rspuns)dihotomice (binare, alternative) variabile calitative scala crora e compus din 2 valori antonime (da nu, prezent absent, aprins stins etc.). Noiunea de variabil binar provine de la codificarea valorilor acestora cu 0 i 1. Codificarea prin 0/1 permite utilizarea acestor variabile n proceduri dedicate nivelurilor mai nalte de msurare (ordinal, interval). nealternative (categoriale) celelalte variabile calitative, ce nu posed proprieti ale variabilelor dihotomice.

Clasificarea variabilelor dup modul de obinere

primare variabile obinute n etapa de culegere a datelor (exemplu: vrsta nregistrat n ani, notele primite la examenele din sesiune etc.); derivate (auxiliare) variabile obinute n urma procesului de prelucrare a variabilelor primare (exemplu: vrsta calculat pe grupe de vrst, nota medie la sesiune etc.).

Clasificarea variabilelor dup natura variaiei caracteristicii numerice

continue, care pot lua orice valoare din scala lor de variaie (exemple: nlime, greutate, cifr de afaceri etc.); discrete, care nu pot lua dect anumite valori pe scala lor de variaie, de regul numere ntregi (exemple: numrul de copii dintr-o familie, numrul de sate dintr-un raion etc.).

Variabile nominale- variabile calitative care pot lua un numr finit de valori neordonate sau variabile, ce permit doar clasificarea observaiilor.Observaie: n vederea prelucrrii, valorile variabilelor nominale se codific, de regul, cu numere ntregi. n acest caz nivelul de msurare (tipul variabilei) nu se modific prin utilizarea unei astfel de codificri.

Variabile ordinare- variabile calitative ale cror valori sunt ordonate dar nu este definit (nu se poate defini) distana dintre oricare dou valori.Observaie: la codificarea valorilor (ordonate) ale variabilelor ordinare se folosesc iruri ordonate de numere ntregi.

Variabile de interval- variabile cantitative (numerice), utiliznd o valoare 0 convenional. La compararea valorilor gsim rspuns la ntrebri de tipul: Cu ct e mai mare? sau Cu ct e mai mic?Observaie: valorile variabilelor numerice nu se codific: n calitate de cod se ia chiar valoarea variabilei.

Variabile de raport- variabile cantitative (numerice), utiliznd o valoare 0 natural. La compararea valorilor gsim rspuns i la ntrebri de tipul: De cte ori e mai mare? sau De cte ori e mai mic?Observaie: valoarea 0 indic inexistena variabilei.

Notrin numrul indivizilor cercetai; X o caracteristic studiat; x1, x2,,xm valorile caracteristicii X; n1, n2,...,nm numrul de indivizi corespunztor valorilor caracteristicii (sau care posed valoarea respectiv a caracteristicii).

Frecvene definiii i calculare (I)Se numete frecven absolut a unei valori xi a caracteristicii, numrul de uniti ale populaiei ni corespunztoare acestei valori. Se numete frecven relativ a unei valori xi a caracteristicii raportul dintre frecventa absolut ni a valorii xi i numrul total al indivizilor n. Frecvenele relative exprimate n procente se mai numesc frecvene procentuale. Ele se calculeaz dup formula:

ni f i = 100% n

Frecvene definiii i calculare (II)Se numete frecven cumulat procentul de indivizi ce se gsesc pn la sau sub o treapt (valoare) a scalei. Ea se calculeaz dup formula:

n1 + n2 + n3 + ... + ni Fi = 100% = f1 + f 2 + f 3 + ... + f i nObservaie: frecvenele cumulate au sens pentru variabilele ordinare i cele cantitative.

Distribuii de frecveneUn tabel de forma:

X F

x1 f1

x2 f2

x3 f3

... ...

xm fm

poart denumirea de distribuie de frecvene.

Exerciiu: de construit distribuia de frecvene a culorilor bilelor observate

Distribuia de frecvene a culorilor bilelor

Culoare Frecvene absolute Frecvene relative (procentuale)

8

4

6

2

40% 20% 30% 10%

Reprezentarea grafic a distribuiilor de frecvene (I)9 8 7 6 5 4 3 2 1 0 Albastr Roie Galben Neagr

Reprezentarea grafic a distribuiilor de frecvene (II)Neagr 10%

Albastr 40%

Galben 30% Roie 20%

Indicatori ai variabilelor nominalen calitate de indicator al tendinei centrale se utilizeaz modulul sau moda (Mo) categoria cu cea mai mare frecven. n calitate de indicator al mprtierii se utilizeaz Indicele variaiei calitative (IVC) raportul dintre variaia distribuiei observate i variaia distribuiei uniforme.

Determinarea indicatorilor pentru exemplul analizatModulul categoria A (bila albastr) Pentru determinarea IVC se iau distribuiile: - observat: { 8, 4, 6, 2 } i - uniform: { 5, 5, 5, 5 }. Atunci:IVC = 8 (4 + 6 + 2) + 4 (6 + 2) + 6 2 100% 93.3% 5 (5 + 5 + 5) + 5 (5 + 5) + 5 5

Indicatori ai variabilelor ordinareTendina central: modulul (Mo); mediana (Me) valoarea din mijloc a irului ordonat (n cretere sau descretere) de valori ale caracteristicii. Indicator al mprtierii: indicele variaiei calitative (IVC). Forma distribuiei de frecvene: simetric (Mo=Me) sau asimetric (MoMe).

Exemplul 1

(n ce msur suntei mulumit de...?)1 foarte nemulumit (3) 2 nemulumit (7) 3 indiferent (10) 4 mulumit (7) 5 foarte mulumit (3) Mo = indiferent Me = indiferent IVC = 63,3% Distribuia - simetric10 8 6 4 2 0 f. nemult. nemult. indiferent f. mult. mult.

Exemplul 2

(n ce msur suntei mulumit de...?)1 foarte nemulumit (3) 2 nemulumit (5) 3 indiferent (8) 4 mulumit (10) 5 foarte mulumit (4) Mo = mulumit Me = indiferent IVC = 63,3% Distribuia - asimetric10 8 6 4 2 0 f. nemult. nemult. indiferent f. mult. mult.

Indicatori ai tendinei centrale pentru variabile cantitativemodulul (Mo) se calculeaz numai dup ce variabila se transform n una ordinar cu scal de intervale; mediana (Me) valoarea din mijloc a irului ordonat (numrul de valori impar) sau media aritmetic a celor dou valori din mijlocul irului ordonat (numrul de valori par); media (M) media aritmetic a irului de valori ale caracteristicii, calculat dup formula:

x1 + x2 + x3 + ... + xn 1 n M= = xi n n i =1

Indicatori ai mprtierii pentru variabile cantitativeAmplitudinea:

A = xmax xmin( xi M ) 2 i =1 n

Dispersia (abaterea standard):

=

n

Calcularea indicatorilor n ExcelModulul Mediana Media Amplitudinea Dispersia Frecvena =MODE(domeniu) =MEDIAN(domeniu) =AVERAGE(domeniu) =MAX(domeniu)-MIN(domeniu) =STDEV(domeniu) =FREQUENCY(domeniu,limite)

Notri: domeniu domeniul de celule n care se gasesc datele analizate; limite domeniu ce conine capetele intervalelor, n care se calculeaz frecvenele

Calcularea indicatorilor n SPSS (1)

Calcularea indicatorilor n SPSS (2)

Lista variabilelor transferate spre a fi prelucrate

Lista tuturor variabilelor din baza de date

Calcularea indicatorilor n SPSS (rezultate)

ExerciiuNotele la examen a unei grupe de studeni sunt urmtoarele:7, 5, 7, 8, 4, 6, 8, 2, 7, 1, 8, 10, 9, 7, 9, 6, 4, 2, 3, 7

S se determine frecvenele i indicatorii statistici ai acestei variabile.

RspunsSe aranjeaz irul n cretere: 1, 2, 2, 3, 4, 4, 5, 6, 6, 7 7, 7, 7, 7, 8, 8, 8, 9, 9, 10Distribuia de frecvene:Nota

ni

1 1

2 2

3 1

4 2

5 1

6 2

7 5

8 3

9 2

10 1

Mo=7; Me=7; M=6 =638

Indicatori ai variabilelor statistice (recapitulare)Indicatori ai tendinei centraleModulNominale

Indicatori de dispersieIVC Amplitudine Dispersie

Median

Medie

X X X X X X

X X X X

Ordinare

Numerice