APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Preview:

DESCRIPTION

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija. Grafinis pateikimas. Grafinis pateikimas. 75th Procentilė. 75th Procentilė. Vidurkis( *). Mediana. 25th Procentilė. 25th Procentilė. Kraštutinės reikšmės. Grafinis pateikimas. - PowerPoint PPT Presentation

Citation preview

APRAŠOMOJI STATISTIKA

Grafinis vaizdavimas (papildymas)

Išskirtys

Duomenų transformacija

Grafinis pateikimas

Grafinis pateikimas

75th Procentilė

75th Procentilė

Vidurkis( *)

Mediana

25th Procentilė

25th Procentilė

Kraštutinės reikšmės

Grafinis pateikimas

44014,00

15,33

16,67

18,00

19,33

20,67

22,00

23,33

24,67

26,00

Grafinis pateikimasRyšio grafikas (koreliacija)

Mg

RR

0 10 20 30 40 50 60-0.49

-0.29

-0.09

0.11

0.31

0.51

Sergamumo skrandžio vėžiu ir Mg koncentracijos vandenyje ryšys

Išskirtys

Išskirtys

• Pagal stebėjimo padėtį duomenų aibėje.

• Empirinė taisyklė

• Tarp 2-3 - duomuo išskirtinis

IšskirtysNormalus skirstinys

• Standartizuotos z reikšmės:

Sąlyginė išskirtis 2-3Išskirtis >3

SD

xxz i

Išskirtys

Normalus skirstinysEil.Nr. Lt. skaičius z stand.

1 1 -2,82 2 -2,43 2 -2,44 3 -25 3 -26 3 -27 3 -28 4 -1,69 4 -1,6… … …190 12 1,6191 13 2192 13 2193 13 2194 13 2195 14 2,4196 14 2,4197 15 2,8

Išskirtys

Skirstinys nenormalus

Skaičiavimas pagal interkvartilinį plotį IQR.

Išskirtis <Q1-3xIQR arba >Q3+3xIQR

Sąlyginė išskirtisnuo Q1-3xIQR iki Q1-1,5xIQR arbanuo Q3+1,5xIQR iki Q3+3xIQR

Išskirtys

Skirstinys nenormalusEil.Nr. Lt.skaičius

1 7 Q1 82 7 Q3 113 8 IQR 34 8 1,5xIQR 4,55 8 3xIQR 96 8 Q1-1,5IQR 3,57 8 Q1-3IQR -18 8 Q3+1,5IQR 15,59 8 Q3+3IQR 20… …190 14191 15192 16193 17194 18195 19196 22197 25

Pavyzdys excel’-yje

Duomenų transformacija

• Logaritminė

• Rangavimas

Logaritminė ir kt.

• Galima gauti panašų į normalų skirstinį

• Naudojama parametrinių analizės metodų taikymui (bet nepaverčia duomenų aibės skirstinio į normalų, nekinta aprašomosios statistikos pasirinktys)

• Sudėtinga interpretacija

Jei skirstinys normalus, kokius metodus (parametrinius ar neparametrinius) naudoti,

toliau analizuojant/lyginant duomenis?

Naudojami parametriniai metodai (vidurkiai, SD, pasirenkamas pvz. Pirsono koreliacijos koeficientas ir pan.)

Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)

naudoti, toliau analizuojant duomenis?• Galima mėginti transformuoti taip, kad

būtų pasiskirstę simetriškiau.

• Transformuotų reikšmių vidurkis• kiekvieno stebėjimo logaritmas, o ne originali

reikšmė– “ištempiamas” intervalas tarp minimalių reikšmių – “suspaudžiami” intervalai maksimalių reikšmių.

Transformacijos pavyzdys

Lovų skaičius300250200150100500

25

20

15

10

5

0

x =55,06, SD =55,9

Daž

nis

ab

s.

Lovų skaičius 48 slaugos ligoninėse

ln_lovų_sk6,005,004,003,002,00

Daž

nis

10

8

6

4

2

0

x =3,69, SD =0,76

Lovų skaičiaus 48 slaugos ligoninėse ln f-ja

Transformacijos pavyzdys

Lovų skaičius Ln

N 48 48

Aritmetinis vidurkis 55,1 3,7

Geometrinis vidurkis 39,9

Mediana 36,00

Anti ln (exp) 39,9

Moda 30(a) 3,40(a)

SD 55,9 0,8

Asimetrijos koeficientas 2,6 0,6

Eksceso koeficientas 7,5 0,4

Min 10 2,3

Max 286 5,7

Kitas vidutinio dydžio parametras asimetriškiems skirstiniams

• Geometrinis Vidurkis• ln XG= (ln[xi] )/ n

• Transformuotų reikšmių logaritmų vidurkis

• ln - natūrinis logaritmas• Taigi:• eln[XG] = Geometrinis Vidurkis

Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)

naudoti, toliau analizuojant duomenis?• Jei transformacija padėjo, t.y. skirstinį galima

laikyti normaliu, tada taikomi parametriniai metodai, toliau naudojant transformuotus duomenis.

(Pastaba: tai jokiu būdu nereiškia, kad apibūdinant imtį požymis pristatomas kaip turintis normalų skirstinį).

• Jei transformacija nepadėjo, taikomi neparametriniai metodai, t.y. ranginiai (medianos, pasirenkamas pvz. Spirmano koreliacijos koeficientas ir pan.)

Rangavimas

• Duomenų (skaitmeninių ir ordinalių) suskirstymas eilės tvarka, priskiriant rango numerį.

• Duomens originali vertė pakeičiama rango numeriu (sąlyginė vertė).

• Galima iš karto įvertinti eiliškumą duomenų aibėje.

• Nurodo, kokioje duomenų aibės vietoje yra konkretus duomuo.

• Naudojama taikant neparametrinius analizės metodus

Rangavimo pavyzdysI variantas

• Mėnesio pajamos

Rangavimo pavyzdysII variantas

• Mėnesio pajamos

Rangavimo pavyzdysIII variantas

• Mėnesio pajamos

Pavyzdys excel’-yje

Recommended