26
APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Embed Size (px)

DESCRIPTION

APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija. Grafinis pateikimas. Grafinis pateikimas. 75th Procentilė. 75th Procentilė. Vidurkis( *). Mediana. 25th Procentilė. 25th Procentilė. Kraštutinės reikšmės. Grafinis pateikimas. - PowerPoint PPT Presentation

Citation preview

Page 1: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

APRAŠOMOJI STATISTIKA

Grafinis vaizdavimas (papildymas)

Išskirtys

Duomenų transformacija

Page 2: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Grafinis pateikimas

Page 3: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Grafinis pateikimas

75th Procentilė

75th Procentilė

Vidurkis( *)

Mediana

25th Procentilė

25th Procentilė

Kraštutinės reikšmės

Page 4: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Grafinis pateikimas

44014,00

15,33

16,67

18,00

19,33

20,67

22,00

23,33

24,67

26,00

Page 5: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Grafinis pateikimasRyšio grafikas (koreliacija)

Mg

RR

0 10 20 30 40 50 60-0.49

-0.29

-0.09

0.11

0.31

0.51

Sergamumo skrandžio vėžiu ir Mg koncentracijos vandenyje ryšys

Page 6: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Išskirtys

Page 7: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Išskirtys

• Pagal stebėjimo padėtį duomenų aibėje.

• Empirinė taisyklė

• Tarp 2-3 - duomuo išskirtinis

Page 8: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

IšskirtysNormalus skirstinys

• Standartizuotos z reikšmės:

Sąlyginė išskirtis 2-3Išskirtis >3

SD

xxz i

Page 9: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Išskirtys

Normalus skirstinysEil.Nr. Lt. skaičius z stand.

1 1 -2,82 2 -2,43 2 -2,44 3 -25 3 -26 3 -27 3 -28 4 -1,69 4 -1,6… … …190 12 1,6191 13 2192 13 2193 13 2194 13 2195 14 2,4196 14 2,4197 15 2,8

Page 10: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Išskirtys

Skirstinys nenormalus

Skaičiavimas pagal interkvartilinį plotį IQR.

Išskirtis <Q1-3xIQR arba >Q3+3xIQR

Sąlyginė išskirtisnuo Q1-3xIQR iki Q1-1,5xIQR arbanuo Q3+1,5xIQR iki Q3+3xIQR

Page 11: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Išskirtys

Skirstinys nenormalusEil.Nr. Lt.skaičius

1 7 Q1 82 7 Q3 113 8 IQR 34 8 1,5xIQR 4,55 8 3xIQR 96 8 Q1-1,5IQR 3,57 8 Q1-3IQR -18 8 Q3+1,5IQR 15,59 8 Q3+3IQR 20… …190 14191 15192 16193 17194 18195 19196 22197 25

Page 12: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Pavyzdys excel’-yje

Page 13: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Duomenų transformacija

• Logaritminė

• Rangavimas

Page 14: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Logaritminė ir kt.

• Galima gauti panašų į normalų skirstinį

• Naudojama parametrinių analizės metodų taikymui (bet nepaverčia duomenų aibės skirstinio į normalų, nekinta aprašomosios statistikos pasirinktys)

• Sudėtinga interpretacija

Page 15: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Jei skirstinys normalus, kokius metodus (parametrinius ar neparametrinius) naudoti,

toliau analizuojant/lyginant duomenis?

Naudojami parametriniai metodai (vidurkiai, SD, pasirenkamas pvz. Pirsono koreliacijos koeficientas ir pan.)

Page 16: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija
Page 17: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)

naudoti, toliau analizuojant duomenis?• Galima mėginti transformuoti taip, kad

būtų pasiskirstę simetriškiau.

• Transformuotų reikšmių vidurkis• kiekvieno stebėjimo logaritmas, o ne originali

reikšmė– “ištempiamas” intervalas tarp minimalių reikšmių – “suspaudžiami” intervalai maksimalių reikšmių.

Page 18: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Transformacijos pavyzdys

Lovų skaičius300250200150100500

25

20

15

10

5

0

x =55,06, SD =55,9

Daž

nis

ab

s.

Lovų skaičius 48 slaugos ligoninėse

ln_lovų_sk6,005,004,003,002,00

Daž

nis

10

8

6

4

2

0

x =3,69, SD =0,76

Lovų skaičiaus 48 slaugos ligoninėse ln f-ja

Page 19: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Transformacijos pavyzdys

Lovų skaičius Ln

N 48 48

Aritmetinis vidurkis 55,1 3,7

Geometrinis vidurkis 39,9

Mediana 36,00

Anti ln (exp) 39,9

Moda 30(a) 3,40(a)

SD 55,9 0,8

Asimetrijos koeficientas 2,6 0,6

Eksceso koeficientas 7,5 0,4

Min 10 2,3

Max 286 5,7

Page 20: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Kitas vidutinio dydžio parametras asimetriškiems skirstiniams

• Geometrinis Vidurkis• ln XG= (ln[xi] )/ n

• Transformuotų reikšmių logaritmų vidurkis

• ln - natūrinis logaritmas• Taigi:• eln[XG] = Geometrinis Vidurkis

Page 21: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)

naudoti, toliau analizuojant duomenis?• Jei transformacija padėjo, t.y. skirstinį galima

laikyti normaliu, tada taikomi parametriniai metodai, toliau naudojant transformuotus duomenis.

(Pastaba: tai jokiu būdu nereiškia, kad apibūdinant imtį požymis pristatomas kaip turintis normalų skirstinį).

• Jei transformacija nepadėjo, taikomi neparametriniai metodai, t.y. ranginiai (medianos, pasirenkamas pvz. Spirmano koreliacijos koeficientas ir pan.)

Page 22: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Rangavimas

• Duomenų (skaitmeninių ir ordinalių) suskirstymas eilės tvarka, priskiriant rango numerį.

• Duomens originali vertė pakeičiama rango numeriu (sąlyginė vertė).

• Galima iš karto įvertinti eiliškumą duomenų aibėje.

• Nurodo, kokioje duomenų aibės vietoje yra konkretus duomuo.

• Naudojama taikant neparametrinius analizės metodus

Page 23: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Rangavimo pavyzdysI variantas

• Mėnesio pajamos

Page 24: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Rangavimo pavyzdysII variantas

• Mėnesio pajamos

Page 25: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Rangavimo pavyzdysIII variantas

• Mėnesio pajamos

Page 26: APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija

Pavyzdys excel’-yje