Upload
fulton-lancaster
View
271
Download
1
Embed Size (px)
DESCRIPTION
APRAŠOMOJI STATISTIKA Grafinis vaizdavimas (papildymas) Išskirtys Duomenų transformacija. Grafinis pateikimas. Grafinis pateikimas. 75th Procentilė. 75th Procentilė. Vidurkis( *). Mediana. 25th Procentilė. 25th Procentilė. Kraštutinės reikšmės. Grafinis pateikimas. - PowerPoint PPT Presentation
Citation preview
APRAŠOMOJI STATISTIKA
Grafinis vaizdavimas (papildymas)
Išskirtys
Duomenų transformacija
Grafinis pateikimas
Grafinis pateikimas
75th Procentilė
75th Procentilė
Vidurkis( *)
Mediana
25th Procentilė
25th Procentilė
Kraštutinės reikšmės
Grafinis pateikimas
44014,00
15,33
16,67
18,00
19,33
20,67
22,00
23,33
24,67
26,00
Grafinis pateikimasRyšio grafikas (koreliacija)
Mg
RR
0 10 20 30 40 50 60-0.49
-0.29
-0.09
0.11
0.31
0.51
Sergamumo skrandžio vėžiu ir Mg koncentracijos vandenyje ryšys
Išskirtys
Išskirtys
• Pagal stebėjimo padėtį duomenų aibėje.
• Empirinė taisyklė
• Tarp 2-3 - duomuo išskirtinis
IšskirtysNormalus skirstinys
• Standartizuotos z reikšmės:
Sąlyginė išskirtis 2-3Išskirtis >3
SD
xxz i
Išskirtys
Normalus skirstinysEil.Nr. Lt. skaičius z stand.
1 1 -2,82 2 -2,43 2 -2,44 3 -25 3 -26 3 -27 3 -28 4 -1,69 4 -1,6… … …190 12 1,6191 13 2192 13 2193 13 2194 13 2195 14 2,4196 14 2,4197 15 2,8
Išskirtys
Skirstinys nenormalus
Skaičiavimas pagal interkvartilinį plotį IQR.
Išskirtis <Q1-3xIQR arba >Q3+3xIQR
Sąlyginė išskirtisnuo Q1-3xIQR iki Q1-1,5xIQR arbanuo Q3+1,5xIQR iki Q3+3xIQR
Išskirtys
Skirstinys nenormalusEil.Nr. Lt.skaičius
1 7 Q1 82 7 Q3 113 8 IQR 34 8 1,5xIQR 4,55 8 3xIQR 96 8 Q1-1,5IQR 3,57 8 Q1-3IQR -18 8 Q3+1,5IQR 15,59 8 Q3+3IQR 20… …190 14191 15192 16193 17194 18195 19196 22197 25
Pavyzdys excel’-yje
Duomenų transformacija
• Logaritminė
• Rangavimas
Logaritminė ir kt.
• Galima gauti panašų į normalų skirstinį
• Naudojama parametrinių analizės metodų taikymui (bet nepaverčia duomenų aibės skirstinio į normalų, nekinta aprašomosios statistikos pasirinktys)
• Sudėtinga interpretacija
Jei skirstinys normalus, kokius metodus (parametrinius ar neparametrinius) naudoti,
toliau analizuojant/lyginant duomenis?
Naudojami parametriniai metodai (vidurkiai, SD, pasirenkamas pvz. Pirsono koreliacijos koeficientas ir pan.)
Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)
naudoti, toliau analizuojant duomenis?• Galima mėginti transformuoti taip, kad
būtų pasiskirstę simetriškiau.
• Transformuotų reikšmių vidurkis• kiekvieno stebėjimo logaritmas, o ne originali
reikšmė– “ištempiamas” intervalas tarp minimalių reikšmių – “suspaudžiami” intervalai maksimalių reikšmių.
Transformacijos pavyzdys
Lovų skaičius300250200150100500
25
20
15
10
5
0
x =55,06, SD =55,9
Daž
nis
ab
s.
Lovų skaičius 48 slaugos ligoninėse
ln_lovų_sk6,005,004,003,002,00
Daž
nis
10
8
6
4
2
0
x =3,69, SD =0,76
Lovų skaičiaus 48 slaugos ligoninėse ln f-ja
Transformacijos pavyzdys
Lovų skaičius Ln
N 48 48
Aritmetinis vidurkis 55,1 3,7
Geometrinis vidurkis 39,9
Mediana 36,00
Anti ln (exp) 39,9
Moda 30(a) 3,40(a)
SD 55,9 0,8
Asimetrijos koeficientas 2,6 0,6
Eksceso koeficientas 7,5 0,4
Min 10 2,3
Max 286 5,7
Kitas vidutinio dydžio parametras asimetriškiems skirstiniams
• Geometrinis Vidurkis• ln XG= (ln[xi] )/ n
• Transformuotų reikšmių logaritmų vidurkis
• ln - natūrinis logaritmas• Taigi:• eln[XG] = Geometrinis Vidurkis
Jei skirstinys nėra normalus, kokius metodus (parametrinius ar neparametrinius)
naudoti, toliau analizuojant duomenis?• Jei transformacija padėjo, t.y. skirstinį galima
laikyti normaliu, tada taikomi parametriniai metodai, toliau naudojant transformuotus duomenis.
(Pastaba: tai jokiu būdu nereiškia, kad apibūdinant imtį požymis pristatomas kaip turintis normalų skirstinį).
• Jei transformacija nepadėjo, taikomi neparametriniai metodai, t.y. ranginiai (medianos, pasirenkamas pvz. Spirmano koreliacijos koeficientas ir pan.)
Rangavimas
• Duomenų (skaitmeninių ir ordinalių) suskirstymas eilės tvarka, priskiriant rango numerį.
• Duomens originali vertė pakeičiama rango numeriu (sąlyginė vertė).
• Galima iš karto įvertinti eiliškumą duomenų aibėje.
• Nurodo, kokioje duomenų aibės vietoje yra konkretus duomuo.
• Naudojama taikant neparametrinius analizės metodus
Rangavimo pavyzdysI variantas
• Mėnesio pajamos
Rangavimo pavyzdysII variantas
• Mėnesio pajamos
Rangavimo pavyzdysIII variantas
• Mėnesio pajamos
Pavyzdys excel’-yje