47
Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017. Ekonomski fakultet u Osijeku, Kolegij: Statistička analiza poslovnih podataka On-line nastavni materijali 1 Deskriptivna statistika SPSS PODJELA STATISTIČKIH METODA metode deskriptivne (opisne) statistike metode inferencijalne statistike regresijska i korelacijska analiza analiza vremenskih nizova

Deskriptivna statistika SPSS - EFOS · Kolegij: Statistička analiza poslovnih podataka On-line nastavni materijali 34 SPSS tumačenje •statističaridonose višeili manje stroge

  • Upload
    others

  • View
    34

  • Download
    1

Embed Size (px)

Citation preview

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 1

Deskriptivna statistika SPSS

PODJELA STATISTIČKIH METODA

• metode deskriptivne (opisne) statistike

• metode inferencijalne statistike

• regresijska i korelacijska analiza

• analiza vremenskih nizova

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 2

Deskriptivna statistika

opisuju se statistički podaci koristi brojčane i grafičke metode kako bi

prikupljene podatke prikazala na razumljiv i jasan način

METODE INFERENCIJALNE STATISTIKE

• Inferencijalna statistika donosi zaključke o populaciji na temelju izabranog uzorka koristeći

– procjene

– testiranja hipoteza

– određivanja veza između varijabla

– predviđanja o populaciji

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 3

Osnovna podjela inajčešći pokazatelji

Deskriptivnastatistika

Mjeresredišta

Aritmetičkasredina

Mod

Medijan

Kvartili

Mjeredisperzije

Varijanca

Standardnadevijacija

Mjereasimetrije

Skewnesi

Mjerazaobljenosti

Kurtosis

Mjere središnje tendencije

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 4

Aritmetička sredina

• početak analize distribucije frekvencija

• opisuju središte (centar) distribucije podataka

• pojašnjavaju odnos između velikog broja promatranih podataka

• najčešće korištena mjera središnje tendencije

Tumačenje

• Prosječna vrijednost promatrane varijableiznosi …..– ili

• U prosjeku promatrana varijabla iznosi...

– Izražava se u vrijednostima varijable

• Npr. ako računamo prosječna primanja

– prosjek se izražava u kunama

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 5

Cilj - opisati veliki niz podataka jednim brojem- usporediti dvije ili više DF karakterizirajući svaku distribuciju jednim jedinim brojem (parametrom, pokazateljem)

Oblici distribucija

• 5 svojstava

• važna uloga u razumijevanju:

– aritmetičke sredine

– varijance

Svojstva aritmetičke sredine

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 6

• Algebarski zbroj odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je nuli.

1. svojstvo

Prosječan broj djeceu obitelji je 3 djece.

• Zbroj kvadrata odstupanja originalnih vrijednosti numeričkog obilježja od aritmetičke sredine jednak je minimumu

2. svojstvo

Prosječan broj djeceu obitelji je 3 djece.

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 7

• Aritmetička sredina uvijek se nalazi između najmanje i najveće vrijednosti varijable

3. svojstvo

4. svojstvo

• Ako je vrijednost numeričke varijable xi

jednaka konstanti c, aritmetička sredina te varijable jednaka je konstanti c.

• Aritmetička sredina sklona je izdvojenicama (ekstremima).

5. svojstvo

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 8

• izdvojenice utječu na reprezentativnost

• u distribucijama s jednom ili više izdvojenica aritmetička sredina nije najbolji pokazatelj središta

– (preporučuje se korištenje drugih mjera središnje tendencije npr. mod, medijan)

Reprezentativnost aritmetičke sredine

Kod kojih primarnih mjernih ljestvica je dozvoljeno računati prosjek?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 9

Kvartili

• dijele niz na q jednakih dijelova

Medijan

– Medijan je numerička vrijednost koja niz dijeli na DVA jednaka dijela (q=2)

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 10

Tumačenje

• 50% jedinica niza ima vrijednost medijana i manje od te vrijednosti, a 50% jedinica niza ima vrijednost medijana i više od te vrijednosti

– Izražava se u vrijednostima varijable

Kod kojih primarnih mjernih ljestvica je dozvoljeno računati kvantile?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 11

Mod

• vrijednost numeričkog obilježja koja je obzirom na svoje susjedne vrijednosti najčešća

• dijeli distribuciju frekvencija na rastuću i padajuću stranu

• analiza mjernih ljestvica – SVE ljestvice

Distribucije s obzirom na postojanje moda

• Jednomodalne

• Dvomodalne

• Višemodalne

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 12

Kod kojih primarnih mjernih ljestvica je dozvoljeno računati mod?

Mjere disperzije

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 13

Što znači disperzija?

• Svaka varijabla ima svoje podatke

– ti podatci međusobno?

• VARIRAJU!!!

• Varijable opisujemo parametrima• npr. prosjek, mod, …

– ako podaci jedne varijable jako variraju, je li prosjek reprezentativan?

Mjere diperzije

• Raspršenost podataka varijabli oko središta distribucije

– npr. prosjeka

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 14

Vrste mjera disperzije

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 15

• Varijanca

• Standardna devijacija

Spomenut ćemo najznačajnije

Varijanca

• Prosječno kvadratno odstupanje od prosjeka

• Izražava se u vrijednostima varijable

k

ii

k

iii

f

xf

1

2

12

)(

1

2

12

n

xxf

s

k

iii )(

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 16

T (s2(A)): Plaće zaposlenika poduzeća A prosječno kvadratno odstupaju od

prosječne plaće za 61.140 kuna.Ukoliko se uspoređuju poduzeća A, B i C te njihova disperzija na temelju varijance vidljivo je iz tablice 3.40 kako je najveća disperzija zabilježena je u poduzeću A(61.140 kuna), a najmanja u poduzeću B (23.710 kuna).

Standardna devijacija

• Standardno odstupanje od prosjeka

• Izražava se u vrijednostima varijable

s = s 2s = s2

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 17

T (s(A)): Plaće zaposlenika poduzeća A standardno odstupaju od prosjeka za 7.820 kuna. Uspoređujući poduzeće A, B i C zamjetno je najmanja standardna devijacija u poduzeću B (4,87) te najveća u poduzeću A (7,82).

• ???

• vrijednosti varijable

– ____%

– ____godina

– ____5-stupnjevana Likertova ljestvica

– ____Da/Ne

Usporedivost podataka

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 18

• Pravokutni dijagram (B-P dijagram, Box-plot dijagram)

• koristi pet karakterističnih vrijednosti niza:

– medijan

– prvi kvartil

– treći kvartil

– najmanja i

– najveća vrijednost niza

Specifična vrsta grafikona

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 19

DESKRIPTIVNA STATISTIKA

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 20

Prijedlog

• Voditi bilješke u Wordu

Analyze / Descriptive statisticsZBF_2015.sav

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 21

ZBF 2015

• Upitnik

• Variable View

– Koliko datoteka sadrži varijabla?

• Data View

– Koliko datoteka sadrži ispitanika?

Ponovimo…

• U outputu prikažite sljedeće rezultate:

– tablicu distribucija frekvencija za varijablu v12

– histogram za varijablu v12

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 22

Pitanje

• Varijable v5a-v5k

• Ukoliko promotrimo zadovoljstvo aktivnostimaZBF-a 2015 odgovorite:

– S kojom aktivnosti su posjetitelji u prosjekunajzadovoljniji, a s kojom najmanje zadovoljni?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 23

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 24

Preglednost rezultata

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 25

Koja aktivnost je bila najposjećenija?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 26

• U svakom pitanju modalitet

– 0 (nula)

• Obavezan odgovor na pitanju

• Vrijednost uključena u izračun prosjeka?

Ponovljena analiza

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 27

Gdje su nule?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 28

TUMAČENJE

Zadatak 1

U Word odgovorite na sljedeća pitanja (odgovorepotkrijepiti tablicama ili grafikonima)

1. Koliko su ispitanici u prosjeku zadovoljni Zagreb Book Festivalom?

2. Koliki postotak nije zadovoljan Zagreb Book Festivalom?

3. Koliki postotak ispitanika planira doći sljedeći dan ZBF-a?

4. Koliki postotak ispitanika su muškarci?

5. Protumačite prosječnu ocjenu za stupanj izobrazbe.

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 29

NE POMAŽEMO

• Snimiti datoteku

– Vjezba_ZBF

OPREZ

• Prosjek

–SAMO SCALE VARIJABLE

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 30

Zadatak

• Koristeći naredbu Frequencies ispišiterezultate za varijablu v12 (odaberite sveponuđene parametre u opciji Statistics)

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 31

TUMAČENJE – ZNAČENJE PARAMETRA SKEWNES I KURTOSIS?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 32

Mjere asimetrije i zaobljenosti

Mjere asimetrije mjere:

• načini rasporeda članova statističkoga niza prema osisimetrije

• odstupanja vrijednosti podataka varijable od mjera središnje tendencije (aritmetičke sredine, medijana, moda itd.)

• upotpunjena slika o rasporedu podataka

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 33

Mogući ishodi

• Simetrična distribucija

– rezultat 0 (nula)

Mogući ishodi

• Pozitivno asimetrična distribucija

– rezultat veći od nule

• Negativno asimetrična distribucija

– rezultat manji od nule

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 34

SPSS tumačenje

• statističari donose više ili manje stroge graniceza tumačenje asimetrije distribucije

– rezultati koji su veći od 1, a manji od -1 smatrajuse neprihvatljiivma u tumačenju normalnostidistribucije

– rezultati u intervalu +/-1 su prihvatljivi, ali irezultati u intervalu +/-2 mogu se smatratiprihvatljivima

SPSS tumačenje

• Pravilo• omjer skewnesa i njegove standardne pogreške

– rezultati u intervalu +/-1,96 smatraju se prihvatljivimau tumačenju normalnosti distribucije s obzirom nasimetriju

» o intervalu 1,96 uskoro detaljnije

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 35

Mjera zaobljenosti

• zakrivljenost distribucije frekvencija

Normalne distribucije?

Tumačenja rezultata

• Vrijednosti blizu 0 (nuli)

– Normalna distribucija

• Pozitivne vrijednosti

– Izdužena distribucija

• Negativne vrijednosti

– Spljoštena distribucija

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 36

SPSS tumačenje

• Vidjeti skewnes

• Pravilo• omjer kurtosisa i njegove standardne pogreške

– rezultati u intervalu +/-1,96 smatraju se prihvatljivimau tumačenju normalnosti distribucije s obzirom nazaobljenost vrha distribucije

» o intervalu 1,96 - uskoro detaljnije

Vratimo se na naše rezultate

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 37

TUMAČENJE

Indiciraju li visoke vrijednosti skewnes i kurtosis narušenu pretpostavku o normalnosti

distribucije?

• Veliki uzorak?

– Standardne pogreške distribucija ovise o veličiniuzorka

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 38

• Profesor na policijskoj akademiji kaže:

- Vi ništa ne znate, vas 80% neće proći ispit- Nema nas toliko - začuje se iz klupa..

Analyze / ExploreZBF_2015.sav

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 39

Odabir procedure Explore

• mogućnost analiziranja ispitanika premaskupinama

• analiza izdvojenica grafičkim prikazima:

– dijagram stabla i lista (S-L dijagram)

– pravokutni dijagram (BOX-PLOT)

Usporedba ukupnog zadovoljstva iroda posjetitelja

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 40

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 41

• 5% Trimmed Mean

– Prosjek izračunat izostavljanjem krajnjih 5% ispitanika (i na donju i na gornju granicu)

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 42

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 43

Kako identificirati izdvojenice(ekstreme)

• Pokrenimo naredbu Explore

– Zavsina varijabla

• ukupno zadovoljstvo aktivnostima ZBF-a

– Factor list

• d2– status u zaposlenju

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 44

3 ekstremne vrijednosti na gornjugranicu (vrijednosti veće od 39)

SPSS ID ispitanika

Zašto u ovoj distribuciji ova vrijednostnije označena kao ekstremna?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 45

Analizirajući prethodni grafikon

• Koja skupina ispitanika ima najveće ukupnozadovoljstvo festivalom? Koja najmanje?

Analizirajući prethodni grafikon

– Ali to je samo zbroj ocjena, odnosno što suposjetili više aktivnosti njihovo ukupnozadovoljstvo može biti veće.

• Prosječno zadovoljstvo?

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 46

Zadatak

• Otvorite Word dokument

– Predaja na Loomenu

• Izračunajte prosječnu ocjenu zadovoljstvom aktivnostima ZBF-a

• Usporedite prosječne ocjene s obzirom na varijable rod i status u zaposlenju.

– Prokomentirajte zaključke

• Snimiti datoteku

– Procedura_Explore_ZBF

Mijoč, Josipa (2017.) Posljednja izmjena: 26.9.2017.

Ekonomski fakultet u Osijeku,Kolegij: Statistička analiza poslovnih podatakaOn-line nastavni materijali 47

Prokomentirajmo

Razlika između naredbi:Frequencies

ExploreDescriptive