15
1 Μεθοδολογία της Έρευνας και Στατιστική Ανάλυση με χρήση SPSS Ζ ύπαξμε δύν ή πεξηζζνηέξσλ κεηαβιεηώλ ζε κηα έξεπλα, νδεγεί εύινγα ζηελ αλαδήηεζε ηεο (πηζαλήο) κεηαμύ ηνπο ζρέζεο. Δμεηάδεηαη ε ζπκπεξηθνξά ησλ ηηκώλ κηαο κεηαβιεηήο ζε ζρέζε κε ηηο ηηκέο θάπνηαο άιιεο. Ζ επηινγή ηεο ζηαηηζηηθήο ηερληθήο εμαξηάηαη απνθιεηζηηθά από ηε δηάθξηζε ησλ κεηαβιεηώλ ζε πνζνηηθέο ή πνηνηηθέο. πεξηγξαθηθή ζηαηηζηηθή δύν πνηνηηθώλ κεηαβιεηώλ πεξηγξαθηθή ζηαηηζηηθή κηαο πνζνηηθήο κεηαβιεηήο κέζα ζηηο θαηεγνξίεο κηαο πνηνηηθήο-ώλ. 2 Πεξηγξαθηθή ηαηηζηηθή Γύν Μεηαβιεηώλ Θα αζρνιεζνύκε κε ηελ:

Μεθοδολογία της Έρευνας και Στατιστική Ανάλυση με χρήση SPSS

Embed Size (px)

Citation preview

1

Μεθοδολογία της Έρευνας και Στατιστική Ανάλυση με χρήση SPSS

Ζ ύπαξμε δύν ή πεξηζζνηέξσλ κεηαβιεηώλ ζε κηα έξεπλα,

νδεγεί εύινγα ζηελ αλαδήηεζε ηεο (πηζαλήο) κεηαμύ ηνπο

ζρέζεο.

Δμεηάδεηαη ε ζπκπεξηθνξά ησλ ηηκώλ κηαο κεηαβιεηήο ζε

ζρέζε κε ηηο ηηκέο θάπνηαο άιιεο.

Ζ επηινγή ηεο ζηαηηζηηθήο ηερληθήο εμαξηάηαη απνθιεηζηηθά

από ηε δηάθξηζε ησλ κεηαβιεηώλ ζε πνζνηηθέο ή πνηνηηθέο.

πεξηγξαθηθή ζηαηηζηηθή δύν πνηνηηθώλ

κεηαβιεηώλ

πεξηγξαθηθή ζηαηηζηηθή κηαο πνζνηηθήο

κεηαβιεηήο κέζα ζηηο θαηεγνξίεο κηαο

πνηνηηθήο-ώλ.2

Πεξηγξαθηθή ηαηηζηηθή Γύν Μεηαβιεηώλ

Θα αζρνιεζνύκε κε ηελ:

2

Analyze Descriptive Statistics

Crosstabs…

3

FILE OPENDATA salary.sav (δεδνκέλα γηα 474 ππαιιήινπο

πνπ απνιύζεθαλ από κηα ηξάπεδα κεηαμύ ηνπ 1969 θαη ηνπ 1971)

Πεξηγξαθηθή ζηαηηζηηθή δύν ποιοηικών κεηαβιεηώλ

Γηαδηθαζία

Crosstabs

Γεκηνπξγεί

Ραβδνγξάκκαηα

• Percentages: Σα πνζνζηά ησλ γξακκώλ/ζηειώλ αζξνίδνπλ ζην

100% θαηά κήθνο ηεο θάζε γξακκήο/ζηήιεο ηνπ πίλαθα ζπλάθεηαο,

ελώ ηα ζπλνιηθά πνζνζηά αζξνίδνπλ ζην 100% κέζα ζε όια ηα θειηά

ηνπ πίλαθα.

• Residuals: Σα ππόινηπα είλαη νη δηαθνξέο κεηαμύ παξαηεξνύκελσλ

θαη αλακελόκελσλ ηηκώλ ηνπ θάζε θειηνύ.

4

• Counts : Παξαηεξνύκελεο

ζπρλόηεηεο (observed) είλαη νη

κεηξήζεηο ζε θάζε θειί, ελώ

αλακελόκελεο (expected) είλαη ν

αξηζκόο ησλ πεξηπηώζεσλ πνπ ζα

ήηαλ ζε θάζε θειί αλ νη κεηαβιεηέο

πνπ νξίδνπλ ηηο γξακκέο θαη ηηο

ζηήιεο ηνπ πίλαθα ζπλάθεηαο είλαη

ζηαηηζηηθά αλεμάξηεηεο.

3

5

EMPLOYMENT CATEGORY * SEX OF EMPLOYEE Crosstabulation

110 117 227

48.5% 51.5% 100.0%

42.6% 54.2% 47.9%

23.2% 24.7% 47.9%

47 89 136

34.6% 65.4% 100.0%

18.2% 41.2% 28.7%

9.9% 18.8% 28.7%

27 0 27

100.0% .0% 100.0%

10.5% .0% 5.7%

5.7% .0% 5.7%

34 7 41

82.9% 17.1% 100.0%

13.2% 3.2% 8.6%

7.2% 1.5% 8.6%

30 2 32

93.8% 6.3% 100.0%

11.6% .9% 6.8%

6.3% .4% 6.8%

4 1 5

80.0% 20.0% 100.0%

1.6% .5% 1.1%

.8% .2% 1.1%

6 0 6

100.0% .0% 100.0%

2.3% .0% 1.3%

1.3% .0% 1.3%

258 216 474

54.4% 45.6% 100.0%

100.0% 100.0% 100.0%

54.4% 45.6% 100.0%

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

Count

% within EMPLOYMENT

CATEGORY

% within SEX OF

EMPLOYEE

% of Total

CLERICAL

OFFICE TRAINEE

SECURITY OFFICER

COLLEGE TRAINEE

EXEMPT EMPLOYEE

MBA TRAINEE

TECHNICAL

EMPLOYMENT

CATEGORY

Total

MALES FEMALES

SEX OF EMPLOYEE

Total

+ =

+ =

+ =

+ =

+ =

+ =

+ =

+ =

6

• Σα κπιε ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη (αζξνίδνληαη) νξηδόληηα.

• Σα θόθθηλα θαη γαιάδηα ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη

(αζξνίδνληαη) θάζεηα.

• Σα ππνγξακκηζκέλα θαη πλάγια ποζοζηά δηαβάδνληαη (αζξνίδνληαη)

θάζεηα θαη νξηδόληηα.

Σν 48,5% ησλ ηακηώλ είλαη άλδξεο θαη ην 51,5% γπλαίθεο. (άζξνηζκα 100%).

Από ηνπο άλδξεο πνπ απνιύζεθαλ, έρνπκε:

42.6% ηακίεο, 18.2% office-trainee,10.5% security-officer, 13.2% college trainee,

11.6% exempt employee, 1.6% MBA-trainee θαη 2.3 % ηερληθνί. (άζξνηζκα :100%).

Από ηο ζύνολο αςηών πος απολύθηκαν, για ηοςρ άνδπερ έσοςμε:

23.2% ηαμίερ, 9.9% office-trainee, 5.7% security-officer, 7.2% college trainee,

6.3% exempt employee, 0.8% MBA-trainee και 1.3 % ηεσνικοί.

(άθποιζμα :54,4%, πος είναι και ηο ποζοζηό ηων ανδπών).

Ο πίλαθαο δηαβάδεηαη σο εμήο :

4

Οκαδνπνηεκέλν Ραβδόγξακκα (Clustered bar chart)

7

Γξαθηθή αλαπαξάζηαζε ησλ

απνηειεζκάησλ ηνπ

πξνεγνύκελνπ πίλαθα

8

Διέγρνληαο ηα ραξαθηεξηζηηθά ηνπ γξαθήκαηνο

Αλαγξαθή ηνπ πιήζνπο ησλ

ππνθεηκέλσλ πνπ

αλαπαξηζηά θάζε ξάβδνο

Chart editorShow Data Labels

Data Value Labels, Displayed: Count

5

9

Αλ ζέινπκε ην ποζοζηό πνπ αληηζηνηρεί ζε θάζε ξάβδν,

παξάγνπκε θαηλνύξην ξαβδόγξακκα.

επηιέγνπκε

επηιέγνπκε

GraphsBar

Clustered, Summaries for group of cases

Αθνύ αλνίμνπκε ηνλ chart editor επηιέγνπκε σο label: Percent

Chart editorShow Data Labels

Data Value Labels, Displayed: Percent

6

11

πζζσξεπκέλν Ραβδόγξακκα (Stacked bar chart)

TECHNICAL

MBA TRAINEE

EXEMPT EMPLOYEE

COLLEGE TRAINEE

SECURITY OFFICER

OFFICE TRAINEE

CLERICAL

EMPLOYMENT CATEGORY

100,0%

80,0%

60,0%

40,0%

20,0%

0,0%

Perc

en

t

0,21%

0,42%

1,48%

18,78%

24,68%

1,27%

0,84%

6,33%

7,17%

5,7%

9,92%

23,21%

FEMALES

MALES

SEX OF EMPLOYEE

• Γηα θάζε κία από ηηο θαηεγνξίεο ηνπ

επαγγέικαηνο δεκηνπξγείηαη κία

ξάβδνο κε κήθνο ην 100% πνζνζηό.

• Οη δηάθνξεο ζηνίβεο κέζα ζηελ θάζε

ξάβδν αληηζηνηρνύλ ζην πνζνζηό πνπ

έρνπλ ζηε ζπγθεθξηκέλε θαηεγνξία

ηνπ επαγγέικαηνο νη θαηεγνξίεο ηνπ

θύινπ.

• Σα ζπκπεξάζκαηα πνπ κπνξνύκε λα

βγάινπκε, αθνξνύλ ηελ αλαδήηεζε

ηνπ ίδηνπ πξνθίι κέζα ζηηο 7 ξάβδνπο

(πνπ ζα ζήκαηλε αλεμαξηεζία) πνπ

εδώ δε θαίλεηαη λα ππάξρεη.

Πώο παξάγνπκε έλα

ηέηνην γξάθεκα ?

7

Γύν πνηνηηθέο ζηηο ηάμεηο κηαο 3εο πνηνηηθήο κεηαβιεηήο

Ζ δηαδηθαζία Crosstabs κπνξεί λα ρξεζηκνπνηεζεί θαη γηα

πνζνηηθέο κεηαβιεηέο, αξθεί νη ηηκέο απηώλ λα έρνπλ

θσδηθνπνηεζεί ζε δηαζηήκαηα ηηκώλ (Transform Recode ….).

To SPSS παξέρεη κε ηε βνήζεηα ηεο επηινγήο ”Layers”, ηε

δπλαηόηεηα λα νξίζνπκε κία ή πεξηζζόηεξεο πνηνηηθέο κεηαβιεηέο

ζαλ κεηαβιεηέο ειέγρνπ ησλ δεηνύκελσλ πηλάθσλ ζπλάθεηαο :

αξθεί λα ηε κεηαθηλήζνπκε ζηνλ θαηάινγν Layers.

1ε πνηνηηθή κεηαβιεηή

2ε πνηνηηθή κεηαβιεηή

3ε πνηνηηθή κεηαβιεηή (layer)

FILE OPENDATA

cats.sav

Πίλαθαο ζπλάθεηαο κε layer

LayerΟη 2 πνηνηηθέο

κεηαβιεηέο

Ζ ζηαηηζηηθή αλάιπζε ησλ δύν κεηαβιεηώλ γίλεηαη γηα θάζε

ζηξώκα (θαηεγνξία) ηεο κεηαβιεηήο ειέγρνπ (Layer).

8

Σν κόλν ζπκπέξαζκα αθνξά ηε ζύγθξηζε ηνπ

κήθνπο ησλ ξάβδσλ κέζα ζηελ θάζε νκάδα.

Γηα θάζε θατεγορία τες layer ποηοτηθής κεταβιετής σχεκατίδεταη έλα clustered γράυεκα

Ραβδνγξάκκαηα ηεο Crosstabs κε layers

16

Πώο ηα

παξάγνπκε

9

Γηπιό αξηζηεξό θιίθ ζην γξάθεκα γηα λα αλνίμεη ν chart editor. Edit Properties Variables ηελ θαξηέια Variables: Αιιάδσ ηα ραξαθηεξηζηηθά x-Axis θαη x-Cluster

ζηηο δύν κεηαβιεηέο.

18

10

Γηαδηθαζία Means (αλάιπζε κέζσλ ηηκώλ)

Analyze Compare Means Means

19

Αλνίγνπκε πάιη ην salary.savΜέζεο ηηκέο ηεο πνζνηηθήο salbeg ζηηο

θαηεγνξίεο ηεο πνηνηηθήο sex αιιά &

jobcat

Δπ

ηπιέν

λ ζ

ηαηηζ

ηηθά

20

Απνηειέζκαηα ηεο δηαδηθαζίαο Means

Μνλαδηθό layer :

employment category

Γύν layers: employment

category & sex

11

21

Graphs Bar Charts Simple

Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ

ηεο δηαδηθαζίαο MEANS (έλα Layer)

Graphs Bar Charts Clustered

22

Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ

ηεο δηαδηθαζίαο MEANS (δύν Layers)

12

Έιεγρνο ππνζέζεσλ: ε ζηαηηζηηθή

δηαδηθαζία εμαγσγήο ζπκπεξαζκάησλ γηα

ηνλ πιεζπζκό ειέγρνληαο ην δείγκα

Υ2 –test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ

κεηαβιεηώλ

ΣΟ ΣΔΣ ΑΤΣO ΔΛΔΓΥΔΗ ΣΖΝ ΤΠΑΡΞΖ

ΥΔΖ ΜΔΣΑΞΤ ΓΤΟ ΠΟΗΟΣΗΚΩΝ

ΜΔΣΑΒΛΖΣΩΝ.

Βαζηθά ζηνηρεία ηεο

ζεσξίαο ειέγρνπ

ππνζέζεσλ

Αλ νη πξαγκαηηθέο ηηκέο ησλ παξακέηξσλ

ηνπ πιεζπζκνύ ηθαλνπνηνύλ ηηο ππνζέζεηο

κε βάζε ηα δεδνκέλα ηνπ δείγκαηνο ,

κπνξνύκε λα πξνρσξήζνπκε ζηε

δηαδηθαζία ιήςεο απνθάζεσλ

Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ

Τε κεδεληθή ππόζεζε Η0 κε ζθνπό λα δηαςεπζηεί

Τελ ελαιιαθηηθή ππόζεζε Η1.

Οξίδνπκε εθ ησλ

πξνηέξσλ 2 ππνζέζεηο

Παξαηεξήζεηο Η κεδεληθή ππόζεζε Η0 δηαηππώλεηαη κε ζθνπό λα ακθηζβεηεζεί. Σπλήζσο, ην αληίζεην ηνπ ζπκπεξάζκαηνο ζην νπνίν επηζπκεί λα θζάζεη ν εξεπλεηήο γίλεηαη κεδεληθή ππόζεζε.

Με ην ζηαηηζηηθό έιεγρν είηε απνξξίπηνπκε ηελ Η0 ή εάλ δελ απνξξηθζεί ΣΟΝΗΕΟΤΜΔ όηη ηα δεδνκέλα ζηα νπνία ζηεξίδεηαη ν ζηαηηζηηθόο έιεγρνο δελ επαξθνύλ γηα ηελ απόξξηςε ηεο αξρηθήο ππόζεζεο.

Εάλ απνξξίςνπκε ηελ Η0, ηα δεδνκέλα δελ επαιεζεύνπλ ηελ αξρηθή ππόζεζε θαη είλαη ζπκβαηά κε ηελ ελαιιαθηηθή ππόζεζε Η1.

13

25

Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ

Οη ππνζέζεηο Η0, Η1 δηαηππώλνληαη κε ηε βνήζεηα ησλ ζηαηηζηηθώλ

παξακέηξσλ ηνπ κνληέινπ πνπ πηνζεηείηαη γηα ηελ αλάιπζε ησλ δεδνκέλσλ.

Ζ0 : ζ = ζ0

Ζ1: ζ ≠ ζ0 (ακθίπιεπξνο ζηαηηζηηθόο έιεγρνο) ή ζ > ζ0 (ζ < ζ0) (κνλόπιεπξνο

ζηαηηζηηθόο έιεγρνο)

Οξίδεηαη ε ζηαηηζηηθή ζπλάξηεζε ηνπ ειέγρνπ από ην δείγκα.

θάικα ηύπνπ Ι (type I error) : ε απόξξηςε ηεο κεδεληθήο ππόζεζεο Η0,

ελώ είλαη ζσζηή = a = P(απόξξηςε ηεο Η0 / ε Η0 είλαη αιεζήο)

θάικα ηύπνπ ΙI (type II error) : ε απνδνρή ηεο κεδεληθήο ππόζεζεο Η0,

ελώ είλαη ιάζνο = β = P(απνδνρή ηεο Η0 / ε Η0 είλαη ςεπδήο)

πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ0

πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ1

26

στατιστικός (συμπέρασμα)

φύση(πραγματικότη

τα)

ΑΠΟΔΟΧΗ της Η0

ΑΠΟΡΡΙΨΗ της Η0

Αληθεύειη Η0

p=1-aσφάλμα τύπου Ι

Αληθεύει η Η1

σφάλμα τύπου ΙΙ

p=1-β = γ

Όηαλ ε Η0 αιεζεύεη θαη ν ζηαηηζηηθόο απνδερζεί ηελ Η0 δε γίλεηαη

ζθάικα, ελώ αλ ν ζηαηηζηηθόο απνξξίςεη ηελ Η0 ηόηε γίλεηαη ζθάικα

ηύπνπ Ι. Όηαλ αιεζεύεη ε ελαιιαθηηθή ππόζεζε Η1 θαη ν ζηαηηζηηθόο

απνδερζεί ηελ Η0 γίλεηαη ζθάικα ηύπνπ ΙΙ, ελώ αλ απνξξίςεη ηελ Η0 δε

γίλεηαη ζθάικα.

Τα δύν ζθάικαηα είλαη ηπραία ελδερόκελα.

Η πηζαλόηεηα a ηνπ ζθάικαηνο ηύπνπ Ι νλνκάδεηαη επίπεδν

ζεκαληηθόηεηαο ηνπ ζηαηηζηηθνύ ειέγρνπ.

Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ

α, β όζν ην

δπλαηό

κηθξόηεξα

14

27

ΠΡΟΫΠΟΘΔΔΗ γηα ηελ εθαξκνγή ηνπ ειέγρνπ:

1) Θij >= 5 Γειαδή νη αλακελόκελεο (expected)

παξαηεξήζεηο ζε θάζε θειί ηνπ πίλαθα ζπλάθεηαο

λα είλαη ηνπιάρηζηνλ 5 ή ην πνιύ 20% ησλ ζij <= 5.

2) Σν θάζε άηνκν λα εκθαλίδεηαη κόλν κηα θνξά ζε

θάζε θειί , δειαδή λα κελ ππάξρεη επηθάιπςε ζηηο

θαηεγνξίεο.

Υ2 –test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ

κεηαβιεηώλ

Ζ0 : Σα δύν ραξαθηεξηζηηθά είλαη αλεμάξηεηα

Ζ1 : Σα δύν ραξαθηεξηζηηθά είλαη εμαξηεκέλα

Αλνίμηε ην αξρείν Gss

Analyze Descriptives Statistics Crosstabs

Υ2 –test αλεμαξηεζίαο (από crosstabs)

15

RS Highest Degree * Is life exciting or dull Crosstabulation

24 96 66 186

12,0 85,8 88,2 186,0

35 251 231 517

33,3 238,5 245,3 517,0

2 33 27 62

4,0 28,6 29,4 62,0

2 58 97 157

10,1 72,4 74,5 157,0

1 21 51 73

4,7 33,7 34,6 73,0

64 459 472 995

64,0 459,0 472,0 995,0

Count

Expected Count

Count

Expected Count

Count

Expected Count

Count

Expected Count

Count

Expected Count

Count

Expected Count

Less than HS

High school

Junior college

Bachelor

Graduate

RS Highest

Degree

Total

Dull Routine Exciting

Is life exc iting or dull

Total

Chi-Square Tests

53,962a 8 ,000

55,874 8 ,000

47,633 1 ,000

995

Pearson Chi-Square

Likelihood Ratio

Linear-by-Linear

Assoc iation

N of Valid Cases

Value df

Asy mp. Sig.

(2-sided)

2 cells (13,3%) have expected count less than 5. The

minimum expected count is 3,99.

a.

Διέγρνπκε ηηο

πξνϋπνζέζεηο γηα ην ρ2

ηεζη.

ε 2 θειηά έρνπκε:

Θij<5. Σν ζπλνιηθό

πνζνζηό ηνπο είλαη

κηθξόηεξν ηνπ 20% θαη

άξα ηθαλνπνηνύληαη νη

πξνϋπνζέζεηο γηα ην ρ2

ηεζη.

Sig<0.05 =>

Απνξξίπηεηαη ε Ζo

Γειαδή δελ είλαη

αλεμάξηεηεο νη κεηαβιεηέο.

Υ2 –test αλεμαξηεζίαο (από crosstabs)

30

Γνθηκάζηε ηώξα κόλνη ζαο :

ΑΚΖΖ 3

users.auth.gr/askourke