Upload
independent
View
0
Download
0
Embed Size (px)
Citation preview
1
Μεθοδολογία της Έρευνας και Στατιστική Ανάλυση με χρήση SPSS
Ζ ύπαξμε δύν ή πεξηζζνηέξσλ κεηαβιεηώλ ζε κηα έξεπλα,
νδεγεί εύινγα ζηελ αλαδήηεζε ηεο (πηζαλήο) κεηαμύ ηνπο
ζρέζεο.
Δμεηάδεηαη ε ζπκπεξηθνξά ησλ ηηκώλ κηαο κεηαβιεηήο ζε
ζρέζε κε ηηο ηηκέο θάπνηαο άιιεο.
Ζ επηινγή ηεο ζηαηηζηηθήο ηερληθήο εμαξηάηαη απνθιεηζηηθά
από ηε δηάθξηζε ησλ κεηαβιεηώλ ζε πνζνηηθέο ή πνηνηηθέο.
πεξηγξαθηθή ζηαηηζηηθή δύν πνηνηηθώλ
κεηαβιεηώλ
πεξηγξαθηθή ζηαηηζηηθή κηαο πνζνηηθήο
κεηαβιεηήο κέζα ζηηο θαηεγνξίεο κηαο
πνηνηηθήο-ώλ.2
Πεξηγξαθηθή ηαηηζηηθή Γύν Μεηαβιεηώλ
Θα αζρνιεζνύκε κε ηελ:
2
Analyze Descriptive Statistics
Crosstabs…
3
FILE OPENDATA salary.sav (δεδνκέλα γηα 474 ππαιιήινπο
πνπ απνιύζεθαλ από κηα ηξάπεδα κεηαμύ ηνπ 1969 θαη ηνπ 1971)
Πεξηγξαθηθή ζηαηηζηηθή δύν ποιοηικών κεηαβιεηώλ
Γηαδηθαζία
Crosstabs
Γεκηνπξγεί
Ραβδνγξάκκαηα
• Percentages: Σα πνζνζηά ησλ γξακκώλ/ζηειώλ αζξνίδνπλ ζην
100% θαηά κήθνο ηεο θάζε γξακκήο/ζηήιεο ηνπ πίλαθα ζπλάθεηαο,
ελώ ηα ζπλνιηθά πνζνζηά αζξνίδνπλ ζην 100% κέζα ζε όια ηα θειηά
ηνπ πίλαθα.
• Residuals: Σα ππόινηπα είλαη νη δηαθνξέο κεηαμύ παξαηεξνύκελσλ
θαη αλακελόκελσλ ηηκώλ ηνπ θάζε θειηνύ.
4
• Counts : Παξαηεξνύκελεο
ζπρλόηεηεο (observed) είλαη νη
κεηξήζεηο ζε θάζε θειί, ελώ
αλακελόκελεο (expected) είλαη ν
αξηζκόο ησλ πεξηπηώζεσλ πνπ ζα
ήηαλ ζε θάζε θειί αλ νη κεηαβιεηέο
πνπ νξίδνπλ ηηο γξακκέο θαη ηηο
ζηήιεο ηνπ πίλαθα ζπλάθεηαο είλαη
ζηαηηζηηθά αλεμάξηεηεο.
3
5
EMPLOYMENT CATEGORY * SEX OF EMPLOYEE Crosstabulation
110 117 227
48.5% 51.5% 100.0%
42.6% 54.2% 47.9%
23.2% 24.7% 47.9%
47 89 136
34.6% 65.4% 100.0%
18.2% 41.2% 28.7%
9.9% 18.8% 28.7%
27 0 27
100.0% .0% 100.0%
10.5% .0% 5.7%
5.7% .0% 5.7%
34 7 41
82.9% 17.1% 100.0%
13.2% 3.2% 8.6%
7.2% 1.5% 8.6%
30 2 32
93.8% 6.3% 100.0%
11.6% .9% 6.8%
6.3% .4% 6.8%
4 1 5
80.0% 20.0% 100.0%
1.6% .5% 1.1%
.8% .2% 1.1%
6 0 6
100.0% .0% 100.0%
2.3% .0% 1.3%
1.3% .0% 1.3%
258 216 474
54.4% 45.6% 100.0%
100.0% 100.0% 100.0%
54.4% 45.6% 100.0%
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
Count
% within EMPLOYMENT
CATEGORY
% within SEX OF
EMPLOYEE
% of Total
CLERICAL
OFFICE TRAINEE
SECURITY OFFICER
COLLEGE TRAINEE
EXEMPT EMPLOYEE
MBA TRAINEE
TECHNICAL
EMPLOYMENT
CATEGORY
Total
MALES FEMALES
SEX OF EMPLOYEE
Total
+ =
+ =
+ =
+ =
+ =
+ =
+ =
+ =
6
• Σα κπιε ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη (αζξνίδνληαη) νξηδόληηα.
• Σα θόθθηλα θαη γαιάδηα ρξσκαηηζκέλα πνζνζηά δηαβάδνληαη
(αζξνίδνληαη) θάζεηα.
• Σα ππνγξακκηζκέλα θαη πλάγια ποζοζηά δηαβάδνληαη (αζξνίδνληαη)
θάζεηα θαη νξηδόληηα.
Σν 48,5% ησλ ηακηώλ είλαη άλδξεο θαη ην 51,5% γπλαίθεο. (άζξνηζκα 100%).
Από ηνπο άλδξεο πνπ απνιύζεθαλ, έρνπκε:
42.6% ηακίεο, 18.2% office-trainee,10.5% security-officer, 13.2% college trainee,
11.6% exempt employee, 1.6% MBA-trainee θαη 2.3 % ηερληθνί. (άζξνηζκα :100%).
Από ηο ζύνολο αςηών πος απολύθηκαν, για ηοςρ άνδπερ έσοςμε:
23.2% ηαμίερ, 9.9% office-trainee, 5.7% security-officer, 7.2% college trainee,
6.3% exempt employee, 0.8% MBA-trainee και 1.3 % ηεσνικοί.
(άθποιζμα :54,4%, πος είναι και ηο ποζοζηό ηων ανδπών).
Ο πίλαθαο δηαβάδεηαη σο εμήο :
4
Οκαδνπνηεκέλν Ραβδόγξακκα (Clustered bar chart)
7
Γξαθηθή αλαπαξάζηαζε ησλ
απνηειεζκάησλ ηνπ
πξνεγνύκελνπ πίλαθα
8
Διέγρνληαο ηα ραξαθηεξηζηηθά ηνπ γξαθήκαηνο
Αλαγξαθή ηνπ πιήζνπο ησλ
ππνθεηκέλσλ πνπ
αλαπαξηζηά θάζε ξάβδνο
Chart editorShow Data Labels
Data Value Labels, Displayed: Count
5
9
Αλ ζέινπκε ην ποζοζηό πνπ αληηζηνηρεί ζε θάζε ξάβδν,
παξάγνπκε θαηλνύξην ξαβδόγξακκα.
επηιέγνπκε
επηιέγνπκε
GraphsBar
Clustered, Summaries for group of cases
Αθνύ αλνίμνπκε ηνλ chart editor επηιέγνπκε σο label: Percent
Chart editorShow Data Labels
Data Value Labels, Displayed: Percent
6
11
πζζσξεπκέλν Ραβδόγξακκα (Stacked bar chart)
TECHNICAL
MBA TRAINEE
EXEMPT EMPLOYEE
COLLEGE TRAINEE
SECURITY OFFICER
OFFICE TRAINEE
CLERICAL
EMPLOYMENT CATEGORY
100,0%
80,0%
60,0%
40,0%
20,0%
0,0%
Perc
en
t
…
0,21%
0,42%
1,48%
…
18,78%
24,68%
1,27%
0,84%
6,33%
7,17%
5,7%
9,92%
23,21%
FEMALES
MALES
SEX OF EMPLOYEE
• Γηα θάζε κία από ηηο θαηεγνξίεο ηνπ
επαγγέικαηνο δεκηνπξγείηαη κία
ξάβδνο κε κήθνο ην 100% πνζνζηό.
• Οη δηάθνξεο ζηνίβεο κέζα ζηελ θάζε
ξάβδν αληηζηνηρνύλ ζην πνζνζηό πνπ
έρνπλ ζηε ζπγθεθξηκέλε θαηεγνξία
ηνπ επαγγέικαηνο νη θαηεγνξίεο ηνπ
θύινπ.
• Σα ζπκπεξάζκαηα πνπ κπνξνύκε λα
βγάινπκε, αθνξνύλ ηελ αλαδήηεζε
ηνπ ίδηνπ πξνθίι κέζα ζηηο 7 ξάβδνπο
(πνπ ζα ζήκαηλε αλεμαξηεζία) πνπ
εδώ δε θαίλεηαη λα ππάξρεη.
Πώο παξάγνπκε έλα
ηέηνην γξάθεκα ?
7
Γύν πνηνηηθέο ζηηο ηάμεηο κηαο 3εο πνηνηηθήο κεηαβιεηήο
Ζ δηαδηθαζία Crosstabs κπνξεί λα ρξεζηκνπνηεζεί θαη γηα
πνζνηηθέο κεηαβιεηέο, αξθεί νη ηηκέο απηώλ λα έρνπλ
θσδηθνπνηεζεί ζε δηαζηήκαηα ηηκώλ (Transform Recode ….).
To SPSS παξέρεη κε ηε βνήζεηα ηεο επηινγήο ”Layers”, ηε
δπλαηόηεηα λα νξίζνπκε κία ή πεξηζζόηεξεο πνηνηηθέο κεηαβιεηέο
ζαλ κεηαβιεηέο ειέγρνπ ησλ δεηνύκελσλ πηλάθσλ ζπλάθεηαο :
αξθεί λα ηε κεηαθηλήζνπκε ζηνλ θαηάινγν Layers.
1ε πνηνηηθή κεηαβιεηή
2ε πνηνηηθή κεηαβιεηή
3ε πνηνηηθή κεηαβιεηή (layer)
FILE OPENDATA
cats.sav
Πίλαθαο ζπλάθεηαο κε layer
LayerΟη 2 πνηνηηθέο
κεηαβιεηέο
Ζ ζηαηηζηηθή αλάιπζε ησλ δύν κεηαβιεηώλ γίλεηαη γηα θάζε
ζηξώκα (θαηεγνξία) ηεο κεηαβιεηήο ειέγρνπ (Layer).
8
Σν κόλν ζπκπέξαζκα αθνξά ηε ζύγθξηζε ηνπ
κήθνπο ησλ ξάβδσλ κέζα ζηελ θάζε νκάδα.
Γηα θάζε θατεγορία τες layer ποηοτηθής κεταβιετής σχεκατίδεταη έλα clustered γράυεκα
Ραβδνγξάκκαηα ηεο Crosstabs κε layers
16
Πώο ηα
παξάγνπκε
9
Γηπιό αξηζηεξό θιίθ ζην γξάθεκα γηα λα αλνίμεη ν chart editor. Edit Properties Variables ηελ θαξηέια Variables: Αιιάδσ ηα ραξαθηεξηζηηθά x-Axis θαη x-Cluster
ζηηο δύν κεηαβιεηέο.
18
10
Γηαδηθαζία Means (αλάιπζε κέζσλ ηηκώλ)
Analyze Compare Means Means
19
Αλνίγνπκε πάιη ην salary.savΜέζεο ηηκέο ηεο πνζνηηθήο salbeg ζηηο
θαηεγνξίεο ηεο πνηνηηθήο sex αιιά &
jobcat
Δπ
ηπιέν
λ ζ
ηαηηζ
ηηθά
20
Απνηειέζκαηα ηεο δηαδηθαζίαο Means
Μνλαδηθό layer :
employment category
Γύν layers: employment
category & sex
11
21
Graphs Bar Charts Simple
Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ
ηεο δηαδηθαζίαο MEANS (έλα Layer)
Graphs Bar Charts Clustered
22
Σξόπνη γξαθηθήο αλαπαξάζηαζεο ησλ απνηειεζκάησλ
ηεο δηαδηθαζίαο MEANS (δύν Layers)
12
Έιεγρνο ππνζέζεσλ: ε ζηαηηζηηθή
δηαδηθαζία εμαγσγήο ζπκπεξαζκάησλ γηα
ηνλ πιεζπζκό ειέγρνληαο ην δείγκα
Υ2 –test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ
κεηαβιεηώλ
ΣΟ ΣΔΣ ΑΤΣO ΔΛΔΓΥΔΗ ΣΖΝ ΤΠΑΡΞΖ
ΥΔΖ ΜΔΣΑΞΤ ΓΤΟ ΠΟΗΟΣΗΚΩΝ
ΜΔΣΑΒΛΖΣΩΝ.
Βαζηθά ζηνηρεία ηεο
ζεσξίαο ειέγρνπ
ππνζέζεσλ
Αλ νη πξαγκαηηθέο ηηκέο ησλ παξακέηξσλ
ηνπ πιεζπζκνύ ηθαλνπνηνύλ ηηο ππνζέζεηο
κε βάζε ηα δεδνκέλα ηνπ δείγκαηνο ,
κπνξνύκε λα πξνρσξήζνπκε ζηε
δηαδηθαζία ιήςεο απνθάζεσλ
Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ
Τε κεδεληθή ππόζεζε Η0 κε ζθνπό λα δηαςεπζηεί
Τελ ελαιιαθηηθή ππόζεζε Η1.
Οξίδνπκε εθ ησλ
πξνηέξσλ 2 ππνζέζεηο
Παξαηεξήζεηο Η κεδεληθή ππόζεζε Η0 δηαηππώλεηαη κε ζθνπό λα ακθηζβεηεζεί. Σπλήζσο, ην αληίζεην ηνπ ζπκπεξάζκαηνο ζην νπνίν επηζπκεί λα θζάζεη ν εξεπλεηήο γίλεηαη κεδεληθή ππόζεζε.
Με ην ζηαηηζηηθό έιεγρν είηε απνξξίπηνπκε ηελ Η0 ή εάλ δελ απνξξηθζεί ΣΟΝΗΕΟΤΜΔ όηη ηα δεδνκέλα ζηα νπνία ζηεξίδεηαη ν ζηαηηζηηθόο έιεγρνο δελ επαξθνύλ γηα ηελ απόξξηςε ηεο αξρηθήο ππόζεζεο.
Εάλ απνξξίςνπκε ηελ Η0, ηα δεδνκέλα δελ επαιεζεύνπλ ηελ αξρηθή ππόζεζε θαη είλαη ζπκβαηά κε ηελ ελαιιαθηηθή ππόζεζε Η1.
13
25
Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ
Οη ππνζέζεηο Η0, Η1 δηαηππώλνληαη κε ηε βνήζεηα ησλ ζηαηηζηηθώλ
παξακέηξσλ ηνπ κνληέινπ πνπ πηνζεηείηαη γηα ηελ αλάιπζε ησλ δεδνκέλσλ.
Ζ0 : ζ = ζ0
Ζ1: ζ ≠ ζ0 (ακθίπιεπξνο ζηαηηζηηθόο έιεγρνο) ή ζ > ζ0 (ζ < ζ0) (κνλόπιεπξνο
ζηαηηζηηθόο έιεγρνο)
Οξίδεηαη ε ζηαηηζηηθή ζπλάξηεζε ηνπ ειέγρνπ από ην δείγκα.
θάικα ηύπνπ Ι (type I error) : ε απόξξηςε ηεο κεδεληθήο ππόζεζεο Η0,
ελώ είλαη ζσζηή = a = P(απόξξηςε ηεο Η0 / ε Η0 είλαη αιεζήο)
θάικα ηύπνπ ΙI (type II error) : ε απνδνρή ηεο κεδεληθήο ππόζεζεο Η0,
ελώ είλαη ιάζνο = β = P(απνδνρή ηεο Η0 / ε Η0 είλαη ςεπδήο)
πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ0
πόζν ιάζνο θάλσ αλ απνξξίςσ ηελ Ζ1
26
στατιστικός (συμπέρασμα)
φύση(πραγματικότη
τα)
ΑΠΟΔΟΧΗ της Η0
ΑΠΟΡΡΙΨΗ της Η0
Αληθεύειη Η0
p=1-aσφάλμα τύπου Ι
Αληθεύει η Η1
σφάλμα τύπου ΙΙ
p=1-β = γ
Όηαλ ε Η0 αιεζεύεη θαη ν ζηαηηζηηθόο απνδερζεί ηελ Η0 δε γίλεηαη
ζθάικα, ελώ αλ ν ζηαηηζηηθόο απνξξίςεη ηελ Η0 ηόηε γίλεηαη ζθάικα
ηύπνπ Ι. Όηαλ αιεζεύεη ε ελαιιαθηηθή ππόζεζε Η1 θαη ν ζηαηηζηηθόο
απνδερζεί ηελ Η0 γίλεηαη ζθάικα ηύπνπ ΙΙ, ελώ αλ απνξξίςεη ηελ Η0 δε
γίλεηαη ζθάικα.
Τα δύν ζθάικαηα είλαη ηπραία ελδερόκελα.
Η πηζαλόηεηα a ηνπ ζθάικαηνο ηύπνπ Ι νλνκάδεηαη επίπεδν
ζεκαληηθόηεηαο ηνπ ζηαηηζηηθνύ ειέγρνπ.
Σηνηρεία ζεσξίαο ειέγρνπ ππνζέζεσλ
α, β όζν ην
δπλαηό
κηθξόηεξα
14
27
ΠΡΟΫΠΟΘΔΔΗ γηα ηελ εθαξκνγή ηνπ ειέγρνπ:
1) Θij >= 5 Γειαδή νη αλακελόκελεο (expected)
παξαηεξήζεηο ζε θάζε θειί ηνπ πίλαθα ζπλάθεηαο
λα είλαη ηνπιάρηζηνλ 5 ή ην πνιύ 20% ησλ ζij <= 5.
2) Σν θάζε άηνκν λα εκθαλίδεηαη κόλν κηα θνξά ζε
θάζε θειί , δειαδή λα κελ ππάξρεη επηθάιπςε ζηηο
θαηεγνξίεο.
Υ2 –test αλεμαξηεζίαο: ζρέζε 2 πνηνηηθώλ
κεηαβιεηώλ
Ζ0 : Σα δύν ραξαθηεξηζηηθά είλαη αλεμάξηεηα
Ζ1 : Σα δύν ραξαθηεξηζηηθά είλαη εμαξηεκέλα
Αλνίμηε ην αξρείν Gss
Analyze Descriptives Statistics Crosstabs
Υ2 –test αλεμαξηεζίαο (από crosstabs)
15
RS Highest Degree * Is life exciting or dull Crosstabulation
24 96 66 186
12,0 85,8 88,2 186,0
35 251 231 517
33,3 238,5 245,3 517,0
2 33 27 62
4,0 28,6 29,4 62,0
2 58 97 157
10,1 72,4 74,5 157,0
1 21 51 73
4,7 33,7 34,6 73,0
64 459 472 995
64,0 459,0 472,0 995,0
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Count
Expected Count
Less than HS
High school
Junior college
Bachelor
Graduate
RS Highest
Degree
Total
Dull Routine Exciting
Is life exc iting or dull
Total
Chi-Square Tests
53,962a 8 ,000
55,874 8 ,000
47,633 1 ,000
995
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Assoc iation
N of Valid Cases
Value df
Asy mp. Sig.
(2-sided)
2 cells (13,3%) have expected count less than 5. The
minimum expected count is 3,99.
a.
Διέγρνπκε ηηο
πξνϋπνζέζεηο γηα ην ρ2
ηεζη.
ε 2 θειηά έρνπκε:
Θij<5. Σν ζπλνιηθό
πνζνζηό ηνπο είλαη
κηθξόηεξν ηνπ 20% θαη
άξα ηθαλνπνηνύληαη νη
πξνϋπνζέζεηο γηα ην ρ2
ηεζη.
Sig<0.05 =>
Απνξξίπηεηαη ε Ζo
Γειαδή δελ είλαη
αλεμάξηεηεο νη κεηαβιεηέο.
Υ2 –test αλεμαξηεζίαο (από crosstabs)
30
Γνθηκάζηε ηώξα κόλνη ζαο :
ΑΚΖΖ 3
users.auth.gr/askourke