Upload
buidiep
View
219
Download
4
Embed Size (px)
Citation preview
------------------------------------------------------------------------------------------------------------------------------------- Kod: _____________ Kurs:______________________________________
KOD:
Försättsblad
Kurskod: PC2309
Kursnamn: Metod 1 i psykologi
Provmoment: Regressions- och variansanalys
Ansvarig lärare: Ulf Dahlstrand
Tentamensdatum: 2014-11-03
Tid: 08.00-12.00
Lokal: Folkets hus
Tillåtna hjälpmedel: Kalkylator. Student som ej har svenska som modersmål får använda
ordbok för översättning mellan svenska och annat språk.
Maxpoäng: 34
Gräns för godkänt: 20
Gräns för väl godkänt: 27
***************************************************************************
OBS! Vi har nya rutiner.
Detta är en anonym tenta. Skriv ditt namn och personnummer på avsedd plats nedan. Detta
försättsblad kommer att tas bort före rättning. Koden ersätter dina personuppgifter på
tentamen. Kontrollera att din tentamen är komplett och att samma kodnummer står på
tentamen som på detta försättsblad. Notera koden även på din talong nedan.
Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.
Tentamensresultaten anslås med hjälp av kodnummer.
Studentens namn:_______________________________________________
Studentens personnummer:________________________________________
Kom ihåg att notera din kod på talongen nedan, riv av och ta med den innan du lämnar
in tentamen. Om du slarvar bort eller glömmer koden så kan vi inte ge ut den, utan du
måste vänta tills betyget är inlagt i Ladok.
Psykologiska institutionen
Göteborgs universitet
Kurs: Metod 1 i psykologi
Datum: 2014-11-03
Tid: 08.00-12.00
Lokal: Folkets hus
Ulf Dahlstrand
Tentamen
i
Regressions- och variansanalys
Maxpoäng: 34
Gräns för godkänt: 20
Gräns för väl godkänt: 27
1. (3p)
Förklara innebörden i följande begrepp i samband med en regressionsanalys:
a) Regressionskoefficient (b)
b) Residual (e)
c) Regressionskoefficientens standardfel (Sb)
2. (7p)
I en enkätstudie summerade man antalet miljövänliga val respondenterna gjorde med
avseende på 16 olika hushållsprodukter. Denna summavariabel användes sedan som en
beroendevariabel i en multipel regressionsanalys. Oberoende variabler i analysen var ”age”
(ålder), ”oroande” (Vår tids miljöproblem är oroande, skala Inte alls 1—9 I mycket hög
grad), ”betydelse miljö” (Vad betyder miljö och natur för dig jämfört med andra saker eller
värden i livet, skala Ingenting 1—9 Oerhört mycket) och ”allmän inställning hushålls” (Vilken
är din allmänna inställning till miljövänligt framställda hushållsprodukter? Skala Mycket
negativ 1—9 Mycket positiv).
a) I tabellen ”Model summary” nedan finns värdet R-square. Vad anger det?
b) Vad kan man utläsa ur Anova-tabellen som finns nedanför Model Summary?
c) Ange hur regressionsekvationen ( 44332211' XbXbXbXbaY ) ser ut med en
regressionskoefficient specificerad för varje oberoende variabel. Inkludera också
interceptet (konstanten).
d) Vilka regressionskoefficienter är signifikanta?
e) Hur kan man tolka i ord regressionskoefficienten för variabeln ”allmän inställning
hushålls”?
f) Vad anger värdena i kolumnen ”Tolerance” som också finns i koefficienttabellen
på nästa sida?
Regression
Variables Entered/Removeda
Model Variables
Entered
Variables
Removed
Method
1
age, allmän
inställning
hushålls,
oroande ,
betydelse miljöb
. Enter
a. Dependent Variable: antalmhh
b. All requested variables entered.
Model Summary
Model R R Square Adjusted R
Square
Std. Error of the
Estimate
1 ,304a ,092 ,075 3,36136
a. Predictors: (Constant), age, allmän inställning hushålls, oroande ,
betydelse miljö
ANOVAa
Model Sum of Squares df Mean Square F Sig.
1
Regression 237,296 4 59,324 5,250 ,000b
Residual 2338,837 207 11,299
Total 2576,132 211
Fortsättning på nästa sida
Fortsättning på uppgift 2.
g) Man gjorde ytterligare en analys med samma beroendevariabel och samma
oberoende variabler som ovan, men man lade till en Normvariabel och erhöll då en
R-kvadrat på 0,118, dvs en ökning i R-kvadrat med 0,026. Är det en signifikant
ökning? Antalet deltagare i analysen var 212.
3. (3 p)
Vad är dummykodning och när kan det vara lämpligt att använda dummykodning i en
regressionsanalys?
4. (3p)
I regressionsanalys finns det ett villkor om normalfördelning som bör vara uppfyllt om
analysen skall vara giltig, vad är det som skall vara normalfördelat enligt detta villkor? Och
hur kan man kontrollera att villkoret är uppfyllt?
5. (4p)
Nedan finns en fyrfältstabell där varje cell beskriver ett förhållande mellan ”verklighet” och
beslut som man fattar i samband med hypotesprövning (signifikanstestning). Förklara och
beskriv innebörden i varje cell.
6. (3p)
Varför kan man inte använda vanlig regressionsanalys om man har en binär beroendevariabel
(t.ex. ”ja” och ”nej” svar)? Vilken typ av regressionsanalys skulle kunna vara ett alternativ
med en sådan beroendevariabel?
7. (3p)
Vad betyder det att en variabel har en medierande effekt respektive en modererande effekt
med avseende på sambandet mellan en X-variabel och en Y-variabel?
8. (5 p)
På ett företag genomfördes en omorganisation som berörde 10 individer. Dessa individer fick
på en 7-gradig skala (ju högre värde, desto bättre) ange hur stor deras arbetstillfredsställelse
var vid tre olika tillfällen: a) strax före omorganisationen, b) strax efter omorganisationen
samt c) 6 månader efter omorganisation (uppföljning). En envägs variansanalys med upprepad
mätning gjordes på de 10 individernas data och resultatet finns nedan. Tolka utförligt
resultatet och beskriv vilka slutsatser som du drar.
General Linear Model
Within-Subjects Factors
Measure: MEASURE_1
Tillfälle Dependent
Variable
1 Före
2 Efter
3 Uppföljning
Descriptive Statistics
Mean Std. Deviation N
Före 5,0000 ,94281 10
Efter 6,0000 1,33333 10
Uppföljning 4,0000 ,66667 10
Mauchly's Test of Sphericitya
Measure: MEASURE_1
Within Subjects Effect Mauchly's W Approx. Chi-
Square
df Sig. Epsilonb
Greenhouse-
Geisser
Huynh-Feldt Lower-bound
Tillfälle ,750 2,301 2 ,316 ,800 ,946 ,500
Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity
matrix.
a. Design: Intercept
Within Subjects Design: Tillfälle
b. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-
Subjects Effects table.
Fortsättning på uppgift 8.
Tests of Within-Subjects Effects
Measure: MEASURE_1
Source Type III Sum of
Squares
df Mean Square F Sig.
Tillfälle
Sphericity Assumed 20,000 2 10,000 33,750 ,000
Greenhouse-Geisser 20,000 1,600 12,500 33,750 ,000
Huynh-Feldt 20,000 1,892 10,571 33,750 ,000
Lower-bound 20,000 1,000 20,000 33,750 ,000
Error(Tillfälle)
Sphericity Assumed 5,333 18 ,296
Greenhouse-Geisser 5,333 14,400 ,370
Huynh-Feldt 5,333 17,027 ,313
Lower-bound 5,333 9,000 ,593
Tests of Within-Subjects Contrasts
Measure: MEASURE_1
Source Tillfälle Type III Sum of
Squares
df Mean Square F Sig.
Tillfälle Level 1 vs. Later 5,684E-014 1 5,684E-014 ,000 1,000
Level 2 vs. Level 3 40,000 1 40,000 45,000 ,000
Error(Tillfälle) Level 1 vs. Later 2,000 9 ,222
Level 2 vs. Level 3 8,000 9 ,889
Tillfällea
Measure: MEASURE_1
Dependent Variable Tillfälle
Level 1 vs.
Later
Level 2 vs.
Level 3
Före 1,000 ,000
Efter -,500 1,000
Uppföljning -,500 -1,000
a. The contrasts for the within subjects factors are:
Tillfälle: Helmert contrast
9) (3 p)
Beskriv en studie där du skulle använda dig av en tvåvägs variansanalys med upprepad
mätning på en faktor.
PC2309
HT 2014
Ulf Dahlstrand
Formelsamling
Varians
1
2
2
N
XXsx N = stickprovsstorlek
Kovarians
1
N
YYXXsxy
Korrelation
22
YYXX
YYXXrxy
Enkel linjär regression
Population XY
Stickprov ebXaY
Regressionskoefficient 2XX
YYXXb
Intercept XbYa
(konstant)
Predicerade Y-värden bXaY
Enkel och multipel regression
Fel YYe
Residualkvadratsumma 22 YYe
(residual sum of squares)
Regressionskvadratsumma 2YY
(regression sum of squares)
SStot = SSreg + SSres 2
YY 2YY + 2YY
Determinationskoefficient
eller förklarad variation tot
reg
xySS
SSr 2
; tot
reg
yySS
SSr
2;
tot
reg
SS
SSR 2
Justerat 2R
1
111ˆ 22
kN
NRR
Residualvarians
1
2
2
...12.
kN
YYMSRs ky
(Mean square residual;
Variance of estimate) k = antal oberoende variabler (X)
Residualstandardavvikelse
1
2
...12.
kN
YYs ky
Signifikanstestning av regressionskoefficent (enkel regression)
Regressionskoefficientens standardfel
2...12.
XX
ss
ky
b
(Standard error of b)
t-testning; bs
bt
frihetsgrader; df = (N-k-1)
Konfidensintervall bkrit stb
Multipel regressionsanalys med två oberoende variabler
Stickprov eXbXbaY 2211
(Partiella) regressionskoefficienter
1
2
12
1221
11 s
s
r
rrrb
yyy
2
2
12
1212
21 s
s
r
rrrb
yyy
Intercept 22110 XbXbYba
(konstant)
Standardfel för 1b
2
12
2
1
___
1
12.
1
1
rXX
ss
y
b
Standardfel för 2b
2
12
2___
22
12.
1
2
rXX
ss
y
b
Signifikanstestning
1
1
1
b
bs
bt
2
2
2
b
bs
bt
Frihetsgrader df = (N-k-1)
Signifikanstestning av hela modellen
resres
regreg
dfSS
dfSS
kNR
kRF
/
/
1/1
/2
2
Frihetsgrader df = (k, (N-k-1)
Signifikanstestning av skillnad i R-kvadrat mellan två modeller
1/1
)/()(
2
min2min
2
störrestörre
drestörredrestörre
kNR
kkRRF
Med ”större” avses en modell som innehåller fler oberoende variabler än en ”mindre” modell.
Frihetsgrader 1,min störredrestörre kNkkdf
Partialkorrelation
2
12
2
2
1221
2.1
111
rr
rrrrr
y
yy
yeey
2
2.
2
2.
2
12.2
2.11 y
yy
yR
RRr
Semipartialkorrelation
2
12
1221
2.1
11
r
rrrrr
yy
yye
2
2.
2
12.
2
2.1 yyy RRr
2
)2.1(
2
2
2
)1.2(
2
1
2
12. yyyyy rrrrR
Mått för att upptäcka outliers och observationer med stort inflytande (diagnostik)
Standardiserad residual ky
i
s
eZRESID
..12.
Studentized residual
ie
i
s
eSRESID
2
2
...12.
11
XX
XX
Nss i
kyei
Leverage (hävstångsvärde)
22)(1
XX
XX
Nh i
i
Cooks avstånd
i
ii
ih
h
k
SRESIDD
11
2
Skillnad i b-värde då )(ibbDFBETA
en viss individ är med eller inte
Konfidensintervall kring predicerade värden: En prediktor (enkel regression)
Standardfel för genomsnittligt
predicerat värde
2
2
2
.
1
XX
XX
Nss i
xy
Prediktionsintervall: Medelvärde stY
Standardfel för individuellt
predicerat värde
2
2
2
.
11
XX
XX
Nss i
xyy
Prediktionsintervall: Individuellt värde ystY
Binär logistisk regressionsanalys
Naturliga logaritmen
Basen i den naturliga logaritmen är e som är ungefär 2,718
e0 = 1 e
-1 =
1
1
e
Exponentialfunktion: y = ex ln(y) = X
Logittransformation av beroendevariabel
Binär (dikotom) beroendevariabel som kan ha värdena:
1 som är en kategori för en händelse, eller ja
och
0 som är detsamma som ”ej händelse” eller nej
P = sannolikhet för 1
1 – P är sannolikhet för 0
Oddset för ”ja” kan beskrivas som en sannolikhetskvot: P
P
1
Enkel binär logistisk regression kan skrivas som
P
P
1= e
a + bx
logit(P) = ln
P
P
1= a + bx
P = 1
1+e−(a+bx) =
1
1+1
𝑒𝑎+𝑏𝑥
Variansanalys
Envägs variansanalys för oberoende mätningar
Variationskälla SS df MS F
------------------------------------------------------------------------------------------------------------------
Mellan grupper 𝑛 ∑(�̅�.𝑗 − �̅�..)2 J - 1
B
B
df
SS
W
B
MS
MS
Inom grupper ∑ ∑(𝑋𝑖𝑗 − �̅�.𝑗)2 N - J
W
W
df
SS
-----------------------------------------------------------------------------------------------------------------
Total ∑ ∑(𝑋𝑖𝑗 − �̅�..)2 N - 1
N = n*J
Grupper/Nivåer
1 2 - j - J
1 11
x 12
x - j
x1
- J
x1
2 21
x 22
x - j
x2
- J
x2
. . . . . . .
i 1i
x 1i
x - ij
x - iJ
x
n 1n
x 2n
x - nj
x - nJ
x
------------------------------------------------------------------------------------
1.x 2.x - jx . - Jx . ..x = totalmedelvärde
Eta-kvadrat T
B
SS
SS2
Envägs variansanalys för beroende mätningar (upprepad mätning)
Variationskälla SS df MS F
-------------------------------------------------------------------------------------------------------------------
Mellan individer (A) 𝐽 ∑(�̅�𝑖. − �̅�..)2 n – 1
Mellan tillfällen (B) 𝑛 ∑(�̅�.𝑗 − �̅�..)2 J - 1
B
B
df
SS
AB
B
MS
MS
Residual (AB) ∑ ∑(𝑋𝑖𝑗 − �̅�𝑖. − �̅�.𝑗 + �̅�..)2 (n – 1)(J-1)
AB
AB
df
SS
-----------------------------------------------------------------------------------------------------------------
Total ∑ ∑(𝑋𝑖𝑗 − �̅�..)2 N - 1
Eta-kvadrat T
B
SS
SS2
Tillfällen
1 2 - j - J
1 11
x 12
x - j
x1
- J
x1
.1x
2 21
x 22
x - j
x2
- J
x2
.2x
. . . . . . . .
i 1i
x 1i
x - ij
x - iJ
x .ix
n 1n
x 2n
x - nj
x - nJ
x .nx
---------------------------------------------------------------------------------------
1.x 2.x - jx . - Jx . ..x = totalmedelvärde
Tvåvägs variansanalys för oberoende mätningar (Between subjects design)
Variationskälla SS df MS F
--------------------------------------------------------------------------------------------------------------------
Faktor A 2..... xxnJ i I – 1
A
A
df
SS
W
A
MS
MS
Faktor B 2..... xxnI j J – 1
B
B
df
SS
W
B
MS
MS
Interaktion A*B 2
........ xxxxn jiij (I-1)(J-1) AB
AB
df
SS
W
AB
MS
MS
Inomcells (W) 2. ijijk xx IJ(n-1) w
w
df
SS
-------------------------------------------------------------------------------------------------------------------
Total 2... xxijk N - 1
Eta-kvadrat för faktor A T
AA
SS
SS2
Eta-kvadrat för faktor B T
BB
SS
SS2
Eta-kvadrat för interaktion AB T
ABAB
SS
SS2
Xijk = Xrad kolumn individ
Faktor B (j)
j= 1 j = 2 j = 3
-----------------------------------------------------
! X111 ! X121 ! X131 !
i = 1 ! X112 �̅�11. ! X122 �̅�12. ! X132 �̅�13. ! �̅�1..
! X113 ! X123 ! X133 !
Faktor A (i) !-----------------!----------------!----------------!
! X211 ! X221 ! X231 !
i = 2 ! X212 �̅�21. ! X222 �̅�22. ! X232 �̅�23. ! �̅�2..
! X213 ! X223 ! X233 !
-----------------------------------------------------
�̅�.1. �̅�.2. �̅�.3. �̅�…
Tvåvägs variansanalys för beroende mätningar (Mixed design: upprepad mätning på en faktor)
Variationskälla SS df MS F
-----------------------------------------------------------------------------------------------------------------
Mellan individer
Faktor A 2..... xxnJ i I – 1
A
A
df
SS
iInd
A
MS
MS
Error 2... iki xxJ I(n-1)
iInd
iInd
df
SS
Inom individer
Faktor B (tillfällen) 2..... xxnI j J – 1
B
B
df
SS
iIndB
B
MS
MS
/
Interaktion AB 2........ xxxxn jiij (I-1)(J-1) AB
AB
df
SS
iIndB
AB
MS
MS
/
Error 2.... iijkiijk xxxx I(n-1)(J-1)
iIndB
iIndB
df
SS
/
/
(Interaktion mellan tillfälle och individ inom grupp i (B/Ind(i)) )
----------------------------------------------------------------------------------------------------------------
Total 2... xxijk nIJ - 1
Eta-kvadrat för faktor A T
AA
SS
SS2
Eta-kvadrat för faktor B T
BB
SS
SS2
Eta-kvadrat för interaktion AB T
ABAB
SS
SS2
Xijk = Xrad kolumn individ
Faktor B (j) ”tillfälle”
j= 1 j = 2 j = 3
-----------------------------------------------------
! X111 ! X121 ! X131 !�̅�1.1
i = 1 ! X112 �̅�11. ! X122 �̅�12. ! X132 �̅�13. !�̅�1.2 �̅�1..
! X113 ! X123 ! X133 !�̅�1.3
Faktor A (i) !-----------------!----------------!----------------!
! X211 ! X221 ! X231 !�̅�2.1
i = 2 ! X212 �̅�21. ! X222 �̅�22. ! X232 �̅�23. !�̅�2.2 �̅�2..
! X213 ! X223 ! X233 !�̅�2.3
-----------------------------------------------------
�̅�.1. �̅�.2. �̅�.3. �̅�…