26
일반선형 모형(GLM) - 1/26 Copyright 2001 StatEdu Consulting GLM 개념 잔차의 정규성, 등분산성 인자의 영향력 사후검정 교호작용

개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 1/26Copyright ⓒ 2001 StatEdu Consulting

GLM

개념

잔차의 정규성, 등분산성

인자의 영향력

사후검정

교호작용

Page 2: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 2/26Copyright ⓒ 2001 StatEdu Consulting

인자(독립변수)가 1개 이상인 경우의 평균의 차이를 비교하는 분석- 자동차의 종류에 따라 연비는 차이가 있는가?

- 20, 30, 40대의 연령에 따라 삶의 만족도는 차이가 있는가?

- 성별과 학력에 따라 스트레스의 정도는 차이가 있는가?

일원배치 분산분석은 GLM의 일종

일원배치 분산분석의 형태의 자료를 GLM으로 분석해도 동일한 결과를 얻을 수 있다.

독립 변수(인자)의 수가 1개 이상일 때 평균비교

기본 가정 : Data : 정규성, 등분산성 → 실제적으로 확인이 어렵다

잔 차 : 정규성, 등분산성 → 모형의 적합성을 판별할 수 있다.

가설 : H0 : 독립변수에 따라 종속변수는 같다 - 독립변수의 수만큼

H1 : 독립변수에 따라 종속변수는 다르다 가설이 존재한다

종속변수(특성값) : 등비

독립변수(인 자) : 명목 or 서열

GLM(General Linear Model)

Page 3: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 3/26Copyright ⓒ 2001 StatEdu Consulting

분산 분석표(독립변수가 2개인 경우)

n-1SST계 (T)

MSRA /MSE

MSRB /MSE

MSRAxB/MSE

MSRA

MSRB

MSRAxB

MSE

l -1

m-1

(l-1)(m-1)

lm(r-1)

SSRA

SSRB

SSRAxB

SSE

인자(A)

인자(B)

교호작용(AxB)

오차(E)

F평균 제곱 (MS)자유도(d.f)제곱 합 (SS)

n : Data의 총수

l,m : 독립변수(인자)의 수준

r : 반복수SSTSSR 영향력 A의 인자 A=

SSTSSR 영향력 의B 인자 B=

SSTSSR 효과 교호작용의 AxB=

Page 4: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 4/26Copyright ⓒ 2001 StatEdu Consulting

Yes

Yes

No

1 개 2개 이상인자의 수

Yes

등분산성

정규성 반복

One-Way ANOVA

No

No

GLM(교호작용)

Kruskal-Wallis GLM

Page 5: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 5/26Copyright ⓒ 2001 StatEdu Consulting

20, 30, 40, 50, 60대의 삶의 만족도에 조사한 자료이다. 연령에 따라 삶의 만

족도는 차이가 있는가? 차이가 있다면 어떠한 차이가 있는가?

16.7

16.9

16.5

17.5

15.1

15.9

17.8

17.3

18.1

17.2

17.0

17.1

18.3

19.2

18.3

18.8

19.8

18.3

A5A4A3A2A1

만족도 연령

종속변수 : 삶의 만족도 : 등비

독립변수 : 연령 : 서열(수준 5)

분석 방법 : GLM

Page 6: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 6/26Copyright ⓒ 2001 StatEdu Consulting

일변량 일반선형모형 (Univariate GLM)

분석 → 일반선형모형 → 일변량

H0 : (연령에 따라 삶의 만족도는 같다)521

H1 : 적어도 하나는 다르다 (연령에 따라 삶의 만족도는 다르다)

µµµ === L

종속변수 : 삶의 만족도

Tukey, Duncan, Scheffe

잔차 저장 모형의적합성 검정

기술통계량, 등분산성,잔차의 등분산 그래프

만족도

연령

독립변수 : 연령

Page 7: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 7/26Copyright ⓒ 2001 StatEdu Consulting

일변량 일반선형모형 (GLM) 저장 (잔차의 정규성 검정)

정규성 검정

.945 18 .398만족도의 표준화 잔차통계량 자유도 유의확률

Shapiro-Wilk

Lilliefors 유의확률 수정a.

부메뉴 저장

정규성검정

모형의 적합도 검정

만족도 연령

만족도

연령

결과잔차 저장

Page 8: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 8/26Copyright ⓒ 2001 StatEdu Consulting

일변량 일반선형모형 (GLM) 옵션 (잔차의 등분산 검정)

기술통계량

종속변수: 삶의 만족도

18.800 .707 4

18.200 1.054 3

17.400 .483 4

16.267 1.387 3

16.900 .432 4

17.544 1.165 18

연령1

2

3

4

5

합계

평균 표준편차 N

표준화된 잔차

예측값

오차 분산의 동일성에 대한 Levene의 검정

종속변수: 삶의 만족도

1.735 4 13 .202F 자유도1 자유도2 유의확률

만족도

연령

연령

모형의 적합도 검정

Page 9: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 9/26Copyright ⓒ 2001 StatEdu Consulting

일변량 일반선형모형 (GLM) 결과 해석 1

오차 분산의 동일성에 대한 Levene의 검정

종속변수: 삶의 만족도

1.735 4 13 .202F 자유도1 자유도2 유의확률

표준화된 잔차

예측값

Data의 정규성과 등분산성분산분석의 기본전제조건

정 규 성 : Data의 수가 5개 이상일 때만검정 가능

등분산성 : P > 0.05 → H0 등분산성 만족

분산분석을 할 수 있다.

정규성 검정

.945 18 .398삶의 만족도 표준화 잔차통계량 자유도 유의확률

Shapiro-Wilk

Lilliefors 유의확률 수정a.

잔차의 정규성과 등분산성분산분석 결과 모형의 적합도 검정

정 규 성 : P > 0.05 H0 정규성 만족

등분산성 : 그래프에 어떠한 규칙이나 추세, 경향,

주기가 없다. 등분산성 만족

분산분석 모형이 적합하다

Page 10: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 10/26Copyright ⓒ 2001 StatEdu Consulting

일변량 일반선형모형 (GLM) 결과 해석 2

개체-간 효과 검정

종속변수: 삶의 만족도

14.238 a 4 3.559 5.242 .010

5412.650 1 5412.650 7971.804 .000

14.238 4 3.559 5.242 .010

8.827 13 .679

5563.600 18

23.064 17

소스수정 모형

Intercept

연령

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .617 (수정된 R 제곱 = .500)a.

① 다음 절에서 설명

② P=0.01 < 0.05 H1

연령에 따라 삶의 만족도는

차이가 있다.

③ 설명률(결정계수)

연령으로 삶의 만족도를

설명할 수 있는 비율

기술통계량

종속변수: 삶의 만족도

18.800 .707 4

18.200 1.054 3

17.400 .483 4

16.267 1.387 3

16.900 .432 4

17.544 1.165 18

연령1

2

3

4

5

합계

평균 표준편차 N

Tukey HSDa,b,c

3 16.267

4 16.900 16.900

4 17.400 17.400

3 18.200 18.200

4 18.800

.053 .058

연령4

5

3

2

1

유의확률

N 1 2

집단군

④ 평균, 표준편차로 정리

⑤ 1 > 45,3,2 삶의 만족도 ⑤

Page 11: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 11/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 순서 정리 1

1

43

2

만족도

연령

연령

연령 연령

1. GLM - 잔차 분석

2. 잔차 저장

잔차의 정규성

3. 잔차의 등분산 그래프

기술 통계량(평균, 표준편차)

4. 사후 분석(다중비교)

분석 → 일반선형모형 → 일변량

Page 12: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 12/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 순서 정리 2

정규성 검정

.945 18 .398삶의 만족도 표준화 잔차통계량 자유도 유의확률

Shapiro-Wilk

Lilliefors 유의확률 수정a.

예측값

56

기술통계량

종속변수: 삶의 만족도

18.800 .707 4

18.200 1.054 3

17.400 .483 4

16.267 1.387 3

16.900 .432 4

17.544 1.165 18

첨가물1

2

3

4

5

합계

평균 표준편차 N

종속변수: 삶의 만족도

14.238 a 4 3.559 5.242 .010

5412.650 1 5412.650 7971.804 .000

14.238 4 3.559 5.242 .010

8.827 13 .679

5563.600 18

23.064 17

소스수정 모형

Intercept

연령

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .617 (수정된 R 제곱 = .500)a.

7

8

P< 0.05

H1

5. 잔차의 등분산 결과

6. 잔차의 정규성 결과

7. 독립변수 수준의 평균

8. GLM 결과 – P 값

9. 사후분석 결과

표준화된 잔차

개체-간 효과 검정

71. 18.800 ± 0.707

2. 18.200 ± 1.054

3. 17.400 ± 0.483

4. 16.267 ± 1.387

5. 16.900 ± 0.432

삶의 만족도Tukey HSDa,b,c

3 16.267

4 16.900 16.900

4 17.400 17.400

3 18.200 18.200

4 18.800

.053 .058

연령4

5

3

2

1

유의확률

N 1 2

집단군

9

9

1 > 4

2,3,5

Page 13: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 13/26Copyright ⓒ 2001 StatEdu Consulting

10. 정리GLM 분석 순서 정리 3 결 과 정 리

연령에 따라 삶의 만족도는 차이가 있다.

사후검정 결과 20대의 삶의 만족도(18.8)가 50대의 삶의 만족도(16.3)보다 더

높다.

20대. 18.800 ± 0.707

30대. 18.200 ± 1.054

40대. 17.400 ± 0.48350대. 16.267 ± 1.38760대. 16.900 ± 0.432

P < 0.05 → H1 1 > 4 설명력 : 50.0 %2,3,5

종속(등비) 독립(명목, 서열)이고 잔차의 정규성, 등분산성 만족

⇒ GLM

잔차의 정규성, 등분산성 만족 → GLM 모형이 적합하다

종속변수 : 삶의 만족도 : 등비

독립변수 : 연령 : 서열(수준 5)

20, 30, 40, 50, 60대의 삶의 만족도에 조사한 자료이다. 연령에 따라 삶의 만족

도는 차이가 있는가? 차이가 있다면 어떠한 차이가 있는가?

Page 14: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 14/26Copyright ⓒ 2001 StatEdu Consulting

코우크스(Cokes)의 강도에 영향을 미치는 배합탄의 입도(원료의 굵기) A와 배합비(원료의

첨가 비율) B의 영향을 조사하기 위하여 실험은 한 후 다음의 결과를 얻었다. 강도가 가장

좋은 것은 언제인가?

배합탄 입도(3mm 이하의 %) : A1 = 75, A2 = 80, A3 = 85, A4 = 90

배합탄의 배합비 : B1 = 10, B2 = 20, B3 = 30

배합탄의 입도

A1 A2 A3 A4배합비

89.5 89.6 90.0 89.2

88.8 90.2 90.8 89.9

90.0 91.5 91.3 91.0

90.9 90.9 91.8 90.4

91.7 92.2 92.6 91.7

91.2 92.8 93.2 92.3

B1

B2

B3

종속변수 : 코우크스의 강도 : 등비

독립변수 : 배합탄의 입도 : 서열(수준 4)

배합탄의 배합비 : 서열(수준 3)

반복이 있는가 ? O (교호작용)

분석 방법 : GLM

Page 15: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 15/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 1

H0 : 배합탄의 입도에 따라 코우크스의 강도는 같다

H1 : 배합탄의 입도에 따라 코우크스의 강도는

다르다

H0 : 배합비에 따라 코우크스의 강도는 같다

H1 : 배합비에 따라 코우크스의 강도는 다르다

H0 : 교호작용이 없다.

H1 : 교호작용이 있다.

종속변수 : 코우크스의 강도

독립변수 : 배합탄의 입도, 배합비

분석 → 일반선형모형 → 일변량

독립변수가 2개 이상일 경우에 주로 사용 모형, 사후분석, 저장, 옵션 등을 선택함

1차적으로 봐야 되는 결과는 교호작용에 대한 효과

교호작용이 존재할 경우 : 독립변수에 대한 해석은 의미가 없다.

교호작용이 없을 경우 : 앞 절에서 설명한 방식으로 해석

Page 16: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 16/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 2

GLM 모형 선택

사용자 정의 : 독립변수만 모형에

포함시킬 때 사용

완전요인모형 : 독립변수와 교호작용

을 모형에 포함

교호작용 : 독립변수 수준 조합

에서 생기는 효과

배합탄의 입도 효과가 배합비에따라 다르다.

A 인자의 각 수준에서의 평균이B 인자의 수준에 따라 변하게될 때 교호작용이 있다고 한다.

강도

교호작용 없다

B1 :

B2 : 강도

교호작용 있다

A1 A2 입도

A1 A2 입도

Page 17: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 17/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 3

잔차 저장 정규성 검정

전체를 선택

평균, 표준편차 출력

독립변수 선택

사후분석(다중비교)

Page 18: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 18/26Copyright ⓒ 2001 StatEdu Consulting

개체-간 효과 검정

종속변수: 강도

29.775a 11 2.707 12.763 .000

98653.010 1 98653.010 936674.312 .000

5.421 3 1.807 8.521 .003

24.256 2 12.128 57.185 .000

9.750E-02 6 1.625E-02 .077 .998

2.545 12 .212

98685.330 24

32.320 23

소스수정 모형

절편

입도

배합비

입도 * 배합비

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .921 (수정된 R 제곱 = .849)a.

GLM 분석 4

개체-간 효과 검정

종속변수: 강도

29.677a 5 5.935 40.430 .000

98653.010 1 98653.010 1353170.9 .000

5.421 3 1.807 12.309 .000

24.256 2 12.128 82.612 .000

2.643 18 .147

98685.330 24

32.320 23

소스수정 모형

절편

입도

배합비

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .918 (수정된 R 제곱 = .896)a.

P=0.998 > 0.05 H0

교호작용이 없다.

모형 설정을 다시 한다.

GLM 모형이 적합하다.

Page 19: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 19/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 5 - 결 과 1

정규성 검정

.824 24 .010강도의 표준화 잔차통계량 자유도 유의확률

Shapiro-Wilk P=0.614 > 0.05 H0

등분산이다.

개체-간 효과 검정

종속변수: 강도

29.677a 5 5.935 40.430 .000

98653.010 1 98653.010 1353170.9 .000

5.421 3 1.807 12.309 .000

24.256 2 12.128 82.612 .000

2.643 18 .147

98685.330 24

32.320 23

소스수정 모형

절편

입도

배합비

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .918 (수정된 R 제곱 = .896)a.

오차 분산의 동일성에 대한 Levene의 검정 a

종속변수: 강도

.834 11 12 .614F 자유도1 자유도2 유의확률

계획: Intercept+입도+배합비a.

P=0.010 < 0.05 H1

잔차가 정규분포가 아니다.

독립변수 수준사이이의 값이 극단적일

때 자주 일어나는 현상

입 도 : P=0.000 < 0.05 H1

배합비 : P=0.000 < 0.05 H1

입도와 배합비에 따라 코우크스의

강도는 차이가 있다.

전체의 설명률은 89.6%

입도 : 16.78% 배합비 : 75.05%

Page 20: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 20/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 6 - 결 과 2

기술통계량

종속변수: 강도

89.150 .495 2

90.450 .636 2

91.450 .354 2

90.350 1.104 6

89.900 .424 2

91.200 .424 2

92.500 .424 2

91.200 1.208 6

90.400 .566 2

91.550 .354 2

92.900 .424 2

91.617 1.174 6

89.550 .495 2

90.700 .424 2

92.000 .424 2

90.750 1.150 6

89.750 .619 8

90.975 .580 8

92.213 .658 8

90.979 1.185 24

배합비10

20

30

합계

10

20

30

합계

10

20

30

합계

10

20

30

합계

10

20

30

합계

입도75

80

85

90

합계

평균 표준편차 NTukey HSD

a,b

6 90.350

6 90.750 90.750

6 91.200 91.200

6 91.617

.302 .213 .270

입도75

90

80

85

유의확률

N 1 2 3

집단군

입도

85 > • > 7580 90

배합비

30 > 20 > 10

Tukey HSDa,b

8 89.750

8 90.975

8 92.213

1.000 1.000 1.000

배합비10

20

30

유의확률

N 1 2 3

집단군

Page 21: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 21/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 7 - 그래프(Interaction Plot)

강도의 추정된 주변평균

입도

90858075

추정된

주변평균

94

93

92

91

90

89

88

배합비

10

20

30

강도의 추정된 주변평균

배합비

302010

추정된

주변평균

94

93

92

91

90

89

88

입도

75

80

85

90

Interaction Plot :

2개의 독립변수를 동시에 고려한 그래프

각 수준 사이에서의 효과를 쉽게 확인할 수있다.

특히 교호작용이 있을경우 유용하게 사용

수평축 변수를 어느 것으로 하느냐에 따라 그래프의 모양이 틀려진다.

보통 설명률이 큰 변수를 수평축 변수로 사용하면 설명하기가 더 좋다.

Page 22: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 22/26Copyright ⓒ 2001 StatEdu Consulting

GLM 분석 8 - 결론 및 해석

강도의 추정된 주변평균

배합비

302010

추정된

주변평균

94

93

92

91

90

89

88

입도

75

80

85

90

입 도 : P=0.000 < 0.05 H1

배합비 : P=0.000 < 0.05 H1

입도와 배합비에 따라 코우크스의

강도는 차이가 있다.

전체의 설명률은 89.6%

입도 : 16.78% 배합비 : 75.05%

P=0.010 < 0.05 H1

잔차가 정규분포가 아니다.

독립변수 수준사이이의 값이 극단적일

가능성이 높다.

P=0.998 > 0.05 H0

교호작용이 없다.

입도

85 > > 7580 90

배합비

30 > 20 > 10

배합탄의 입도와 배합비에 따라 코우크스의 강도는 차이가 있으며, 2 변수로서 설명할 수 있는 비율은 89.9%이다.

입도보다는 배합비가 코우크스의 강도를결정하는데 더 중요한 요소이다.(75.05%)

사후분석과 Interaction Plot으로 확인해 본결과

배합비 : 30 입도 : 85

의 경우가 코우크스의 강도가 가장 좋다

Page 23: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 23/26Copyright ⓒ 2001 StatEdu Consulting

배합탄의 입도와 배합비에 따라 코우크스의 강도는 차이가 있으며, 2 변수로서설명할 수 있는 비율은 89.9%이다.

입도보다는 배합비가 코우크스의 강도를 결정하는데 더 중요한 요소이다. (75.05%)

사후분석과 Interaction Plot으로 확인해 본 결과 배합비 : 30 입도 : 85

의 경우가 코우크스의 강도가 가장 좋다

입 도 : P=0.000 < 0.05 H1 배합비 : P=0.000 < 0.05 H1

입도와 배합비에 따라 코우크스의 강도는 차이가 있다.

전체의 설명률은 89.6%, 입도 : 16.78% 배합비 : 75.05%

종속(등비) 독립(서열, 서열)이고 잔차의 정규성, 등분산성 만족⇒ GLM

수정모형 P < 0.05 → GLM 모형이 적합하다

종속변수 : 코우크스의 강도 : 등비

독립변수 : 배합탄의 입도 : 서열(수준 4)

배합탄의 배합비 : 서열(수준 3)

반복이 있는가 ? O (교호작용)

코우크스(Cokes)의 강도에 영향을 미치는 배합탄의 입도 A와 배합비 B의 영향

을 조사하기 위하여, 다음에 나타나는 수준들을 택하여 배합탄을 코우크스화하

고 그 강도(드럼 15mm 지수)를 측정하였다.

결 과 정 리

Page 24: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 24/26Copyright ⓒ 2001 StatEdu Consulting

과 정 정 리 1

GLM(General Linear Model) : 독립변수가 2 이상인 경우의 평균의 차이를 비교하는 분석

- 기본 가정 : 잔차의 정규성, 등분산성 : 모형의 적합성을 검정

정규성이나, 등분산을 만족하지 못하면 : Data(이상값)를 확인한다.

- 반복이 있는가? 교호작용을 확인할 수 있는가?

- 가 설 : H0 : 독립변수에 따라 종속변수는 같다

H1 : 독립변수에 따라 종속변수는 다르다

교호작용 :

H0 : 교호작용은 없다

H1 : 교호작용은 있다.

- 독립변수의 설명력 : 결정계수(R2) - 독립변수들 중에서 가장 설명력이 큰 변수는?

- 사후 분석 : P < 0.05 일 경우 어느 수준끼리 차이가 있는가? (Tukey’s Comparison)

- Interaction Plot : 그래프의 모양을 보고 미리 판단해보고 GLM 결과와 확인한다

Page 25: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 25/26Copyright ⓒ 2001 StatEdu Consulting

과 정 정 리 2

분석 순서 :

1. Data의 특성을 파악한다.

종속, 독립 변수 : 명목, 서열, 등비 중 어느 것인가?

2. 반복이 있는가를 확인한다

교호작용이 있는지의 여부를 확인 – 교호작용이 존재하면 그래프와 비교해서

결론을 내린다.

3. 잔차의 정규성, 등분산 검정을 한다.

GLM 모형의 적합성을 판별한다.

4. 분석을 한다.

1, 2, 3 단계에서 얻어진 결론으로 최종 분석 방법을 선택하고 분석한다.

5. 사후 검정을 한다.

4단계에서 얻어진 P 값을 보고 0.05보다 작으면 실시한다.

6. 결과를 해석한다.

평균과 표준편차를 정리하고, 결과로 얻어진 P 값을 보고 2개의 가설 중

하나를 선택한다. 교호작용이 존재하면 그래프와 비교를 한다.

사후 검정을 했으면 부등호로서 수준끼리의 차이를 정리한다.

7. 결론을 내린다.

Page 26: 개념 잔차의정규성, 등분산성 인자의영향력 사후검정 교호작용cfs6.tistory.com/upload_control/download.blog?fhandle...-자동차의종류에따라연비는차이가있는가?

일반선형 모형(GLM) - 26/26Copyright ⓒ 2001 StatEdu Consulting

라디오에 칠하는 페인트에 대해서 내구성 연구를 하고자 한다. 세 가지 종류의

페인트와 2 수준의 페인트 칠 두께(16 미크론, 26 미크론)에 대해 내구성을 조

사하였다. 페인트는 가능하면 얇게 칠하고 내구성이 좋아야 한다. 적절한 인자

의 수준을 정하라.

16 미크론 = 1

26 미크론 = 2

두께(A)

252 48 78

287 54 72

206 45 69

300 25 66

238 55 76

346 108 366

275 102 333

240 111 289

246 111 300

302 112 340

페인트(B)

1 2 3