35
제 3 제 제제제 제제

제 3 장 자료의 정리

Embed Size (px)

DESCRIPTION

제 3 장 자료의 정리. 도수 / 상대도수 / 백분율. cf. 유효백분율 (valid percent). 도수분포표. [ex]. 도수분포표의 유형. 정성적 자료의 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 ) 정량적 자료의 도수분포표 계급구간이 없는 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 ) 계급구간이 있는 도수분포표. - PowerPoint PPT Presentation

Citation preview

Page 1: 제 3 장 자료의 정리

제 3 장 자료의 정리

Page 2: 제 3 장 자료의 정리

도수 / 상대도수 / 백분율

cf. 유효백분율 (valid percent)

Page 3: 제 3 장 자료의 정리

도수분포표

[ex]

Page 4: 제 3 장 자료의 정리

도수분포표의 유형

정성적 자료의 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 )

정량적 자료의 도수분포표

계급구간이 없는 도수분포표 (frequency, 또는 피벗테이블 / 피벗차트 보고서 ) 계급구간이 있는 도수분포표

Page 5: 제 3 장 자료의 정리

‘ 피벗 테이블 / 피벗 차트 보고서’의 활용

Employee data 에서 jobcat 의 도수분포표를 작성하시오 .( 피벗테이블 / 피벗차트보고서를 활용하여 )

Page 6: 제 3 장 자료의 정리

Question

Page 7: 제 3 장 자료의 정리

계급구간이 없는 도수분포표

frequency 함수를 이용하여 도수분포표를 작성하시오 .

Page 8: 제 3 장 자료의 정리

계급구간이 없는 도수분포표의 작성절차

(1) 자료의 값을 계급으로 설정

(2) 각 계급의 도수를 산정

계급

최소값

최대값

도수

자료에서 최소값을 찾는 Excel 함수 : max 함수자료에서 최대값을 찾는 Excel 함수 : min 함수

frequency함수

Page 9: 제 3 장 자료의 정리

max 함수 / min 함수

= max(Data)

Data : 자료가 입력되어 있는 영역주소

자료에서 최대값을 찾아 반환하는 함수

= min(Data)

Data : 자료가 입력되어 있는 영역주소

자료에서 최소값을 찾아 반환하는 함수

Page 10: 제 3 장 자료의 정리

frequency 함수

Page 11: 제 3 장 자료의 정리

계급구간이 있는 도수분포표

frequency 함수를 이용하여 도수분포표를 작성하시오 .

Page 12: 제 3 장 자료의 정리

계급구간이 있는 도수분포표 작성절차 (Guideline)

Page 13: 제 3 장 자료의 정리
Page 14: 제 3 장 자료의 정리
Page 15: 제 3 장 자료의 정리
Page 16: 제 3 장 자료의 정리

Question

Page 17: 제 3 장 자료의 정리

통계분석사례

비오는 날 또는 월요일이 사람에게 신체적 또는 정신적으로 영향을 준다고 많은 사람들이 이야기 한다 . 월요일에 자살하는 사람이 다른 요일보다 더 많다고 알려져 있다 . 또한 심장병으로 사망하는 사람이 월요일에 더 많다는 연구결과가 보고 (Rabkin et al. 1980) 되기도 하였다 .

Rabkin, S. W., F. A. Mathewson and R. B. Tate. Chronobiology of cardiac sudden death in men. Journal of the American Medical Association, 244:12, (1980), 1357-1358.

Western Electric Study 자료에서 dayofwk 의 도수분포를 통해서 월요일에 사망하는 사람이 다른 요일과 비교해 상대적으로 많은가를 검토해 보자 .

도수분포표의 활용

Page 18: 제 3 장 자료의 정리

Western Electric Study (electric)Western Electric Study 는 건강한 사람이 관상동맥 심장질환 (coronary heart disease: CHD) 에 걸리게 되는 요인에 관하여 연구하기 위해 1957 년에 수행되었다 . 시카고 지역에 있는 Western Electric Company 의 Hawthorne공장에서 최소 2 년 이상 근무한 경험이 있는 40 세 ~55 세의 남성 5,397명에서 240 명을 표본으로 선택하였다 .

자료에 포함된 변수- caseid - firstchd : 최초의 CHD 증상 (1: No CHD, 2: Sudden death, 3: Non fatal MI, 5: Fatal MI, 6: Other CHD)- age - dbp58 : 평균혈압 - eduyr : 교육년수- chol58 : 콜레스테롤 (mg per dl)- cgt58 : 일일흡연량 ( 개비 )- ht58 : 신장 ( 인치 )- wt58 : 몸무게 ( 파운드 )

Page 19: 제 3 장 자료의 정리

- dayofwk : 사망요일 (1: 일 , 2: 월 , 3: 화 , 4: 수 , 5: 목 , 6: 금 , 7: 토 , 9:결측 )- vital10 : 10 년간 상태 (0: 생존 , 1: 사망 )- famhxcvr : CHD 가족력 (N: No, Y: Yes)- chd : CHD 발생여부 (1: 발생 , 0: 미발생 )

Page 20: 제 3 장 자료의 정리

Western Electric Study

Page 21: 제 3 장 자료의 정리

교차표

[ 예 ] 자료세트

[Q] 자료의 요소

ID X Y1 1 12 1 23 1 24 2 15 2 2

도수분포표

X 도수12 5

Y 도수12 5

교차표

X1 2Y

12

Page 22: 제 3 장 자료의 정리

통계분석사례

미국에서는 1964 년 공표된 Civil Rights Act 에 의해 성별 또는 인종에 따라 작업장에서 차별하는 것을 금지하고 있다 . 불공정한 고용 및 승진이 있을 경우 고용주는 기소될 수 있다 . 미국 법정에서는 통계분석결과가 차별에 대한 명백한 증거 (prima facie evidence) 로 사용될 수 있음을 규정하고 있으며 실제로 수많은 소송에서 복잡한 통계분석결과가 동일한게 qualified 된 종업원이 차별대우를 받았다는 것을 입증하는 증거로 사용된 바 있다 .

bank 자료에서jobcat 과 sexrace 의 교차표를 작성하고 이를 기초로 차별이 있었는가에 대하여 분석해 보시오 .

Page 23: 제 3 장 자료의 정리

bank 자료Employee data 와 동일하지만 jobcat 이 7 가지로 세분되어 있고sexrace 변수가 추가되어 있다 .

jobcat 1 : Clerical 2 : Office Trainee 3 : Security Officer 4 : College Trainee 5 : Exempt Employee 6 : MBA Trainee 7 : Technical

sexrace 1 : White Males 2 : Minority Males 3 : White Females 4 : Minority Females

Clerical

Manager

Custodial

Page 24: 제 3 장 자료의 정리

분석결과

Page 25: 제 3 장 자료의 정리

막대그래프와 히스토그램

계급

도수상대도수

막대그래프 (ex. 불량품수의 막대그래프)히스토그램 (ex. 109개 국가 출생률의 히스토그램)

Page 26: 제 3 장 자료의 정리

불량품수의 막대그래프

Page 27: 제 3 장 자료의 정리

109 개 국가의 출생률 히스토그램

Page 28: 제 3 장 자료의 정리

꺾은선그래프

ex. 인하식품의 인천지역 제품별/월별 판매량의 꺾은선그래프

Page 29: 제 3 장 자료의 정리

인하식품의 인천지역 제품별 / 월별 판매량의 꺾은선그래프

Page 30: 제 3 장 자료의 정리

OgiveOgive : 누적백분율곡선 , 누적백분율을 꺽은선그래프로 나타낸 그림

Page 31: 제 3 장 자료의 정리

원그래프원그래프 : 원을 각 집단에 속하는 도수의 비율을 기준으로 분할해 놓은 그림

Page 32: 제 3 장 자료의 정리

Question

어떤 도수분포표인가 ? ( 도수분포표의 유형 )

적합한 그래프 유형은 ? ( 막대그래프 , 히스토그램 , 꺽은선그래프 , 원도표 )

Page 33: 제 3 장 자료의 정리

줄기와 잎 그림

(SPSS 11.0)

(SPSS 10.0k)

Page 34: 제 3 장 자료의 정리

[Q]

다음의 줄기와 잎 그림을 보고 가능한 상태까지 원래의 자료를 복원해 보시오 .

Page 35: 제 3 장 자료의 정리

[Q] 자료의 요소

?

?

?