54
SA102 1관광데이터 마이닝 대회 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시

외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

SA102

제1회 관광데이터 마이닝 대회

외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시

Page 2: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

02 외래 관광객 유치 모형 개발

03 결론 및 전략

01 기본소개

Contents

제1회 관광데이터

마이닝 대회

프로젝트 팀원소개 프로젝트 개요 수행일정

1. 상황분석 2. 변수설명 3~7. SEMMA 8. Clustering (추가분석)

9. 결론 및 마케팅전략

Page 3: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 2 THE POWER TO KNOW. 2

프로젝트 팀원 소개

신범종(28) 단국대학교

정보통계학과 대학원

최석모(25) 단국대학교

정보통계학과 4학년

조영민(27) 단국대학교

정보통계학과 대학원

이희재(27) 단국대학교

정보통계학과 대학원

Page 4: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 3 THE POWER TO KNOW.

2009년 DATA

2010년 DATA

2011년 DATA {

외래 관광객 유치를 위한 관광객 패턴연구

1. 과제

3

프로젝트 개요

과거 한국 방문을 한 경험이 있는 외래 관광객 중 향 후 재방문 의사 및 한국의 관광 이미지 변화 등 방문객 성향 파악을 통하여 대한민국 관광산업의 발전과 보완 사항에 대한 솔루션 제공을 위함이다.

Step1) 2009년~2011년 3년 패널 데이터 기반 – 설명변수(X), 목표변수(Y) 설정 Step2) 재방문 및 추천의사를 예측하는 모델 개발(Supervised learning-2009,2010) Step3) 모델 1을 2011년 DATA에 스코어링하여 모델 평가 및 검증 Step4) 추가분석을 통한 모형의 정확도 보완 Step5) 관광산업 발전을 위한 대안 및 마케팅 전략 수립

2) 분석 목표

3) 수행 과제

1) 분석 주제

2. 과제

관광산업 발전을 위한 대안 제시

Page 5: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 4 THE POWER TO KNOW. 4

프로젝트 수행과제 프로젝트 일정

~2/20 ~2/27 ~3/5 ~3/12 ~3/19 ~3/26 ~3/31

자료탐색

분석 주제 숙지 및 선행 연구 탐색

SAS e-miner & SAS 사용법 숙지

타겟 변수 정의 및 파생 변수 생성

샘플링 설정

각 변수의 이상치 및 결측치 탐색

타겟 변수와 교차분석

모형 개발

예측 모형 개발

예측 모형 비교 및 검증

마케팅 전략 수립

추가 추가 분석 사항 연구 및 개발

정리 보고서 작성

프로젝트 일정

Page 6: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

상황 분석

Page 7: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 6 THE POWER TO KNOW. 6

-한국 관광의 문제점

상황 분석

Page 8: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 7 THE POWER TO KNOW.

-관광산업의 중요성(국내외 관광객의 관광지출 유발승수효과 )

7

<출처 : 2010 관광산업의 경제효과 분석(이강욱)>

상황 분석

파급효과 국내관광객

(1) (비율)

외래관광객 (2)

(비율)

합계 (1+2)

생산 유발효과

35,137,359.7 (59.1)

24,310,769.8 (40.9)

59,448,129.5

소득 유발효과

5,562,286.5 (57.8)

4,057,819.9 (42.2)

9,620,106.4

취업 유발효과(명)

424,063 (38.8)

670,187 (61.2)

1,094,250

고용 유발효과(명)

224,763 (56.9)

170,039 (43.1)

394,802

부가가치 유발효과

13,591,748.6 (58.2)

9,776,172.6 (41.8)

23,367,921.2

수입 유발효과

7,156,459.4 (62.7)

4,250,867.4 (37.3)

11,407,326.8

세수 유발효과

2,402,068.8 (63.1)

1,405,970.0 (36.9)

3,808,038.8

<2008년 국내외 관광객의 관광지출 유발승수효과 추정>

(단위 : 백만원, 명, %)

Page 9: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 8 THE POWER TO KNOW. 8

상황 분석

(Tripper Relationship Management)

여행객 관계 관리(TRM)이란? 여행객 충성도를 극대화하기 위해 개별고객의 구체적 정보를 관리하고 고객과의 접촉성을 세심하게 관리하는 과정

(1) 외래 관광객 유치로 인한 경제효과는? (2) 외래관광객을 유치할 방법은?

외래관광객 관계관리 방법 Data Mining 활용

- 관광산업의 경제효과 및 관리방법

관광객의 특징 및 성향

파악을 통한 외래 관광객 관리

산업 구분 외화가득율 부가 가치율

농림수산업 80.5 % 51.6 %

광산업 82.3 % 58.4 %

제조업 56.3 % 25.0 %

-주요 제조업 58.7 % 24.1 %

전력가스 및 건설업 54.8 % 30.7 %

서비스업 (관광산업포함)

82.6 % 54.0 %

관광산업 82.3 % 57.3 %

전산업 평균 67.4 % 36.1 %

주요제조업은 주요수출품목으로 전자제품, 자동차, 컴퓨터 등이 포함된 산업

<출처 : 2010 관광산업의 경제효과 분석(이강욱)>

Page 10: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

변수 설명

Page 11: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 10 THE POWER TO KNOW. 10

타겟변수의 정의

0 : 좋아졌다 73.87%

26,552명

1 : 나빠졌다 26.13% 9,393명

<TARGET > <change_image_korea >

-> ‘한국을 여행한 후 한국에 대한 이미지 변화’ 변수를 이용

-> 외래관광객을 대상으로 이미지의 변화여부를 파악하는 것이 목적이므로

이를 가장 잘 분석할 수 있는 Binary 형태로 종속변수를 변환

Page 12: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 11 THE POWER TO KNOW. 11

자료의 구성

문 항 2011 2010(2009) TOTAL 비 고

문1.여행형태 q1 dd1 trip_form

문2-2.최근 3년간 한국방문 횟수 q2b mq1a visit_num

문3-2.한국체류기간 q3a2 mq6 Trip_period

문3-3.한국체류기간(원자료) mq3a2 mq6

문4.한국 입국 후 방문국가1 q4c1~3 q4c1~3 af_nation1~3

문6.여행 전 다른 국가 방문 검토 여부 q6 q2b trip_check

문6.여행 전 방문 검토 국가1~5 q6a1~5 q2b1~3 trip_check_nat1~5

문7.여행동기 q7 q2 trip_motive

문7-1.여행 선택 고려 요인(1순위~3순위) q7a1~3 q2c1~3 trip_motive1~3

문8.여행 정보 입수 경로(1순위~3순위) q8a1~3 q3a1~3 trip_info1~3

문9.동반현황_혼자왔다 xq9a1 q5a1~6 solo

문9.동반현황_가족/친지 xq9a2 family family

문9.동반현황_친구/연인 xq9a3 friend friend

문9.동반현황_직장동료 xq9a4 coworker coworker

문9.동반현황_기타 xq9a5 etc etc

문9.동반자수(총인원_본인포함)(원자료) mq9 mq5b+1 trip_people_num 본인제외

문10-1.숙박시설 q10a1~7 q7 trip_place

문11.한국여행 방문지_서울 및 인천 경기 q11a1~27 q8a1~q8a21_서울

q9a1~q9a21_지방

invitation1~27 Binary

문11.한국여행 방문지_지방 q11b1~27 invitation28~54 Binary

Page 13: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 12 THE POWER TO KNOW. 12

자료의 구성

문 항 2011 2010(2009) TOTAL 비 고

문11.한국여행방문지(16개시도) yq11a01~16,97,99 invitation_city1~18 Binary

문11.한국여행방문지(권역별) grp1~8,9,99 invitation_paldo1~10

문12-1.좋았던 방문지(1순위~3순위) q12a1~3 q10a1~3 impact_trip1~3 통합범주

문13-1.한국 방문시 활동 내역(1순위~3순위) q13a1~3 q12a1~3 trip_active1~3

문14-1.쇼핑품목1~3 q14a1~3 q13a1~3 goods1~3

문14-2.쇼핑장소1~3 q14b1~3 q14a1~3 shop1~3

문15-1개별여행 지출금액1~10 mzq15a0~10 mzq16a0~10 personal_trip_total_money0~

10

문15-2.단체여행 지출금액1~10 mzq15b0~10 mzq16b0~10 group_trip_total_money0~10

문16-1.한국여행에 대한 항목별 만족도1~10 q16a01~10 q17a1~10 satisfied_1~10

문17.한국여행에서 좋았던 점

(인상 깊은 점)1~12 q17a01~12 q18a1~12 impressive_1~12

문18.한국여행에서 불편했던 점1~16 q18a01~16 complain_1~16

문19.3년 내 재방문 의사 q19 q20 re_visit

문20.한국여행 추천 의사 q20 q21 recommend

문21.여행 후 한국에 대한 이미지 변화 q21 q22 change_image_korea Binary

Page 14: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

SEMMA Data Analysis

Sampling

Explore

Modify

Modeling

Assessment

S

E

M

M

A

Sampling

1

Explore

2

Modify

3

Assessment

5

4

Modeling

Page 15: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

SAMPLING

Page 16: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 15 THE POWER TO KNOW. 15

데이터 통합

‘변수변환’이라는 프로그램을 통해 2009년, 2010년, 2011년에 있는 변수를

범주 통합과 변수 명을 변경

‘데이터 통합’이라는 프로그램을 통해 위에서 통합된 변수들로 3개년도 데이터를 합침

Page 17: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 16 THE POWER TO KNOW.

(2) 데이터 분할 시각화

Modeling Data를 Training Data 60%, Test Data 40%로 분할하여 분석 실행 - 가장 일반적인 방법 Data Mining for Business Intelligence - Shmueli, Patel, Bruce

(1) SAS Enterprise Miner

분석용TIS Data 100%

Training Data 60%

Test Data 40%

Sampling Data Partitioning Data

분석용 Data를 Training Data 60%, Test Data 40%로

분할하여 분석 실행

16

Page 18: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Explore

Page 19: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 18 THE POWER TO KNOW.

Y

0 1

AGE 빈도 행백분율(%) 빈도 행백분율(%)

15~20(0) 1193 0.79 308 0.20

21~30(1) 8261 0.75 2644 0.24

31~40(2) 7260 0.72 2727 0.27

41~50(3) 5100 0.71 1984 0.28

51~60(4) 3112 0.72 1174 0.27

60↑(5) 1305 0.74 452 0.25

무응답(9) 321 0.75 104 0.24

합계 26552 9393

20~30대가 많이 방문하며 상대적으로 40대에게는 한국 이미지가 좋지 않다.

EDA

탐색적 자료 분석

01 Age

18

1(10905)

0(1501)

9(425)

5(1757)

4(4296)

3(7084)

2(9987)

Y

합계 0 1

Nation 빈도 행백분율(%) 빈도 행백분율(%)

일본(1) 2545 0.52 2351 0.48 4896 중국(2) 2486 0.67 1198 0.33 3684 홍콩(3) 1533 0.77 456 0.23 1989

싱가폴(4) 1345 0.75 437 0.25 1782 대만(5) 1544 0.67 758 0.33 2302 호주(6) 1797 0.89 214 0.11 2011 태국(7) 1476 0.84 282 0.16 1758 미국(8) 1213 0.80 309 0.20 1522

캐나다(9) 2200 0.79 596 0.21 2796 영국(10) 1202 0.80 303 0.20 1505 독일(11) 1156 0.75 381 0.25 1537

프랑스(12) 1213 0.69 537 0.31 1750 러시아(13) 1116 0.72 444 0.28 1560 인도(14) 1543 0.85 269 0.15 1812

말레이시아(15) 1316 0.85 227 0.15 1543

중동(16) 1415 0.87 208 0.13 1623 모름(97) 1452 0.77 423 0.23 1875

26552 9393 35945

한국을 방문하는 관광객의 주요 국가는 일본과 중국이다.

02 Nation

Page 20: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Modify

Page 21: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 20 THE POWER TO KNOW. 20

Filtering

Page 22: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 21 THE POWER TO KNOW. 21

Transform Variables

<변경 전> <변경 후>

-Log함수를 이용하여 자료를 정규화

-기본 가정을 만족시켜 분석의 타당성을 높임

외래관광객의 지출 비용 등 0보다 큰 값을 갖는 변수는 로그변환을 적용

Page 23: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 22 THE POWER TO KNOW. 22

2009, 2010, 2011 TotalData

Transform Variables

Page 24: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 23 THE POWER TO KNOW. 23

여행 전 방문 검토 국가와 한국 입국 전 방문 국가 등의 변수에 적용

인도(65),말레이시아(995),중동(996) -> 인도(14),말레이시아(15),중동(16) 기타(997),무응답(999) -> 결측값 처리

Outlier Filtering

Page 25: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Modeling

Page 26: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 25 THE POWER TO KNOW. 25

외국인 관광객의 한국 이미지 변화 예측 모델 노드 다이어그램

Page 27: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 26 THE POWER TO KNOW. 26

Regression(9), Decision Tree(5),

Neural Network(1) Ensemble(4) Boosting(3) LARS(12)

모델들의 Validataion Data의

오분류율이 가장 낮은 모형

선택

최종 모형으로 선택

외국인 관광객의 성향 파악을 통한 한국의 이미지

개선

의사결정나무모형

로지스틱회귀분석

Modeling Data 2009

설문데이터 변

Scoring Data

데이터 탐색 데이터 전처리

모델 선택

한국이미지개선을 위한 외국인

예측

2010 설문데이터

2011 설문데이터

부스팅

앙상블

LARS

외국인 관광객의 한국 이미지 변화 예측 모델 도식화

Page 28: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 27 THE POWER TO KNOW. 27

LARS Reg

Neural Boosting

Tree

LASSO

변수선택 노드이용

3. LARS 1.LAR/ SBC 2.LAR/ AIC 3.LAR/ BIC 4.LAR/ CV 5.Adaptive LASSO/ SBC 6.Adaptive LASSO/ AIC

7.Adaptive LASSO/ BIC 8.Adaptive LASSO/ CP 9.LASSO/ SBC 10.LASSO/ AIC 11.LASSO/ BIC 12.LASSO/ CV

4. Gradient Boosting

2. Decision Tree (interval/Nominal/Ordinal/)

1.ProbF/ Probchisq /Gini , 2. ProbF/ Entropy / Entropy, 3. ProbF/ Gini / Entropy 4. ProbF/ Entropy /Gini, 5. ProbF/ Gini / Gini

5. Auto Neural Network

1. Regression 1. cloglog / 단계적 선택 2. cloglog / 후진제거 3. cloglog / 전진제거

4. logit / 단계적 선택 5. logit / 후진제거 6. logit / 전진제거 7. Probit/ 단계적 선택 8. probit/ 후진제거 9. probit/ 전진제거

Page 29: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Assesment

Page 30: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 29 THE POWER TO KNOW. 29

추정된 회귀식 -설명변수의 증가로 변수들 사이에 다중공선성이 발생, 회귀계수 추정량의 분 산이 커짐 -예측 정확도가 부정확하고 변수에 대한 해석력이 떨어짐 -낮은 오분류율(But, 무의미한 변수의 선택) LASSO모형 -의미있는 변수에 대한 알맞은 선택 -회귀계수에 대한 패널티 부여로 높은 해석력

Page 31: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 30 THE POWER TO KNOW. 30

일본

방문횟수

관광지 매력도(5)

쇼핑만족도(4)

AIC = -8806.61212

모형선택 : Adaptive Lasso

모형선택기준 : AIC

오분류율 : 0.224166 (+) 한국에 대한 부정적 이미지에 영향을 미치는 변수

(ㅡ) 한국에 대한 긍적적 이미지에 영향을 미치는 변수

Page 32: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 31 THE POWER TO KNOW. 31

변수 class 비 고

추정값 레벨 (+ 불만족)

IMPACT_TRIP3_56 56 기타(+) 0.315 NATION_1 1 일본(+) 0.221

IMPACT_TRIP3_26 26 용평리조트(+) 0.171 IMPACT_TRIP3_22 22 서울랜드(+) 0.130 IMPRESSIVE_2_0 0 한국인 친절도(+) 0.124

SATISFIED_ATTRACTIVE_2 2 관광지 매력도(+) 0.113

NATION_5 5 대만(+) 0.101

SATISFIED_SHOPPING_2 2 쇼핑만족도(+) 0.079

NATION_12 12 프랑스(+) 0.070

IMPACT_TRIP2_46 46 전주(+) 0.068

NATION_13 13 러시아(+) 0.054 IMPACT_TRIP1_56 56 중문관광단지(+) 0.051 IMPACT_TRIP3_10 10 롯데월드(+) 0.040

SATISFIED_SHOPPING_3 3 쇼핑만족도(+) 0.035

JOB_12 12 직업기타(+) 0.031 JOB_2 2 기업인,경영직(+) 0.022

IMPACT_TRIP2_7 7 코엑스(+) 0.021 JOB_8 8 학생(+) 0.015

VISIT_NUM 한국방문횟수(+) 0.014 IMPACT_TRIP3_14 14 신촌(+) 0.012

JOB_3 3 사무,기술직(+) 0.010 IMPACT_TRIP3_8 8 동대문시장(+) 0.008

NATION_8 8 미국(+) 0.004

변수 class 비 고

추정값 레벨 (-만족)

IMPACT_TRIP1_1 1 고궁(-) -0.004

TRIP_ACTIVE2_2 2 식도락관광(-) -0.016

IMPACT_TRIP2_3 3 인사동(-) -0.028

TRIP_ACTIVE1_2 2 식도락관광(-) -0.032

NATION_16 16 그리스(-) -0.049

NATION_6 6 호주(-) -0.051

SATISFIED_SHOPPING_4 4 쇼핑 매력도(-) -0.065

SATISFIED_ATTRACTIVE_4 4 관광지 매력도(-) -0.089

SATISFIED_SHOPPING_5 5 쇼핑만족도(-) -0.108

SATISFIED_ATTRACTIVE_5 5 관광지 매력도(-) -0.114

IMPACT_TRIP2_31 31 단양(-) -0.177

부정 효과

선택 변수(LASSO)

긍정 효과

Page 33: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 32 THE POWER TO KNOW.

모형평가

32

2011년 설문지를 Test 데이터로 선택된 모형을 평가한 결과 정분류율이 74.20%로 나타난 결과를 볼 수 있다.

TRAIN 데이터 정분류율

정분류율 : 77.85%

Validation 데이터 정분류율

정분류율 : 77.43%

Test 데이터 정분류율

정분류율 : 74.20%

Predicted value

Y 0 1

0 8165 2784

1 318 767

정오분류표

Page 34: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Clustering(추가분석)

Page 35: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 34 THE POWER TO KNOW.

Clustering

34

군집분석

- 대상 : 한국의 이미지가 나빠진 관광객 - 3개의 군집으로 형성되고, 세부적으로 는 7개의 군집이 형성

Page 36: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 35 THE POWER TO KNOW. 35

외국인 관광객 설문 데이터

Cluster1

Cluster2

Cluster3

외국인 관광객 특징 외국인 관광객 특징 외국인 관광객 특징

Step1 변수 Clustering

Step2 거리 및 특성별 clustering

Step3 외국인 관광객 특징 분류

각 집단별 외국인 관광객의 특징을 분류하여 국내 관광형태 관리

Step 1) 한국에 대한 이미지가 나빠진 관광객의 응답변수별 Clustering

Step 2) 군집별 거리 및 특성을 확인한 Clustering 통합

Step 3) 통합된 Clustering의 각 특성별 외국인 관광객의 특징 분류

GC1 GC3 GC2 GC4 GC7 GC5 GC6

Clustering

Page 37: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 36 THE POWER TO KNOW. 36

Cluster1

방문지 구매 상품

기타 활동 내용

판문점 신촌 서울랜드 여의도

코엑스 청계천 남대문시장 고궁 롯데월드

동대문시장 남산 우도 대장금

테마파크

테마파크 미용 스포츠활동

카지노 온천/스파 휴양,휴식 (리조트)

신발 보석/ 악세서리

인삼 의류

스타상품 서적/잡지 시계

대만 명동(구매장소)

교통혼잡 (불만사항)

언어소통부재 (불만사항)

일본

주부 (직업)

대만이나 일본 등 한국과 인접한 나라의 관광객은 한국에서의 불편한 점으로 언어소통 부재 및 교통혼잡을 꼽았다. 주요 활동으로는 미용, 테마파크, 온천 등 이며 , 주요 방문지는 수도권 내에 분포하고 있는 것을 알 수 있다.

Page 38: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 37 THE POWER TO KNOW. 37

Cluster2

방문지 구매 상품

기타 활동 내용

부산 춘천 여의도 코엑스

광주

거문오름용암동굴계 인천

대장금 테마파크

테마파크

시찰 스포츠활동

피혁제품 도자기 전자제품

사업,전문활동 (방문목적)

미국

인사동

영국

여행사 (여행정보)

프랑스 러시아

한국에 방문하는 목적이 사업 및 전문활동인 관광객은 주로 시찰, 스포츠, 레저활동을 즐기는 것을 알 수 있고, 주요 국가로는 미국, 영국 등이 있다.

Page 39: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 38 THE POWER TO KNOW. 38

Cluster3

방문지 구매 상품

기타 활동 내용

춘천 여의도 코엑스

고궁

공연,민속행사,축제참가 및 관람

피혁제품 도자기 전자제품

인형,장난감류 인삼

과테말라

은퇴자 (직업)

캐나다

설악산 인사동 강릉

전통문화체험

가나

친구,친지,동료 (여행정보)

음식이 입에 맞지 않는다. (불만사항)

여행서비스부족 (불만사항)

한국에 방문하는 관광객 중 은퇴한 사람들(직업)의 관광은 한국의 전통문화 체험 및 축제참여 등 휴식에 중점을 두는 것을 알 수 있고, 주요 구매상품 품목은 도자기,인삼,인형 등을 보아 관광객의 나이대가 높다는 예측이 가능하다.

Page 40: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

결론 및 전략

Page 41: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 40 THE POWER TO KNOW. 40

Cluster1

Cluster2

Cluster3

- Cluster1에 속한 관광객은 주로 우리나라 주변 국가의 국민이며, 직업은 주부이다. - 최근 몇 년간 지속되는 한류문화 영향을 많이 받아 한국을 방문한다. - 주로 상품을 구매하는 곳은 서울에 있는 명동이다. - 주요 활동 내용으로는 미용, 레저, 온천, 스파 등을 즐긴다. - 구매상품으로는 보석류, 인삼, 신발류, 의류, 한류스타상품 등을 구매한다.

- 이들에게는 한국문화를 알림과 동시에 한류스타를 활용한 상품 및 미용관광 을 목적으로 하는 패키지를 소개하는 것이 바람직하다.

- Cluster2와 Cluster3에 속한 관광객은 유럽과 아메리카에 속한 국민이다. - 주로 사업을 목적으로 하거나 은퇴를 하여 휴양을 즐기러 오는 것이 목적이다. - 구매상품으로는 도자기, 피혁제품, 인형, 장난감류, 전자제품을 구매한다. - 입에 맞지 않은 음식이 불편한 사항으로 선택되었으니 동서양의 퓨전음식개발이 필요하다.

- 동양 문화는 익숙하지 않은 관광객이기 때문에 한국의 문화를 전파 할 수 있 는 여행패키지를 개발하는 것이 바람직하다.

마케팅전략 1) Clustering Strategy

Page 42: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 41 THE POWER TO KNOW. 41

마케팅전략 2) Changing Image

Page 43: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 42 THE POWER TO KNOW. 42

19년후 이 아이는 스페인전의 승부차기를 막아냅니다 -2002 월드컵 대표팀 골키퍼 이운재-

17년후 이 아이는 카라얀의 찬사를 받게됩니다. -신이 내린 목소리 소프라노 조수미-

-국정홍보처 다이나믹 코리아 CF 中-

마케팅전략 2) Changing Image

Page 44: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 43 THE POWER TO KNOW. 43

-국정홍보처 다이나믹 코리아 해외 홍보영상 中-

마케팅전략 2) Changing Image

Page 45: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 44 THE POWER TO KNOW. 44

대한민국의 이미지를 찾자

마케팅전략 2) Changing Image

Page 46: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 45 THE POWER TO KNOW.

마케팅전략 3) 대한민국 관광 마케팅 전략(LASSO)

45

여행목적지별

따라서, 한국에서만 느끼고 볼 수 있는 관광지 개발 필요성 대두!!!

신 촌

KOREA

-용평리조트, 서울랜드, 전주, 중문관광단지, 롯데월드, 코엑스, 신촌, 동대문 시장으로 구성 -한국의 전통 문화나 예술적 상징성을 느낄 수 없는 현대적인 장소로 구성

Page 47: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 46 THE POWER TO KNOW. 46

한국인 친절도

-타 문화에 대한 존중과 이해 증진 그리고 다문화에 대한 사회적 인식제고 -범국가적인 국민 환대서비스 개선캠페인 (친절한 시민의식 향상) -외래 관광객 가이드의 교육필요

-관광지의 접근성 향상 -국가별 언어로 구성된 완벽한 홍보,설명 자료 필요성 -복합 관광도시 개발 (쇼핑,관광, 음식 등을 한곳에서 해결) -한국의 관광임지를 부각시키고 포지셔닝을 구축할 수 있는 독특한 관광자원을 상품화하고 대표성을 부각 -도시별로 비교적 독특한 특징을 사회적·역사적 관광자원을 활용

-가격정찰제 시행 -외래 관광객에게 호객행위 금지 -다양한 한국적 쇼핑 품목 개발

관광지 매력도

쇼핑만족도

마케팅전략 3) 대한민국 관광 마케팅 전략(LASSO)

Page 48: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 47 THE POWER TO KNOW.

마케팅전략 4) 대한민국 여행 목적지 선택 기준(LASSO)

47

경 치 쇼 핑

전통문화 한 류

Page 49: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 48 THE POWER TO KNOW. 48

경치

전통 문화

한류

쇼핑

인사동 동대문

제천(한방축제)

한옥마을

안동(하회마을) 단 양 설악산 제주도 남이섬

강 남 명 동

해 남

마케팅전략 4) 대한민국 여행 목적지 선택 기준에 따른 도식화

Page 50: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 49 THE POWER TO KNOW. 49

체계적 관광시스템 구축

• 관광지, 문화재 정보 ->관광안내지도를 쉽게 구할 수 있는 시스템개설 ->도로 입간판만으로 문화재 정보를 확인할 수 있도록 설치 • 교통 시스템 ->체계적인 대중버스 노선과 버스시티투어 개설 • 가이드 의무화 ->주요시설물 방문 시 전문적인 가이드 동행 의무화 • 안전 및 보안 ->주요 관광지에 관광객을 위한 경찰서 설치

• 우리나라의 문화재 현황 -> 노후되거나 파손되었으면 문화재를 복원시 키는 것에 중점을 두고 사업을 벌임.

• 외국의 문화재 현황 -> 2천년 이상 된 건축물들은 노후하여 변질됨과 동시에 많은 전쟁을 거치면서 파손된 문화재라 하더라도 복원이나 복구를 하지 않고 최소한의 편의시설만을 현대식으로 교체 함으로 인하여 자국민의 자긍심으로 승화시킴과 함께 세계적인 문화유산이라는 차원으로 보존하고 있음.

관광체험 상품 개발

• 전시공간을 중심으로 한 볼거리위주 -> 체험형 (ex. 팜스테이)

• 우리나라 지역의 자연적 환경을 토대로 상품을

지속적으로 기획, 계발해야 함.

마케팅전략 5) 대한민국 관광 세부 마케팅 전략

Page 51: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 50 THE POWER TO KNOW. 50

문화 예술적 상징성

• 해외의 문화 예술적 상징성 -> 소렌토(이탈리아) ‘돌아오라 소렌토로’ 라는 가곡 로렐라이 언덕(독일), 몽마르뜨 언덕(프랑스), 빈(오스트리아)

• 국내의 문화 예술적 상징성 방향 -> 지방의 문화가 단지 촌스러운 것만이 아니라 우리와 지역을 나타내는 대표성이 되기도 한다는 사실을 인식해야 한다.

• 다수의 지역 발전을 통한 지방화 ->역사성이 있거나 지방 나름의 특색과 특징을 살려 우리만의 촌스러움을 국제적인 경쟁력으 로 어필 • 전국 각 지역 문화를 대표하는 축제 ->지역의 문화와 역사적 요소를 대표할 수 있 는 문화체험, 축제를 주기적으로 개최

연관 산업과의 유대성

• 해외의 산업 활용방안 -> 뉴욕시의 관광객 유치 성과는 호텔업계에도 크게 영향을 미쳐 미국 전체 호텔 평균 숙박률 60%를 훨씬 웃도는 약 80%를 기록하고 있다. 또한, 2007년 한 해에만 총 280억 달러(한화 약 28조원)이상의 경제효과를 창출한 관광과 레저산업은 37만개의 일자리를 생성하면서 고용 증가율이 4.58%로 미국 전체 증가율인 2.47%를 큰 차이로 앞섰다. 이처럼 관광산업은 연관 산업을 통해 수익을 창출하고 더불어 성장해야 안정성을 가진다.

랜드 마크

• 해외의 랜드마크 -> 네덜란드의 풍차, 에펠탑 등 • 국내의 랜드마크 방향 -> 유네스코에 등록된 문화재 또는 국내 역사를 알 수 있는 지역 등을 랜드마크로 선정하여 주변의 지역을 관광특구로 활용화.

마케팅전략 5) 대한민국 관광 세부 마케팅 전략

Page 52: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 51 THE POWER TO KNOW. 51

마케팅전략 6) 대한민국 관광 세부 마케팅 전략

What is it?

Public transportation information

What is it?

Public transportation information

Page 53: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

기본소개 상황분석 변수설명 Sampling Explore Modify Modeling Assessment Clustering 결론 및 전략

제 1회 관광 데이터 마이닝 대회 52 THE POWER TO KNOW. 52

마케팅전략 6) 대한민국 관광 세부 마케팅 전략

What is it?

Public transportation information

What is it?

Public transportation information

Page 54: 외래관광객 실태 조사를 통한 한국관광산업의 발전방향제시 · 01기본소개 Contents 제1회 관광데이터 마이닝 대회 프젝트 팀원소개 프젝트

Thank you