44
세상의 문제를 여는 열쇠 빅데이터로 보는 도시 범죄 1

[데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

Embed Size (px)

Citation preview

Page 1: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

세상의 문제를 여는 열쇠 빅데이터로 보는 도시 범죄

1  

Page 2: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

2  

Page 3: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

3  

Page 4: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

4  

Page 5: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

5  

SNS의 편리함 이면에 있는 대화 단절, 외로움의 그림자

일러스트  출처  :  국민일보  

Page 6: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

6  

“사람들과 소통하기 위해 쓰는 페이스북이 오히려 페이스북 이용자를 외롭게 하지는 않을까??”

Page 7: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

7  

페이스북 이용 동기가 어떻게 될까?

이용자의 이용동기와 성향에 따라 페이스북 애착이 달라지지 않을까?

페이스북 이용시간은 어떻게 될까?

페이스북을 이용하는 사람의 사회적 성향은 어떨까?

페이스북의 애착 정도에 따라 고독감이 달라지지 않을까?

원인을 파악해보는 시도

Page 8: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

8  

페이스북 이용 동기가 어떻게 될까?

이용자의 이용동기와 성향에 따라 페이스북 애착이 달라지지 않을까?

페이스북 이용시간은 어떻게 될까?

페이스북을 이용하는 사람의 사회적 성향은 어떨까?

페이스북의 애착 정도에 따라 고독감이 달라지지 않을까?

어떤 두 요인이 서로 인과관계가 있는지를 통계적으로 알아보는 분석방법

Page 9: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

페이스북 이용자의 고독감에 영향을 미치는 요인

•  페이스북 이용자 321명의 설문조사 데이터를 분석자료로 활용 •  변인에 대한 측정: 5점 척도로 응답

9  

페이스북 이용 동기

사회적 성향

사회적 관계

페이스북 이용 시간

페이스북 애착 정도

고독감

Page 10: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

10  

이용 동기

커뮤니케이션 성향

사회적 관계 요인

고독감

페이스북 애착

페이스북 이용시간

원인1 원인2 결과

Page 11: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

이용 동기

커뮤니케이션 성향

사회적 관계 요인

고독감

페이스북 애착

페이스북 이용시간

= 고독감의 38.2%를 설명 = 고독감의 2.4%를 추가적으로 설명

원인1 원인2 결과

11  

Page 12: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

페이스북 애착

페이스북 애착정도가 늘어날 수록 고독감이 증가하는 경향

즉, “페이스북에 대한 애착이 바로 고독감의 원인”이라는 것을 회귀분석을 통해 알아낼 수 있습니다.

고독감

12  

Page 13: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

도시문제를 해결하는 새로운 열쇠

13  

Page 14: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

14  

vs  h.p://biz.heraldcorp.com/view.php?ud=20140826000051    

h.p://weekend.heraldcorp.com/view.php?ud=20140402000154&sec=01-­‐71-­‐02    

여전한 논란의 CCTV와 범죄발생율의 관계

Page 15: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

15  

과연, 서울시 자치구별 CCTV 설치 현황은? 서울시 자치구 연도별 cctv 설치현황 데이터

- 그래프의 오류로 인해 2011년 이후 늘었는지 줄었는지 파악하기 어렵다!

출처  서울통계  

Page 16: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

16  

출처  국민TV  뉴스K  

99957대  

565,723대  

88%  

69%  

결론적으로, 효과가 있다고 볼 수 없다!(=없다)

Page 17: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

도시문제를 해결하는 새로운 열쇠

17  

데이터

Page 18: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

18  

"사람은 아이스크림을 먹으면 난폭해진다" 아이스크림 판매량과 범죄발생의 상관관계

- 상관관계를 갖는다고 해서 인과관계가 있는 것은 아니다!

Page 19: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

혈액형과 범죄의 상관관계에 관한 연구

19  

출처  한국교정학회  

B형은 계획적 범죄, O형은 우발적 범죄

Page 20: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

20  

범죄의 원인을 통제하기 위한 노력

지구온난화로 인해 다음 세기에는 살인과 강간 등의 범죄가 증가할 것

우울증·ADHD가 가출이나 폭력, 절도 등 청소년 범죄와 높은 상관관계

Page 21: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

21  

범죄의 원인을 통제하기 위한 노력

출처  성범죄자  알람e  

Page 22: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

22  

범죄의 원인을 통제하기 위한 노력

출처  교육과학기술부,  2013  

Page 23: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

23  

범죄의 원인을 통제하기 위한 노력

출처  부산경찰청,  2012  

Page 24: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

24  

도시의 범죄를 어떻게 해결할 수 있을까?

Page 25: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

25  

인구규모

범죄

인구밀도

범죄

도시면적

범죄

도시의 범죄를 어떻게 해결할 수 있을까?

도시의 범죄 발생에 영향을 주는 요인을 찾아야한다! - 원인을 알면 문제의 해결방법을 보이고 통제할 수 있게 된다.

Page 26: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

26  

인구규모

범죄

인구밀도

범죄

도시면적

범죄

도시의 범죄를 어떻게 해결할 수 있을까?

도시의 범죄 발생에 영향을 주는 요인을 찾아야한다! -  데이터를 보게 되면, 미시적이고 개인적 인구특성이 아닌 거시적 측면에서의

사회적 특성이 특정 현상의 발생에 미치는 영향력을 살펴볼 수 있다.

Page 27: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

27  

실제로 분석을 하기 위해 데이터를 수집, 그리고 인구규모와 강력범죄 간의 인과관계를 알아볼 것이기 때문에

통계 분석 기법 중 회귀분석을 시행.

Page 28: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

28  

•  전국 214개 도시 대상으로 분석 •  강력범죄 평균 47건/10만 명

-  최소 발생 13.7 (경북 의성군)

-  최대 발생 202.7 (경남 창원시)

•  경찰공무원 수

-  광역시도 평균 7241명

-  그 외 전국 도시 평균 366명

출처  통계청,    2014  

Page 29: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

29  

경찰공무원 수 데이터를 구하는 데에는 한계가 있었습니다. 전국 215개의 도시 중 49개 도시의 데이터를 구할 수 없었으며

특히 일부 광역시와 전라북도의 구/군별 데이터를 구할 수 없었습니다.

이는 도시 통계분석에 있어서 주어진 데이터의 미비함과 한계를 보여줍니다.

데이터가 부족하면 분석의 정확도가 줄어들어 설명력이 떨어지게 됩니다.

Page 30: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

30  

경찰 인력은 매년도 꾸준히 증가

출처  통계청,    2014  

Page 31: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

31  

범죄 발생 건수 대비 검거율은?

출처  통계청,    2014  

Page 32: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

지자체별 강력범죄 발생과 경찰력 -  범죄 발생률이 높은 경기도, 대구광역시, 전라북도 등은 범죄발생률이 유사한 다른 지역에 비해 경찰력이 비례하지 않음

32  

어디엔가 구멍이 있다!

출처  통계청,    2014  

Page 33: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

33  

인구규모(명)

범죄(건수)

데이터가 어떻게 해결할 수 있을까?

Page 34: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

34  

위의 그래프에서 진한 점들은 실제 데이터를 표시한 산점도이고, 연한 점들은 회귀분석을 바탕으로 추정된 회귀선 위의 점

인구 규모와 강력범죄의 관계

Page 35: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

대도시에서는 인구 규모와 강력범죄가 통계적으로 서로 유의한 관계가 있음

결정계수 = 0.216 P-Value = 0.000

35  

인구 규모와 강력범죄의 관계 - 대도시 서울특별시 서초구(40만), 제주도 서귀포시(42만), 경기도 파주시(91만), 경기도 성남시(112만)

Page 36: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

결정계수 = 0.003 P-Value = 0.660

인구 수 중간 규모의 도시에서는 인구 수와 강력범죄건수가 통계적으로 관련성이 별로 없다는 걸 알 수 있음 36  

인구 규모와 강력범죄의 관계 - 중도시 전라북도 전주시(15만), 경기도 남양주시 (19만), 전라남도 여수시(28만), 부산광역시 해운대구(32만)

Page 37: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

결정계수 = 0.003 P-Value = 0.660

산점도에서도 확인할 수 있으며, P값이 지나치게 크고 직선의 설명력을 의미하는 결정계수가 너무 작은 것으로도 알 수 있음

인구 규모와 강력범죄의 관계 - 중도시 전라북도 전주시(15만), 경기도 남양주시 (19만), 전라남도 여수시(28만), 부산광역시 해운대구(32만)

Page 38: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

반면 소도시에서는 대도시와 같이 인구 규모와 강력범죄가 통계적으로 서로 유의한 관계가 있음

결정계수 = 0.069 P-Value = 0.015

38  

인구 규모와 강력범죄의 관계 - 소도시 충청남도 천안시(3만), 경상북도 포항시(3만), 강원도 횡성군(6만), 전라남도 보성군(7만)

Page 39: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

그리고 어떤 도시의 범죄건수를 그 도시의 인구수를 통해 예측해보려 합니다. 그때 그 도시의 인구수가 70만 명 이라면,

39  

인구 규모와 강력범죄의 관계 - 예측

Page 40: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

대도시의 회귀직선 식

강력범죄건수 = 22.77828 + (-0.00007)*인구수

04

40  

인구 규모와 강력범죄의 관계 - 예측

Page 41: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

강력범죄건수 = 22.77828 + (-0.00007)*70만 명

위의 회귀식을 통해 계산

∴ 강력범죄건수의 예측치 = 71.77828 (약 72건/10만 명 당)

41  

인구 규모와 강력범죄의 관계 - 예측

Page 42: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

이에 따라 그 도시의 경찰 인력을 어느 정도로 배치해야 할 지 통계적으로 예측하여 알 수 있음 42  

인구 규모와 강력범죄의 관계 - 예측

Page 43: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

04

그리고 회귀분석을 통해 한걸음 더 나아갈 수 있는데요. 바로 분석을 통한 예측입니다.

43  

원인에 대한 파악

원인에 따라 결과에 미치는 영향

원인과 결과에 대한 예측

데이터로 사회문제를 해결하다

Page 44: [데이터 시각화 3rd 세미나] 사회에 기여 하는 방법_뉴스젤리 임지현 디렉터

Thank you.