View
532
Download
8
Category
Preview:
Citation preview
Connected Knowledge and Tools #1 – Seoul City
오픈 데이터에서 링크드 데이터로 진화
Open Knowledge South Korea, 2015
목차
1. Connected Knowledge and Tools #1 - Seoul City 2. Linked Data 서비스 플랫폼
- 시스템 아키텍처
- 시각화 도구
3. Linked Data 모델링
- 행정구역 모델링 사례
- 참고 문헌
2
1. Connected Knowledge and Tools #1 - Seoul City
오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ )
열린 데이터의 품질 및 접근성의 향상을 통한 활용성 증가필요성
- 서로 다른 데이터셋 사이의 관계 정의 어려움- 서로 다른 유형의 데이터를 연결 및 통합하기 어려움
- 상세한 정보보다 단순한 메타데이터 리스트를 제공하고 있음- 이종의 데이터셋에 존재하는 동일한 값을 구분하기 어려움
- 한글 데이터는 한국어를 이해하는 사용자로 접근이 제한- 도시 중심의 오픈 데이터 공개 통한 협력 가능성 제한
321 단편적인 데이터 연결되지 않은 데이터 접근이 제한된 데이터
4
데이터 사이의 의미적 연결을 통한 Data Enrichment 실현목표
개별 데이터셋과 외부 데이터 연결을 통한 데이터 표현력 향상1* 서울시 열린 데이터 사이의 연결 관계 구축을 통한 데이터 활용성 증가* Linked Data 와 연결을 통한 데이터 항목의 상세 정보 및 관련 정보 확보* 콘텐트 생산 및 유지 비용 감소
웹 표준 기반 열린 데이터셋의 의미적 연결 관계 구축2* 서로 다른 형식의 데이터셋을 웹 표준에 기반하여 표현 및 통합할 수 있음* 새로운 데이터셋을 연계하기 위한 수정 비용 최소화 및 확장 용이성 확보* 타기관 데이터셋과 연계 및 통합을 위한 데이터모델 확보
데이터 영문 변환 및 Linked Data 적용을 통한 접근성 확대3* 비한국어 사용자의 데이터 접근성 향상을 통한 데이터 활용 사례의 다변화* 세계 도시와 데이터 공개 전략 및 사례 공유를 할 수 있는 기반 확보* 서울 열린 데이터와 외부 오픈 데이터의 연계를 통한 데이터 레퍼런스 역할 확보
5
2. Linked Data 서비스 플랫폼오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ckat-seoul-web )
데이터 분석 및 변환 Linked Data 시스템 구현
구축 방법 및 범위
데이터 모델링 데이터 상세화
열린 데이터 광장의 데이터를 RDF (Linked Data) 로 변환
1 2 3 4
- 문화재 데이터- 문화시설 데이터- 지하철 데이터- 행정구역 데이터- Excel to RDB
- 공통 항목 추출- RDF 어휘 검토 및 공통 어휘 추출- 온톨로지 모델링- 온톨로지 명세서 개발- Named Entity URI 설계 규칙 명세서 개발
- Linked Data 설계- SameAs 관계 도출 * 동일한 관계 표현- seeAlso 관계 도출 * 추가 정보 표현- 데이터 연결 * 내부 데이터 간 연계 * 외부 데이터 연계
- RDF 데이터 유효성 검사- RDF 파일 생성- SPARQL Endpoint 구현- Visualization 구현
수행 기간 : 1 주 수행 기간 : 3 주수행 기간 : 3 주 수행 기간 : 3 주
총 10 주7
8
9
Seoul City 프로젝트 결과 https://github.com/Open-Knowledge-Korea/ckat-seoul-web
산출물
10
- 다양한 옵션에 따라 데이터를 탐색할 수 있는 도구
- 데이터 사이의 의미적 관계를 시각적으로 보여주는 도구
- 시범사업에서 구축한 데이터를 질의 /검색하는 인터페이스
321 시맨틱 관계 탐색 패싯 네비게이션 시맨틱 질의 /검색
시각화 도구 1서비스
11
1) 시맨틱 관계 탐색 : http://lod.datahub.kr/projects/seoul/relFinder/ad/
12
2) 패싯 네비게이션 : http://lod.datahub.kr/projects/seoul/relFinder/ad/
시각화 도구 2서비스
13
3) 시맨틱 질의 검색 : http://lod.datahub.kr/projects/seoul/endpoint/ad
시각화 도구 3서비스
3. Linked Data 모델링오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ckat-ontology/ )
구축절차모델링
데이터셋 선정
15
1* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )* 문화재청 , 행정구역 모델링 추가
데이터셋 항목 검토 및 매핑2* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토* 외부 어휘의 재사용 여부 및 범위 결정* 어휘와 데이터셋 항목 매핑
URI 체계 결정 및 온톨로지 설계 완료3* 클래스 , 속성 , 인스턴스 URI 체계 결정* 온톨로지 모델링
구축 범위모델링
16
- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설 ) - 문화재청 데이터와 행정구역 데이터 통합을 위한 모델링 실시
문화재(
문화재청 )
문화시설(
열린데이터광장 )
행정구역
모델링 주안점 ( 방향 )모델링
17
표현력 보다는 기존 데이터의 연결을 통한 Linked Data 구성
기존 Vocabulary 의 재사용을 통한 모델링 - dc, dcterm, foaf, sioc, schem.org 등
1
2
3
4
외부 데이터셋과의 연결성 강화 (dbpedia) - 구축된 데이터의 silo 경계
영어권에서도 활용 가능한 영문 레이블 동시 제공
대한민국 행정구역을 의미적으로 표현하기 위한 정의
행정구역은 국가마다 다름 - 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분 - 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별자치도로 구성
18
모델링
행정구역 온톨로지 모델링 https://github.com/Open-Knowledge-Korea/ckat-knowledge-model
행정구역 – 1. Raw Data 수집모델링
19
20
모델링
행정구역 – 2. 클래스 및 속성 설계
21
모델링
행정구역 – 3. 행정구역 인스턴스 구축
시
hasGu 구
동
hasDong
A 안 >
시
B 안 >
구
구
include
include
22
모델링
행정구역 – 4. 행정구역 모델링 이슈
URI 모델링 가이드라인참고문헌
23
1. Cool URIs for the Semantic Web, http://www.w3.org/TR/cooluris/2. Creating URIs, http://data.gov.uk/resources/uris3. Designing URI Sets for Location, http://location.defra.gov.uk/ wp-content/uploads/2010/04/Designing_URI_Sets_for_Location-Ver0.5.pdf4. 223 Best Practices URI Construction, www.w3.org/2011/gld/wiki/223_Best_Practices_URI_Construction5. Cool URIs don’t change, http://www.w3.org/Provider/Style/URI6. URI Design Principles: Creating Unique URIs for Government Linked Data, http://logd.tw.rpi.edu/instance-hub-uri-design
24
For more information
contact Open Knowledge Korea
via - http://okfn.kr- https://www.facebook.com/ groups/OKFNKorea/- okfn.korea@gmail.com
Or see more activities at:http://lod.datahub.kr
Recommended