Upload
hoang-hung
View
114
Download
2
Embed Size (px)
Citation preview
http://dbpedia.org/
GVHD: Ths. Ngô Quốc Hưng.SVTH: - Hoàng Đình Hùng – 10520086
- Lê Hà Nam – 10520526 - Phan Thanh Thanh – 12520393
NỘI DUNG
1. Dữ liệu liên kê�t
2. DBpedia
3. Vấ�n đê� nghiên cứu
NỘI DUNG
1. Dữ liệu liên kê t
2. DBpedia
3. Vấ�n đê� nghiên cứu
Dữ liệu liên kê�t- Khái quát
▪ Tim Berners-Lee đặt ra trong thảo luận xoay quanh dự án Semantic Web.
▪ Mô tả phương thức tạo ra dữ liệu có cấu trúc, liên kết với nhau (để trở nên hữu ích).
▪ Xây dựng dựa trên HTTP, RDF, URI để mở rộng khả năng chia sẻ thông tin.
Dữ liệu liên kê�t- Thành phấ�n
▪ URI - Uniform Resource Identifiier (Đặc biệt là các Dereferenceable URIs).
▪ HTTP – Hypertext Transfer Protocol.
▪ RDF (Resource Description Framework).
▪ Các định dạng cú pháp tuần tự hóa: (RDFa, RDF/XML, N3, Turtle, và các thứ khác).
Dữ liệu liên kê�t- Tập dữ liệu
▪ CKAN
Ckan.org
▪ Dbpedia
Dbpedia.org
▪ GeoNames
Geoname.org
▪ UMBEL
Umbel.org
▪ FOAF
Dữ liệu liên kê�t- Nguyên lý
▪ Nhận dạng, đặt tên các thực thể (Entity) bằng URIs.
▪ Sử dụng giao thức HTTP URI để truy xuất.
▪ Cung cấp thông tin hữu ích (siêu dữ liệu, mô tả có cấu trúc) về các “thực thể được đặt tên” đó khi URI của chúng được duyệt
▪ Chứa các liên kết đến các URIs khác liên quan trong dữ liệu vừa được duyệt -> có thể duyệt các thông tin khác liên quan.
NỘI DUNG
1. Dữ liệu liên kê�t
2. DBpedia
3. Vấ�n đê� nghiên cứu
DBpedia- Khái quát
▪ Được mô tả bởi TimBerners-Lee. Dự án được bắt đầu ở Free University of Berlin và Leipzig University, phối hớp với OpenLink Software.
▪ Tập dữ liệu liên kết được trích xuất từ Wikipedia .
▪ Cấu trúc của bộ dữ liệu này được xây dựng sẵn có trên World Wide Web.
▪ Cho phép người dùng truy vấn các quan hệ và thuộc tính liên quan đến tài nguyên Wiki bao gồm các liên kết đến bộ dữ liệu.
▪Cải tiến công cụ tìm kiếm Wikipedia.▪Đưa dữ liệu Dbpedia lên trang web.▪Ứng dụng địa lý trên thiết bị di động.▪Phân lớp dữ liệu, đánh dấu và chú thích.▪Multi-Domain Ontology.▪Nucleus for the Web of Data.▪Giúp người dùng dễ dàng biên tập nội dung Wikipedia.
DBpedia- Use Cases
DBpedia- Ứng dụng
Hình 1: Thể hiện mối liên kết trong tập dữ liệu liên kết mở
DBpedia- Ứng dụng
▪ DBpedia có khá nhiê�u ứng dụng thực tiê;n: http://wiki.dbpedia.org/Applications
▪ Ví dụ: –DayLikeToday Tìm kiê�m các sự kiện lịch sửD xaDy ra trong 1 thời gian xác định, hiêDn thị theo giao diện timeline.
–AboutThiisDay.com.–DBpedia Mobile. – etca
DBpedia- Dataset
▪ Phát hành lần đầu vào ngày 23/01/2007.
▪ Phiên bản mới nhất 3.9, phát hành vào tháng 9/2013 (bao gồm 119 ngôn ngữ).
▪ Phiên bản tiếng anh hiện mô tả 4M “things”, 470M “facts”, trong đó 3,22M “things” được phân loại một cách nhất quán. (http://wiki.dbpedia.org/Downloads39)–832.000 người.–639.000 địa điểm (427 địa điểm dân cư).–372.000 công trình (116.000 âm nhạc, 78.000
bộ phim...).–209.000 tổ chức (49.000 công ty, 45.000 cơ sở
giáo dục…).–226.000 loài và 5.600 bệnh…
▪Background
DBpedia- Dataset
▪Thuộc tính
DBpedia- Dataset
NỘI DUNG
1. Dữ liệu liên kê�t
2. DBpedia
3. Vấ n đê� nghiên cứu
Vấ�n đê� nghiên cứu
Wikipedia (www.Wikipedia.com).
DBpedia 3.9 (wiki.dbpedia.org/Downloads39)
Sẵn có
Lưu trữ
Khai thác
Simple Protocol and RDF Query Language (SPARQL)
Dbpedia site (http://dbpedia.org).
Ngôn ngữ truy vấn
Vấ�n đê� nghiên cứu
Title
……
Info2
Info1
Mô hình truy vấn trên Wikipedia.
Info3 Entity
……
Vấ�n đê� nghiên cứu
Info 1
Info… Info n
Entity 1
Info 2
Title in
hereEntity n
Title in
here
Entity 4
Title in
hereEntity …
Entity 3
Title in
here
Entity 2
Vấ�n đê� nghiên cứu- GiaDi pháp
SPARQL
HoDi - Đáp
Xin caDm ơn!