dbpedia

Preview:

Citation preview

http://dbpedia.org/

GVHD: Ths. Ngô Quốc Hưng.SVTH: - Hoàng Đình Hùng – 10520086

- Lê Hà Nam – 10520526 - Phan Thanh Thanh – 12520393

NỘI DUNG

1. Dữ liệu liên kê�t

2. DBpedia

3. Vấ�n đê� nghiên cứu

NỘI DUNG

1. Dữ liệu liên kê t

2. DBpedia

3. Vấ�n đê� nghiên cứu

Dữ liệu liên kê�t- Khái quát

▪ Tim Berners-Lee đặt ra trong thảo luận xoay quanh dự án Semantic Web.

▪ Mô tả phương thức tạo ra dữ liệu có cấu trúc, liên kết với nhau (để trở nên hữu ích).

▪ Xây dựng dựa trên HTTP, RDF, URI để mở rộng khả năng chia sẻ thông tin.

Dữ liệu liên kê�t- Thành phấ�n

▪ URI - Uniform Resource Identifiier (Đặc biệt là các Dereferenceable URIs).

▪ HTTP – Hypertext Transfer Protocol.

▪ RDF (Resource Description Framework).

▪ Các định dạng cú pháp tuần tự hóa: (RDFa, RDF/XML, N3, Turtle, và các thứ khác).

Dữ liệu liên kê�t- Tập dữ liệu

▪ CKAN

Ckan.org

▪ Dbpedia

Dbpedia.org

▪ GeoNames

Geoname.org

▪ UMBEL

Umbel.org

▪ FOAF

Dữ liệu liên kê�t- Nguyên lý

▪ Nhận dạng, đặt tên các thực thể (Entity) bằng URIs.

▪ Sử dụng giao thức HTTP URI để truy xuất.

▪ Cung cấp thông tin hữu ích (siêu dữ liệu, mô tả có cấu trúc) về các “thực thể được đặt tên” đó khi URI của chúng được duyệt

▪ Chứa các liên kết đến các URIs khác liên quan trong dữ liệu vừa được duyệt -> có thể duyệt các thông tin khác liên quan.

NỘI DUNG

1. Dữ liệu liên kê�t

2. DBpedia

3. Vấ�n đê� nghiên cứu

DBpedia- Khái quát

▪ Được mô tả bởi TimBerners-Lee. Dự án được bắt đầu ở Free University of Berlin và Leipzig University, phối hớp với OpenLink Software.

▪ Tập dữ liệu liên kết được trích xuất từ Wikipedia .

▪ Cấu trúc của bộ dữ liệu này được xây dựng sẵn có trên World Wide Web.

▪ Cho phép người dùng truy vấn các quan hệ và thuộc tính liên quan đến tài nguyên Wiki bao gồm các liên kết đến bộ dữ liệu.

▪Cải tiến công cụ tìm kiếm Wikipedia.▪Đưa dữ liệu Dbpedia lên trang web.▪Ứng dụng địa lý trên thiết bị di động.▪Phân lớp dữ liệu, đánh dấu và chú thích.▪Multi-Domain Ontology.▪Nucleus for the Web of Data.▪Giúp người dùng dễ dàng biên tập nội dung Wikipedia.

DBpedia- Use Cases

DBpedia- Ứng dụng

Hình 1: Thể hiện mối liên kết trong tập dữ liệu liên kết mở

DBpedia- Ứng dụng

▪ DBpedia có khá nhiê�u ứng dụng thực tiê;n: http://wiki.dbpedia.org/Applications

▪ Ví dụ: –DayLikeToday Tìm kiê�m các sự kiện lịch sửD xaDy ra trong 1 thời gian xác định, hiêDn thị theo giao diện timeline.

–AboutThiisDay.com.–DBpedia Mobile. – etca

DBpedia- Dataset

▪ Phát hành lần đầu vào ngày 23/01/2007.

▪ Phiên bản mới nhất 3.9, phát hành vào tháng 9/2013 (bao gồm 119 ngôn ngữ).

▪ Phiên bản tiếng anh hiện mô tả 4M “things”, 470M “facts”, trong đó 3,22M “things” được phân loại một cách nhất quán. (http://wiki.dbpedia.org/Downloads39)–832.000 người.–639.000 địa điểm (427 địa điểm dân cư).–372.000 công trình (116.000 âm nhạc, 78.000

bộ phim...).–209.000 tổ chức (49.000 công ty, 45.000 cơ sở

giáo dục…).–226.000 loài và 5.600 bệnh…

▪Background

DBpedia- Dataset

▪Thuộc tính

DBpedia- Dataset

NỘI DUNG

1. Dữ liệu liên kê�t

2. DBpedia

3. Vấ n đê� nghiên cứu

Vấ�n đê� nghiên cứu

Wikipedia (www.Wikipedia.com).

DBpedia 3.9 (wiki.dbpedia.org/Downloads39)

Sẵn có

Lưu trữ

Khai thác

Simple Protocol and RDF Query Language (SPARQL)

Dbpedia site (http://dbpedia.org).

Ngôn ngữ truy vấn

Vấ�n đê� nghiên cứu

Title

……

Info2

Info1

Mô hình truy vấn trên Wikipedia.

Info3 Entity

……

Vấ�n đê� nghiên cứu

Info 1

Info… Info n

Entity 1

Info 2

Title in

hereEntity n

Title in

here

Entity 4

Title in

hereEntity …

Entity 3

Title in

here

Entity 2

Vấ�n đê� nghiên cứu- GiaDi pháp

SPARQL

HoDi - Đáp

Xin caDm ơn!