22
Мова Web онтологій Web Ontology Language.RDF. Спільний формати даних CDF. Тернопіль 2015

Тема 11. RDF. Мова Web онтологій Web Ontology Language. Спільний формати даних CDF

Embed Size (px)

Citation preview

Мова Web онтологій Web Ontology

Language.RDF. Спільний формати даних

CDF.

Тернопіль 2015

RDF (Resource Description Framework) - це спосібпредставлення знань в децентралізованому світі; цеосновна технологія Семантичного Вебу, якийдозволить комп'ютерним програмам користуватисявсією структурованою інформацією, розподіленоїпо вузлах Інтернету. RDF - це не XML-формат встрогому сенсі слова; це більше, ніж простометадані.

RDF - це модель для опису об'єктів. Об'єкти можутьбути фізичними об'єктами (планети, люди, країни і т.Д.), Віртуальними об'єктами (записи в блозі, wiki-сторінки), абстрактними об'єктами (визначеннядокумента, повідомлення в чаті).

RDF

Онтологія - це система визначень об'єктів, яку

можна реалізувати з використанням RDF-

моделювання.

Семантика, в широкому сенсі слова - аналіз

відносини між мовними виразами і світом,

реальним або уявним, а також саме це відношення

(Вираз типу семантика слова) і сукупність таких

відносин (так, можна говорити про семантику деякої

мови). Дане відношення полягає в тому, що мовні

вирази (слова, словосполучення, пропозиції, тексти)

позначають те, що є у світі, - предмети, якості (або

властивості), дії, способи вчинення дій, відносини,

ситуації та їх послідовності.

Семантичні веб-сервіси (англ. Semantic Web

Services, SWS; іноді Semantic Web Web Services,

SWWS) - закінчені елементи програмної логіки з

однозначно описаною семантикою, доступні

через Інтернет і придатні для автоматизованого

пошуку, композиції і виконання з урахуванням їх

семантики. Часто називаються в тематичній

літературі «динамічної складової семантичної

павутини».

Семантична павутина — це надбудова надсучасною Всесвітньою павутиною, яка покликаназробити інформацію, що розміщена в мережі,зрозумілішою для комп'ютерів. Відомо, що майжевся інформація в Інтернеті знаходиться в текстовійформі. Не секрет також, що прогрес в галузіобробки людської мови (англ. Natural LanguageProcessing, NLP) йде дуже повільно. Комп'ютери неможуть сприйняти й осмислити словеснуінформацію, розміщену в Інтернеті, і в найближчийчас, мабуть, не зможуть. Тоді постає питання — якзмусити комп'ютери розуміти зміст розміщеної вмережі інформації і навчити їх користуватися нею?На це питання і покликана відповісти концепціясемантичної павутини. Слово «семантична» у цьомувипадку означає «осмислена», «зрозуміла».

На сьогодні комп'ютери беруть досить обмеженуучасть у формуванні й обробці інформації вмережі Інтернет. Функції комп'ютерів в основномузводяться до збереження, відображення і пошукуінформації. У той же час створення інформації, їїоцінка, класифікація й актуалізація — усе це як іраніше виконує людина. Як включити комп'ютер уці процеси? Якщо комп'ютер поки не можнанавчити розуміти людську мову, то потрібновикористовувати мову, що була б зрозумілоюкомп'ютеру. Тобто, в ідеальному варіанті, всяінформація в Інтернеті повинна розміщуватисьдвома мовами: людською мовою для людини ікомп'ютерною мовою для розуміння комп'ютера.Семантична павутина — це концепція мережі, уякій кожен ресурс людською мовою був бидоповнений описом, зрозумілим комп'ютеру.

Для створення зрозумілого комп'ютеру опису ресурсу в

семантичній павутині використовується формат RDF

(англ. Resource Description Framework), що заснований

на синтаксисі XML і використовує ідентифікатори URI для

позначення ресурсів. RDF був затверджений як стандарт

W3C у лютому 2004 року. RDF — це система опису

мережних ресурсів, зрозуміла комп'ютеру. Формат RDF

призначений для збереження метаданих (метадані —

це дані про дані). Відповідно до концепції семантичної

павутини, опис у форматі RDF повинен прикріплюватися

до кожного мережного ресурсу. Документи RDF

повинні оброблятися комп'ютером автоматично, RDF не

призначений для читання і використання людиною. На

сьогодні формат RDF вже сформувався й одержав

широке поширення, він служить каркасом для

створення семантичної павутини.

Наступним важливим напрямком концепції

семантичної павутини є мова OWL (англ. Web

Ontology Language, вимовляється), що стала

Рекомендацією W3C у лютому 2004 року. Ця мова

побудована на форматах RDF і RDFS, вона

призначена для обробки інформації в мережі.

Мова OWL має 3 ступені деталізації, що є новим

словом у комп'ютерних технологіях. Вона також

легко масштабується й узгоджується з

найсучаснішими мережними стандартами. У

2008 році було прийнято новий стандарт OWL 2.

Теоретичною основою OWL є Описова логіка.

“листковий періг семантичного вебу

(The Semantic Web Layer Cake)”

RDFS (англ. RDF Schema) — це важлива надбудова над RDF,

що дозволяє створювати класи і властивості (як в об'єктно-

орієнтованому програмуванні).

SPARQL (англ. Protocol And RDF Query Language,

вимовляється) — нова мова запитів для швидкого

доступу до даних RDF. Використовуючи звичайний

протокол і мову SPARQL, програми можуть

аналізувати RDF-описи ресурсів і отримувати з

мережі необхідну інформацію.

RIF — формат обміну правилами (англ. Rule

Interchange Format).

Ідентифікується все за допомогою URI. Притому URI

хоч і схожий на звичайні URL посилання – трохи

інший, наприклад можна визначити ресурс -

реальну людини і задати для нього URI

«http://example.org/people#Вася Пупкін».

Тверження про ресурс має має вигляд “триплет

суб'єкт-предикат-об'єкт”

Приклад

“<Www.example.org/index.html>

<www.example.org/terms/creation-date>

«16 серпня 1999».

Web Ontology LanguageМова онтологій для Web - OWL (Web Ontology

Language), так само як RDF і RDFS розроблена для

опису даних і метаданих, а також відносин між

ними і призначена для використання в комп'ютерній

обробці даних семантичного Web.

Мова OWL визначена у групі з шести рекомендацій,

прийнятої консорціумом W3 в лютому 2004 року.

Види OWL• OWL Lite (спрощена OWL) - найпростіший (длярозробників як програмних продуктів, так і додатків звикористанням OWL) вид мови;

• OWL DL (OWL Description Logics - OWL з описовоїлогікою) - вид, розроблений для використання в бізнес-додатках на основі логіки першого порядку (описовоїлогіки);

• OWL Full (повний OWL) - вид для висококваліфікованихрозробників додатків, що забезпечує повну реалізацію,виразність і синтаксичну свободу RDF але без гарантійтого, що комп'ютерна обробка даних приведе допевного результату (крім того, цей вид дуже важкий дляреалізації розробниками програмних продуктів).

Структура документа OWL

Документ OWL - це документ на мові RDF / XML,

який може містити заголовок OWL, а також містить

визначення класів, властивостей і відомостей про

представників класів. Представники класів

(individuals) за термінологією OWL - це реалізації

(екземпляри) класів.

Як розширення файлу з документом OWL можна

використовувати розширення .owl або .rdf.

Клас owl: Ontology використовується для опису

заголовка OWL, який у мові RDF / XML має

наступний синтаксис:

<owl:Ontology rdf:about="ресурс">

</ >

Опис класу OWLУ мові OWL визначено шість типів описів класів:

• за допомогою ідентифікатора класу;

• за допомогою перерахування представників класу;

• за допомогою обмеження властивостей;

• за допомогою перетину двох і більше описів класів;

• за допомогою об'єднання двох і більше описів класів;

• за допомогою доповнення опису класу.

При використанні першого типу визначення клас

задається з певним ім'ям. В інших типах клас задається

як порожній вузол з властивістю rdf: type, чиє значення

дорівнює owl: Class.

Аксіоми класівОписи класів утворюють компоненти для визначення

класів за допомогою аксіом класів. Найпростішою

формою аксіоми класу є опис класу за

допомогою ідентифікатора, проте зазвичай

аксіоми містять додаткові компоненти, що задають

необхідні та / або достатні характеристики класів.

Для комбінування опису класу в аксіому класу

використовуються наступні властивості: rdfs:

subClassOf, owl: equivalentClass і owl: disjointWith.

Властивості OWL

У мові OWL визначені наступні категорії

властивостей:

• властивості онтологій (ontology properties);

• властивості анотацій (annotation properties);

• властивості об'єктів (object properties);

• властивості типізованих даних (datatype

properties).

Представники класів в OWL

Представники класів у мові OWL визначаються за

допомогою спеціальних аксіом, також званих

фактами. В OWL для представників визначені два

типи фактів:

• факти про приналежність до класу і значеннях

властивостей;

• факти про тотожність представників.

Перелічувані дані в OWL

В OWL можна використовувати всі типи даних,

визначені в RDF. Крім цього, в OWL DL і OWL Full

можна використовувати перелічуваних дані, тобто

дані, які задаються списками своїх значень. Ці дані

задаються у OWL за допомогою властивості owl:

oneOf і класу rdf: List.

Спільний формати даних CDF

Сфера застосування – зберігання, маніпуляції і доступ до

багатовимірних наборів даних.

CDF є програмним інтерфейсом, який надає незалежний

погляд на моделіданих CDF. Останні ґрунтуються на

багатовимірних масивах, які класифікують дані за різнимизмінними, відповідними одному із спостережуваних

параметрів. Набори даних CDF відповідають базовій структурі

(basic grid structure), в якій позиція кожної задається

індексами.

КІНЕЦЬ