33
Betrieb s- systeme und Verteil te Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte Suche nach Web-Diensten

Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

Embed Size (px)

Citation preview

Page 1: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

Betriebs-systeme

und Verteilte Systeme

Description LogicsMarc Holger Uhlmann

SeminarvortragPaderborn, 15. Dezember 2004

Projektgruppe Peer-2-Peer basierte Suche nach Web-Diensten

Page 2: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

2

Agenda

Motivation und Grundlagen

Die Basis Description Logic FL-0

Syntax

Semantik

Erweiterungen (Dialekte)

Von der Description Logic zum DL-Reasoner Terminologien

Assertions

Inferenz

Grundlegende Konzepte von Inferenzalgorithmen Structural Subsumption Algorithmen

Tableau-based Subsumption Algorithmen

Page 3: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

3

Motivation für Description Logics

Ursprünge der Forschung: Künstliche Intelligenz (KI)

Formalismen

zur formalen Repräsentation von Domänenwissen über einen Ausschnitt der Welt

für ein effizientes Handling des Domänenwissens

zum expliziten Folgern impliziten Wissens

Motivation: Nutzen dieses Wissens

diverse Anwendungsgebiete→ Semantic Web

Für unsere Projektgruppe: Einsatz von Wissen für die Suche nach Webservices

„Die KI ist der Zweig der Informatik, der sich mit symbolischen Methoden der Lösung von Problemen beschäftigt“ [Kurzweil]

Page 4: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

4

Ziel: Description Logics für die Projektgruppe

Repräsentation von Wissen über Hardware, Software und Kompatibilitäten

Effizientes Ableiten von expliziten Informationen aus implizitem Wissen

Wissensbasis

allgemeingültigesWissen

konkretes Situationswissen

Inferenzsystem

Benutzerschnittstelle

Page 5: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

5

Einordnung von Description Logics

Prädikatenlogik erster Stufe: Argumente von Prädikaten ausschließlich Objektvariablen

Grund für eine neue Syntax: → variablenfreie Darstellung ist übersichtlicher und für die zu

modellierenden Problembereiche adäquater

Prädikatenlogik erster Stufe (FOL)

DL

Unäre PrädikateVater(x)

Binäre PrädikatehatKind(x,y)

Beschränkungauf 1 freie Variable → Einfachere Syntax

transitive Rollenbeschreibungen

Page 6: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

6

Grundlegende syntaktische Bausteine

Atomare Konzepte (unäre Prädikate) entsprechen Klassen (Objektorientierung) bzw.

Mengen von ObjektenBeispiele

Männlich ≡ {x | männlich(x)} Person ≡ {x | Person(x)}

Atomare Rollen (binäre Prädikate, Relationen) Beschreibung der Beziehung zwischen genau zwei Konzepten

Beispiele: hatKind ≡ {(x,y) | hatKind(x,y)}

Individuen (Konstanten) Repräsentation genau einer Entität innerhalb eines Konzeptes

Page 7: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

7

Syntax:Sei A ein atomares Konzept und R eine Rolle, so sind Konzeptbeschreibungen für C,D in FL-

0:

C, D A | primitives Konzept T | universelles Konzept

| bottom KonzeptC ⊓ D | Schnitt R.C | Wertbeschränkung

Beispiele:Informatiker ⊓ Weiblich (Eine Frau, die Informatik

studiert)

Mann ⊓ hatKind.Informatiker (Ein Mann der nur Informatiker

als Kinder hat)

Eine erste Description Language FL-0

Page 8: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

8

Semantik:Interpretation I= (, ∙) nichtleeren Menge ∙Mapping-Funktion: C → C für alle Konzepte C

R → R x für alle Rollen R

TI =

=

(C ⊓ D) = CD

( R.C) = {a | (b: (a,b) R → b C)}

FL-0: Basis für alle Description Logic Sprachen.

FL-0 einfach, aber relativ geringe Ausdrucksfähigkeit

Adäquate Erweiterungen für die jeweilige Domäne (z.B. PG P2P) Kompromiss zwischen (notwendiger) Ausdrucksfähigkeit und

Komplexität des Schlußfolgerungsprozesses.

Eine erste Description Language FL-0

Page 9: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

9

Erweiterungen von FL-0

FL- : Erweiterung um begrenzte Existenzquantifizierung

( R.) = {a | b: (a,b) R}

AL : Erweiterung um atomare Negation( A) = \

AL U : Erweiterung um die Vereinigung von Konzepten(C ⊔ D)= C D

AL E : Erweiterung um komplette Existenzquantifizierung( R.C) = {a | b: (a,b) Rb C}

AL N: Erweiterung um unqualifizierte Anzahlsbeschränkungen(≤ n R) = {a | b|(a,b) R≤ n}(≥ n R) = {a | b|(a,b) R≥ n}(= n R) = {a | b|(a,b) R= n}

AL C: Erweiterung um Negation für beliebige Konzepte( C) = \ C

Page 10: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

10

noch mehr Erweiterungen…

AL O: Erweiterung um die Aufnahme von Individuen I (Nominale) in Konzepten I = I und |(I)| = 1

AL H: Erweiterung um Rollenhierarchien(R ⊑ S)=RS

AL I: Erweiterung um inverse Rollen (R)={(a,b) x | (b,a) R}

AL Q: Erweiterung um qualifizierte Anzahlsbeschränkungen(≤ n R.C) = {a | b|(a,b) Rb C≤ n}(≥ n R.C) = {a | b|(a,b) Rb C≥ n}(= n R.C) = {a | b|(a,b) Rb C= n}

S: AL: Erweiterung um transitive RollenbeschreibungenR R+ : wenn (a,b) R und (b,c) R → (a,c) R

Notation: AL [U] [E] [N] [C] [O] [H] [I] [Q] [F]

S[H] [I] [Q] [F]

Page 11: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

11

Ziel: Verwendung eines DL-Systems für PG

Wissensbasis K=(T,A)

allgemeingültigesWissen

konkretes Situationswissen

Inferenzsystem

Benutzerschnittstelle

T Boxallgemeingültiges

Wissen

A Boxkonkretes

Situationswissen

Page 12: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

12

TBox: Terminologien

Terminologische Axiome:Machen Aussagen wie Konzepte miteinander in Verbindung stehen: C ≡ D (Äquivalenzen)

Definitionen: Äquivalenzen mit atomaren Konzept auf der linken Seite (symbolische Namen) Beispiel: Mann ≡ Person ⊓ Frau

C D (Inklusionen)⊑Beispiel: Frau ⊑ Person

Terminologie (TBOX): Eine endliche Menge von Definitionen und Inklusionen

Zyklische Defintion:Eine Definition, die definiertes in der Definition verwendetBinärbaum = Baum ⊓ ≤ 2 hatNachfolger ⊓ hatNachfolger.Binärbaum

Page 13: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

13

Definitionen, …

Normalisierung einer generalisierten Terminologie:

Für alle Inklusionen mit C ⊑ D:→ Ersetze C ⊑ D durch C ≡ C* ⊓ D

Damit repräsentiert C* den Unterschied von C zu D

Eine Interpretation I erfüllt eine Äquivalenz mit C ≡ D genau dann, wenn C = D

Eine Interpretation I erfüllt eine Inklusion mit C ⊑ D genau dann, wenn C D

Modell einer Terminologie (TBox) T: Interpretation I ist genau dann ein Modell, wenn I alle Axiome der Terminologie T erfüllt.

Page 14: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

14

Beispielhafte TBox & Expandierung

Frau Person⊑oder

Frau ≡ Person ⊓ Weiblich Mann ≡ Person ⊓ Frau Mutter ≡ Frau ⊓ hatKind.Person Vater ≡ Mann ⊓ hatKind.Person Elternteil ≡ Mutter ⊔ Vater Großmutter ≡ Mutter ⊓ hatKind.Elternteil

Frau ≡ Person Weiblich⊓ Mann ≡ Person ⊓ (Person ⊓ Weiblich) …

Expansionen können exponentiell groß werden und sind ausschließlich bei azyklischen Terminologien berechenbar

Page 15: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

15

ABox: Assertions

Spiegeln das konkrete Situationswissen (world description) Arten von Assertions:

a, b, c: Namen von Individuen, C: Konzept, R: Rolle:

Concept Assertion C(a): a gehöhrt zu (der Interpretation von) C

Role Assertion R(b, c): c ist Rollenfüller der Rolle R für b

Beispiele:Mutter(Elfriede) Elfriede ist eine MutterFrau(Bettina) Bettina ist eine FrauhatKind(Elfriede, Bettina) Bettina ist das Kind von Elfriede

Assertions in der ABox sind syntaktische Konstrukte→ Erweiterung der Semantik um Interpretationen von Individuen

Page 16: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

16

ABox: Semantik für Individuen

Erweiterung der Interpretation I = (, ∙)mit∙ : Funktion: a → a für alle Individuen a.

a b→a b: unique name assumption (UNA) Eine Interpretation I erfüllt die

Concept Assertion C(a) genau dann, wenn a C

Role Assertion R(b,c) genau dann, wenn (b,c R

Modell einer ABox A: Interpretation I genau dann, wenn I alle Assertions einer ABox A erfüllt.

(Wdh.)Modell einer Terminologie (TBox) T: Interpretation I genau dann, wenn I alle Axiome der Terminologie T erfüllt.

Modell einer ABox A bezüglich einer TBox T:Interpretation I, genau dann wenn I ein Modell der ABox A und gleichzeitig der TBox T ist.

Page 17: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

17

Der Weg zur Inferenz (1)

Woran sind wir bezüglich Konzepten interessiert? Erfüllbarkeit (satisfiability):

Ein Konzept C ist erfüllbar bezüglich einer TBox T wenn es ein Modell I von T gibt, so dass C nicht leer ist. (I ist Modell von C)

Inklusion (subsumption):Ein Konzept C wird von einem Konzept D bezüglich einer TBox T inkludiert wenn C D für jedes Modell I von T. (C ⊑T D)

Äquivalenz (equivalence):Zwei Konzepte C und D sind bezüglich einer TBox T äquivalent wenn C Dfür jedes Modell I von T. ((C ≡ T D) )

Disjunktheit (disjointness):Zwei Konzepte C und D sind disjunkt bezüglich einer TBox T wenn CD= für jedes Modell I von T.

Alle Aussagen können auf Inklusion, Erfüllbarkeit bzw. Konsistenz reduziert werden:→ 1 Algorithmus zur Beantwortung aller Fragestellungen

Page 18: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

18

Der Weg zur Inferenz (2)

Woran sind wir bezüglich Assertions interessiert? Konstistenz einer ABox A (bezüglich einer TBox T)

Es existiert eine Interpretation I, die Modell für A (und T) ist

Instance-CheckEine ABox A zieht eine assertion C(a)nach sich (A ⊨ C(a) ), wenn jede Interpretation, die A erfüllt auch C(a) erfüllt. A ⊨ C(a) genau dann, wenn A { C(a)} konsistent ist.

Retrieval-ProblemFinde alle Individuen a für eine ABox A und ein Konzept C mit:A ⊨ C(a)

Realization-Problem (Dual zum Retrieval-Problem)Welches Konzept C realisiert für ein gegebenes Individuum a den Schluß: A ⊨ C(a), es gibt kein D mit (D ⊑ C und A ⊨ D(a) )

Erfüllbarkeit eines Konzeptes C:C erfüllbar genau dann, wenn {C(a)} konsistent (a beliebig)

Page 19: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

19

Open-World-Assumption(1): Ödipus

Informationen in einer ABox sind grundsätzlich unvollständig→ Vorsicht beim Inferenzprozess und bei der Entwicklung derWissensbasis (Knowledge Engineering)

Ödipus

Iokaste

Polyneikes

Thersandros

≡ hatKind

Die Wahrheit

hatKind(Iokaste, Ödipus)hatKind(Ödipus, Polyneikes)hatKind(Iokaste, Polyneikes)hatKind(Polyneikes, Thersandros)

VaterMörder(Ödipus)VaterMörder(Thersandros)

Die Fakten

Hat Iokaste ein Kind, das ein Vatermörder ist; dessen Kind jedoch kein Vatermörder ist?

A (⊨ hatKind(VaterMörder ⊓ hatKind. VaterMörder)) (Iokaste)?

Die Frage

Page 20: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

20

Open-World-Assumption (2): Inferenz

Ödipus

Iokaste

Polyneikes

Thersandros

≡ hatKind

Interpretation I1

Ödipus

Iokaste

Polyneikes

Thersandros

≡ hatKind

Interpretation I2

Sowohl in der Interpretation I1 als auch in der Interpretation I2

hat Iokaste ein Kind das ein Vatermörder ist; dessen Kinde jedoch kein Vatermörder ist.

→ A (⊨ hatKind(VaterMörder ⊓ hatKind.VaterMörder)) (Iokaste)?

Page 21: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

21

Structural Subsumption Algorithmen

Reduktion auf Inklusion

C ist unerfüllbar C ⊑

C ≡ D C D und D C ⊑ ⊑ CD= (C ⊓ D) ⊑

Idee:

Test auf Inklusion von Konzepten

Algorithmen zum Vergleich syntaktischer Strukturen

Schwächen

unvollständig: Es werden Inklusionen übersehen

keine Unterstützung von Negation, Disjunktion und kompletter Existenzquantifizierung → Ausdrucksfähigkeit begrenzt

erlauben keine zyklischen Terminologien

→ Entwicklung einer effizienteren Strategie

Page 22: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

22

Tableau-based Subsumption Algorithmen (1)

Keine direkte Prüfung auf Inklusion: sondern Reduzierung von Inklusion auf Erfüllbarkeit:

C ⊑ D genau dann, wenn C ⊓ D unerfüllbar

Idee: Wenn (C ⊓ D) unerfüllbar → C ⊑ D Finden einer Interpretation I mit (C ⊓ D) Lösung entspricht der eines Constraintproblems

Page 23: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

23

Tableau-based Subsumption Algorithmen (2)

Vorgehen

leere ABox A

Initialisierung von A mit A:={(C ⊓ D)(x)}

Sukzessive Anwendung von konsistenzerhaltenden Transformationsregeln:→ Menge von ABoxes S:={A1,…, Ak}

Die initialisierte ABox ist konsistent genau dann wenn mindestens eine ABox Ai (mit 1≤ i ≤ k ) konsistent ist.

Lösung von ausdrucksstarken DL-Dialekt erfordert (theoretisch) exponentiellen Zeitaufwand

Optimierungen von Tableau-Based Algorithmen: → In der Praxis sehr effizient

Einsatz in derzeitigen DL-Reasoner (Racer, Fact)

Page 24: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

24

Fazit

Description Logics: neue effiziente Form der Wissensrepräsentation

Die Basis Description Logic FL-0

Syntax

Semantik

Erweiterungen (Dialekte)

→ gute Skalierbarkeit durch Anpassung der Ausdrucksfähigkeit

Von der Description Logic zum DL-Reasoner Terminologien, Assertions & Inferenz

Tableau-based Subsumption Algorithms Effizientes Reasoning für Description Logics

State-of-the-Art in aktuellen Reasonern

Page 25: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

25

Ausblick für die Projektgruppe P2P

Evaluierung über den Einsatz von Description Logics

Identifikation von allgemeingültigem Wissen

Entscheidung für einen Dialekt

Überführung des Wissens in eine Terminologie

Entscheidung für einen DL-Reasoner

Einbindung von Terminologien in den DL-Reasoner

Prototypische Realisierung mit konkretem Situationswissen

Wissensbasis K=(T,A, R)

allgemeingültigesWissen

konkretes Situationswissen

Inferenzsystem

Benutzerschnittstelle

Page 26: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

26

Fragen & Diskussion

Vielen Dank für Eure Aufmerksamkeit !

Page 27: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

27

Ursprünge von Description Logics (DL)

Repräsentation von Wissen in Form von:

Objektklassen (Konzepten)

Beziehungen zwischen diesen Objektklassen (Rollen)

Semantische Netzwerke, frame-based systems, KL-ONE

Mann Frau

Vater Mutter

Person

hatKind

Elternteilbeispielhaftes semantisches Netzwerk

Page 28: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

28

b a c k u p – f o l i e n

Trigger Rules als Ergänzung der TBox Komplexität für das Reasoning von Dialekten

OWL DL → Martin Steinhoffs Seminarvortrag (T8: OWL) Ian Horrocks „DAML+OIL: A Description Logic for the

Semantic Web“

Page 29: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

29

Trigger Rules

Zusätzlich zu Terminlogien (TBox) und Weltbeschreibungen (ABox) Seien C, D Konzepte:

C D„Wenn ein Individuum eine Instanz eines Konzeptes C istdann ist es auch eine Instanz des Konzeptes D“

Erweiterungen der Knowledge Base zu K = (T,A,R) Trigger Rules sind eng zu Inklusionen C D verwandt, aber:⊑

C D D C

Notation: C D K C D⊑K realisiert Beschränkung auf gültige Instanzen der ABox oder solche die durch ABox und TBox impliziert werden.

→ Durch diese Beschränkung wirkt sich das Inklusionsaxiom nicht auf Erfüllbarkeit und Inklusionsbeziehungen zwischen Konzepten aus.

Page 30: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

30

Komplexität für Inferenzprozesse

nach F. M. Donini et al: "The Complexity of Concept Languages“

Mandra
Dieses Bild wird evtl. (bei genügend Zeit)durch ein Bild ersetzt, das 1. nur die relevanten Dialekte zeigtbzw. hevorhebt2. konsistent zu meinen Bezeichnungen3. in mein Layout passt ;-)
Page 31: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

31

Algorithmen

Daten Daten

Wissen

Inferenz

Page 32: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

32

Wissensbasis

allgemeingültigesWissen

konkretes Situationswissen

Inferenzsystem

Benutzerschnittstelle

Page 33: Betriebs- systeme und Verteilte Systeme Description Logics Marc Holger Uhlmann Seminarvortrag Paderborn, 15. Dezember 2004 Projektgruppe Peer-2-Peer basierte

33

Prädikatenlogik erster Stufe (FOL)

DL

Unäre PrädikateVater(x)

Binäre PrädikatehatKind(x,y)

Beschränkungauf 1 freie Variable

transitive Rollenbeschreibungen