Upload
dachs-leibert
View
109
Download
0
Embed Size (px)
Citation preview
Sem
inar
Ag
enti
m im
Sem
anti
c W
eb
| 2
00
7-0
6-2
2
Niko Kwekkeboom
Ontologien im Semantic Web
Am Beispiel derKArsruhe ONtology and Semantic Web Infrastructure (KAON)
Informatik-Seminar im Sommersemester 2007Agenten im Semantic Web
2
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
Beispiel: Die -Suche
31. Einleitung
Suchbeispiel: „Golf“
~390.000.000 Treffer (20.06.2007)
Umfassen Golfsport, VW Golf, Golf von Mexico etc.
41. Einleitung
Suchmaschinen indizieren Webseiten
Schlüsselwörter, Häufigkeiten, Verlinkung
Ranking-Kriterien geheim
Suchmaschine abhängig von guten Nutzereingaben für qualitative Ergebnisse
Bedeutung der Suchbegriffe kann nicht interpretiert werden
Unzulänglichkeiten in den vorhandenen Suchmöglichkeiten
Beispiel: Die -Suche
Semantic Web – Status quo
51. Einleitung
Semantic Web nicht als Ablösung, sondern Erweiterung des bestehenden Webs gedacht
Aktuelles Web Sammlung von menschenverstehbaren Daten
Suchergebnisse bzw. Rechnerunterstützung im allgemeinen unbefriedigend
„The Semantic Web is not a separate Web but an extension to the current one, in which information
is given well-defined meaning, better enabling computers and people to work in cooperation.”
Tim Berners-Lee, Scientific American, May 2001
Semantic Web – Ziel
61. Einleitung
Sprachentwicklung zur Darstellung von Informationen in maschinenverstehbarer Form
Ziel: Daten maschinenverstehbarer gestalten und somit die Mensch-Maschine- und die Maschine-Maschine-Kommunikation verbessern
Der Computer weiß, ob bei der Eingabe Golf als Auto, Sport oder Ort gemeint ist
Semantic Web – Anmerkung
71. Einleitung
Semantic Web immer noch eher Idee als Technologie
Umsetzung steckt noch in den Ansätzen
Konzepte und Technologien noch in den „Kinderschuhen“
Vor allem Standardisierung dringend nötig
8
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
Schichtenmodell des Semantic Web:
Semantic Web – Architektur
92. Semantic Web Grundlagen
XML + NS + xmlschema
RDF + RDFS Dig
ital S
ign
atu
re
Ontology vocabulary
URI
Logic
Unicode
Proof
Trust
DataSelf-desc.doc.
Data
Rules
Grundlage
Unicode: Plattformunabhängige, eindeutiger Standard zur Zuordnung von Zeichen zu Zahlen
URI (Unified Resource Identifier): Identifizierung einer abstrakten oder physikalischen Ressource
Erweiterung
XML (eXtensible Markup Language): Technologie zur Formatierung von Dokumenten mit flexibler Struktur (Gegensatz zu HTML)
xmlschema: Grammatik für XML-Dokumente, Regeln für syntaktischen Aufbau
Selbst XML-Dokument
Namensräume (NS) zur Verhinderung von Konflikten eingeführt
Semantic Web – Architektur
102. Semantic Web Grundlagen
XML + NS + xmlschemaURIUnicode
RDF (Resource Description Framework)
Setzt auf XML auf
Modell zur Repräsentation vom Metadaten
Konstruktion aus Statements, bestehend aus: Ressourcen, Eigenschaften, Aussagen
RDFS (Resource Description Framework Schema):
Beschreibt die Semantik eines RDF-Dokumentes, Aufbaukriterien festgelegt
Ermöglicht Klassenbildung und somit Hierarchien und Ableitungen
Semantic Web – Architektur
112. Semantic Web Grundlagen
RDF + RDFS
Ontology: Formale Beschreibung von Gegenständen und deren Beziehungen zueinander
Basierend auf RDF(S) und Erweiterung (RDF: Programmiersprache; Ontologie: Programm)
Meist lediglich kontrollierte Vokabularien
Komplexe Relationen über Relationen eher selten gebraucht
Zentraler Bestandteil der Vision des Semantic Web
Ziel: Schaffung einer gemeinsamen Sprache
Je nach Nutzen kategorisier- und einteilbar
Nicht „die eine“ Ontologie; OWL als Empfehlung des W3C
Semantic Web – Ontologien
122. Semantic Web Grundlagen
Ontology vocabulary
Keine technologischen Erweiterungen, sondern Regelung darunter liegender Schichten
Logic: Daten in maschinenverarbeitbarer Form, ermöglicht Anfragen mit boolschen
Operatoren, Quantoren und Kardinalitätsbeschränkungen
Proof: Agenten befähigen angebotene Beweise selbstständig nachzuvollziehen
Datenquellen für Nutzer ersichtlich
Trust: Korrekte Informationen nötig, in offener Architektur schwierig sicherzustellen „trusted rating services“ zur Bewertung von Quellen
Rechtevergabe: „Wo darf ein Agent was?“
Digital Signature: Zur Missbrauchsverhinderung des Semantic Webs verlässliche digitale Signatur erforderlich
Proof und Trust bisher nur rudimentär verwendet, in Zukunft steigende Wichtigkeit
Semantic Web – Architektur
132. Semantic Web Grundlagen
Dig
ital S
ig.
LogicProof
Trust
14
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
Zur Kommunikation ist eine gemeinsame Sprache nötig, d.h.:
1.Übereinkunft über gemeinsame Symbole und Begriffe (Index),
2.deren Bedeutung (Glossar),
3.Klassifikation von Begriffen (Taxonomie),
4.Assoziation bzw. Vernetzung von Begriffen (Thesaurus/Topic Map)
5.Regeln und Wissen (Erfahrungen) darüber, welche Vernetzungen zulässig und sinnvoll sind (Ontologie).
Trifft in besonderem Maße auf die Kommunikation mit Maschinen zu
Kommunikation
153. Ontologien
Wortursprung im Griechischen: „ontos“=„sein“, „logos“=„Wort“
Ursprüngliche Bedeutung in der Philosophie: Lehre des Seins und Seienden(Abgrenzung von der Lehre der verschiedenen Lebewesen in den Naturwissenschaften)
Untersuchung und Beschreibung der Realitäten und der Existenz von Dingen
Dinge sind als Grundlage klar definiert und akzeptiert
Verwand mit der Erkenntnistheorie
Ontologien – Definition
163. Ontologien
In der Informatik umfasst der Begriff Ontologien Techniken zur formalen Modellierung von Begriffssystemen
Konstruktion daher stark kontextabhängig (Komplexität/Einsatzzweck)
Formalisiertes Modell der Welt (Domäne) oder ein Teil der Welt (Sudomäne)
Keine einheitlichen, allgemeinen, vollständigen Regeln zur Konstruktion
Hoher intellektueller und logistischer Aufwand
Ontologien – Definition: Informatik
173. Ontologien
Konzepte Relationen Regeln
Begriffe Verknüpfung zwischen Begriffen(Sind selbst Begriffe)
Logische Aussagen über Begriffe (und Relationen)
„Terminologische Kontrolle“
Hierarchische Relation
Teilweise relationsimplizit
„Homonyme“, „Polyseme“
Ordnungsrelation Einhaltung von Wertebereichen
„Synonyme“ Koordinative Beziehungen
Komplexere Zusammenhänge, z.B. Schlüsse aus Relationen
Trennung und Gruppierung:Objekt, Begriff, Benennung
Symmetrie, Transitivität
Dreigeteilter Aufbau:
Ontologien – Aufbau
183. Ontologien
Erläuterung Beispiel
Konzepte
Abstrakte Ausdrücke, in Taxonomien organisiert, stellen Elemente einer Ontologie dar
Autor, Buch, Angestellte, etc.(Taxonomie hier: Verlag)
Instanzen
Konkrete Ausprägungen von abstrakten Konzepten
Carla Muster IST EINE Angestellte
Attribute
Relationen unterschiedlichen Typs (String, Integers, Boolean etc.) von vordefinierten Datentypen, charakterisieren Konzepte
Name des Angestellten, Buchpreis, ISBN Nummer, etc.
Relationen
Stellen Beziehungen zwischen zwei oder mehr nicht hierarchischen Konzepten dar
Mario Muster „ist der Autor von“ diesem Buch
Axiome Regeln, die in modellierter Domäne ohne Beweis immer gültig sind.
„Ein Autor ist eine Person, die Bücher schreibt“, „Ein Buch wird von einem Autor erstellt“, etc.
Ontologien – Elemente
193. Ontologien
Ontologien – Typen
20
Top-Level Onthology: Weitgehend domänenunabhängiges Weltwissenz.B. Zustand, Zeit, Prozess etc. (Bsp.: „CyC“ oder „WordNet“)
Task Ontology, Domain Model Ontology: Grundlegendes (Sub-)Domänen-Vokabular
(Bsp.: „UMLS“ – Unified Medical Language System)
Application Ontology: Von Domäne und Aufgabe abhängige Konzepte und Definitionen,
i.d.R. Spezialisierung der anderen Zwei (Bsp.: „KA2 Ontology“)
Top-Level Ontology
Task OntologyDomain Ontology
Application Ontology
3. Ontologien
2 Kategorien
Traditionelle in HTML
Webbasierte auf XML
RDF/RDFS als Grundlage für:
OIL (Ontology Inference Language) – europäische Entwicklung
DAML (DARPA Agent Markup Language) – parallele amerikanische Entwicklung
Zusammenschluss zu OWL (Web Ontology Language) – gemeinsame Weiterentwicklung
Empfehlung des W3C für OWL (Februar 2004)
Ontologien – Sprachen (Schichtstruktur)
22
DAML & OIL
XML
XHTML RDF
RDFS
DAML OILOWL
3. Ontologien
HTML
Spezifikation des W3C zur Erstellung, Publikation und Verteilung von Ontologien anhand formaler Beschreibungssprache
Erlaubt Beschreibung von Wissen auf maschinenlesbare Weise;Abbildung in dieser Logik ermöglicht eine formale Syntax und lässt logisches Schließen zu
Leichte Verständlichkeit und hohe Kompatibilität durch starke Einbindung von RDF und XML Syntax
Ausdrucksmächtigkeit geht über RDF hinaus; Sprachkonstrukte werden eingeführt, um Ausdrücke ähnlich der Beschreibungslogik formulieren zu können
Zielsetzung:
„Die“ Ontologiesprache des Internet zu werden
Teilweise Anforderungen inkompatibel, daher Definiton in drei Versionen
Ontologie – Sprachen: OWL
233. Ontologien
OWL Full: Sämtliche existierende SprachkonstrukteBedeutung von vordefinierten Konstrukten veränderbarNachteil: Mit Logik-Kalkülen nichtmehr erschließbar
OWL DL: OWL Description LogicVerlangt TypenunterscheidungKlassen & Attribute brauchen eindeutige Zuordnung
OWL Lite: Eingeschränkter als OWL DLKlassen nur bezüglich Oberklasen definierbarSämtliche Relationen und Restriktionen nur auf
benannten Klassen anwendbar Nur Kardinalitäten 0 und 1
Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke
Ontologie – Sprachen: OWL
243. Ontologien
OWL Full
OWL DL
OWL Lite
Erfolg neuer Technologien hängt eng mit der Qualität verfügbarer Werkzeuge zusammen
Kategorien an Ontologie-Werkzeugen:
Entwicklungswerkzeuge
Kombinations- und Integrationswerkzeuge
Evaluationswerkzeuge
Annotationswerkzeuge
Speicher- und Anfragewerkzeuge
Lernwerkzeuge
Ontologie – Werkzeuge
263. Ontologien
Ontologien große Rolle bei der Entwicklung des Semantic Web
Entwicklung noch nicht ausgereift, somit problematisch
Keine „die“ Ontologie – fehlender Standard
Entwicklungstools für Ontologien noch in Entwicklungsphase
Ontologie – Probleme
273. Ontologien
28
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
KAON – Eckdaten
294. KAON
http://kaon.semanticweb.org
Java 1.4 Plattform
SQL-DB (JBoss/Tomcat opt.)
Open Source (GNU LGPL)
Begonnen 2001
Version 1.27 (2005)
KAON – Entwicklung
304. KAON
Entwickelt durch Forschungszentrum Informatik (FZI) Karlsruhe und AIFB (Institute of Applied Informatics and Formal Description Methods der Universität Karlsruhe)
Tool Suite zur Erstellung und Verwaltung von Ontologien (Open-Source Infrastruktur)
Module, zur Erstellung und Realisierung von ontologiebasierten Anwendungen
Unterstützt klassische Ontologien- und Wissensmanagement-Konzepte, sowie relationale Datenbanksysteme
Referenzanwendung: VISION-PortalSemantisches „browsing und querying“ PortalUnterstützt Wissensmanagement bezüglich Unternehmen, Projekten, Forschungsgebieten und Software(derzeit nicht verfügbar!)
KAON – Ontologie Sprache
314. KAON
Sprache wurde inkrementell entwickelt um Skalierbarkeit mit großen Ontologien und Wissensdatenbanken zu erhalten
Zuerst einfache an RDFS orientierte Kernsprache („Karsruhe perspective on ontologies“)
Definition von Konzepten, Relationen und teilweise Befehle hierauf
Zentral: Unterstützung der Lexikalisierung von Konzepten und Relationen
Tools: Simple Onotology Editor (KAON SOEP), Datenbank Mapper (KAON REVERSE),
Prototyp für Views auf Ontologien (KAON VIEWS)
Spätere Erweiterung („Ontology-Instance (OI) models“)
Unterstützung von logischen Axiomen (Symmetrie etc.), Modularisierung, strikte Trennung von Ontologien und Insanzen, übergreifende Objekte
Komplette Überarbeitung der KAON API
Neue Tools: KAON Portal, KAON OI-modeler
KAON – Ontologie Sprache (2)
324. KAON
Versuch 2 Sprachen parallel zu unterstützen
Bisher entwickelte proprietäre Sprache
OWL
Voller Sprachumfang von OWL für viele Anwendungen nicht benötigt
Bsp.: TEXTONTO extrahiert (semi-automatisch) semantische Zusammenhänge aus Texten
Komplexe OWL-Axiome hier überfordernd
Letztendlich gewinnt OWL Oberhand, daher neue Entwicklung
KAON – Module
334. KAON
Frontend – Hauptsächlich 2 Darstellungsformen
OI-Modeler (oimodeler)
KAON Portal (kaonportal)
Core – 2 zentrale APIs
KAON Ontology Language (apionrdf, apiproxy, engineeringserver, kaonapi, query)
RDF (rdfapi, rdfcrawler, rdfserver)
Libraries – Verschiedene Bibliotheken innerhalb KAONS auch außerhalb nutzbar
z.B. datalog, guibase, etc.
KAON – Vorführung: Workbench (OI-Modeler)
344. KAON
35
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
OWL Full: Sämtliche existierende SprachkonstrukteBedeutung von vordefinierten Konstrukten veränderbarNachteil: Mit Logik-Kalkülen nichtmehr erschließbar
OWL DL: OWL Description LogicVerlangt TypenunterscheidungKlassen & Attribute brauchen eindeutige Zuordnung
OWL Lite: Eingeschränkter als OWL DLKlassen nur bezüglich Oberklasen definierbarSämtliche Relationen und Restriktionen nur auf
benannten Klassen anwendbar Nur Kardinalitäten 0 und 1
Einfache, leicht verständliche Implementierung vs. schwache Ausdrucksstärke
Zur Erinnerung: OWL DL (Folie 24)
363. Ontologien
OWL Full
OWL DL
OWL Lite
KAON2 – Entwicklung
375. KAON2
Seit Juli 2005 Nachfolger von KAON (letzte veröffentlichte Version von KAON)
Entwickelt von Forschungskooperation aus:
Forschungsgruppe Information Process Engineering (IPE) am Forschungszentrum Informatik (FZI Karlsruhe)
Institute of Applied Informatics and Formal Description Methods (AIFB) and der Universität Karlsruhe
Information Management Group (IMG) an der University of Manchester
KAON2 vs. KAON(1)
385. KAON2
Unterscheidung durch unterstütze Ontologie Sprachen:
KAON verwendet proprietäre RDF(S) Erweiterungen
KAON2 basiert auf OWL-DL und F-Logic
Beide Systeme somit nicht kompatibel !
KAON2 – Ausstattung
395. KAON2
Entwicklungswerkzeug für Ontologien basierend auf (über APIs):
OWL-DL
SWRL (A Semantic Web Rule Language – OWL+RuleML)
F-Logic (Frame Logic)
Features
Eigener Ontologie-Server, der Remote Methoden Zugriffe zulässt (RMI)
Anfragewerkezeuge um kombinierende Abfragen zu erstellen (SPARQL Syntax)
DIG-Interface für externe Tool-Zugriffe (Bsp. Protégé)
Extraktions-Modul zur Entnahme von Instanzen aus relativen DB
KAON2 – Projekte
405. KAON2
Entwicklung teilweise duch EU IST project DIP 507483 finanziert
Verwendet in:
EU IST project OntoGov
EU IST project SEKT (und erweitert)
BMBF project SmartWeb
DLP translator (Grundlage)
KAON2 – OWL-Tools
415. KAON2
Version 0.27: 16 Funktionen (Auswahl):
dump: gibt die Axiome und Entitäten der Ontologie aus
latex: gibt die Axiome in lateX-integrierbarer Form aus
filter: entfernt alle Axiome eines Typs
count: gibt die Anzahl an Axiomen (oder Entitäten) zurück
diff: zeigt alle Axiome die eine Ontologie mehr als eine andere hat an
merge:gibt eine Ontologie mit allen Axiomen zweier Input-Ontologien zurück
deo: ersetzt “nominals” durch einfache Klassen (schwächt so die Ontologie)
populate: füllt eine Ontologie zufällig mit Instanzen
dlpconvert: wandelt eine DL Ontologie in Regeln um
satisfiable: prüft die Reichhaltigkeit einer Ontologie
KAON2 – Anmerkung
425. KAON2
Kommerzielle Version OntoBroker OWL, für Wissenschaft kostenlos
Vollständig in Java 1.5 implementiert
Benötigt JDK zur Ausführung; zusätzlich Apache ANT für Beispiele
Keine Verarbeitung von „nominals“ (Excptions bei: owl:oneOfclass und owl:hasValue)Große Kardinalitäten können (abhängig von anderen Axiomen) nicht verarbeitet werdenSomit keine volle OWL DL Abdeckung! (OWL Lite voll abgedeckt)
Dokumentation bisher nur an Beispielen vorhanden
Und was macht die Konkurrenz?
435. KAON2
Protégé sehr verbreitet
Gut dokumentiert
Volle OWL-Unterstützung
Open Source
Plugin-Nutzung
Schnittstelle zu KAON2
Weitere:
CyC – Abbildung Weltwissen
WordNet – Wörterbücher
44
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
Zusammenfassung
Ontologien als semantisch „reichste“ Ebene der Kommunikation
Ontologien als zentraler Aspekt des Semantic Web
OWL als W3C empfohlene Sprache für Ontologien
Erfolg neuer Technologien abhängig von verfügbaren Tools
Derzeit verfügbare Werkzeuge noch in den „Kinderschuhen“, nicht massentauglich
Viele Projekte/Forschung um dies zu ändern
456. Zusammenfassung
Ausblick
Große Hürde: Anwender finden, die Mehraufwand betreiben um maschineninterpretierbare Webinhalte zu erstellen
Kritische Masse an verfügbaren Inhalten muss erreicht werden, bevor Technologien nutzbar werden
Gut entwickelte Ontologien nötig um mit semantischem Markup Bedeutung herzustellen
Standardisierung erforderlich um parallel Entwicklung nicht kompatibler Systeme zu verhindern
466. Zusammenfassung
Das Semantic Web – Eine Vision
Semantisch angereicherte Daten im Web
Voll maschineninterpretierbare Daten, ermöglichen „Mitdenken“ des Rechners
Persönlicher Web Agent
Reiseplanung
Logistikplanung
Terminplanung
Fremdverfügbarkeit
Kooperative Web Agenten
etc
476. Zusammenfassung
48
1. Einleitung
2. Semantic Web Grundlagen
3. Ontologien
4. KAON
5. KAON2
6. Zusammenfassung
7. Fragen und Diskussion
Gliederung
Seminar im Sommersemester 2007:
Agenten im Semantic Web
Fragen
497. Fragen und Diskussion
Nööö…
Diskussion
507. Fragen und Diskussion
Welche Technologien außer Ontologien können noch einen großen Einfluss auf den Erfolg des Semantic Web haben?
Wo liegen die Vor- und Nachteile von modularen oder globalen Wissenssammlungen? Was überwiegt?