Upload
harald-sack
View
2.079
Download
0
Embed Size (px)
DESCRIPTION
Folien für die 1. Vorlesung Semantic Web Technologien, WIntersemester 2011/12, Hasso-Plattner-Institut, Universität Potsdam, Harald Sack18.10.2011
Citation preview
VorlesungDr. Harald Sack
Hasso-Plattner-Institut für SoftwaresystemtechnikUniversität Potsdam
Wintersemester 2011/12
Semantic Web Technologien
Blog zur Vorlesung: http://wwwsoup2011.blogspot.com/
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
1. Einführung 2. Semantic Web Basisarchitektur
Die Sprachen des Semantic Web - Teil 1
3. Wissensrepräsentation und LogikDie Sprachen des Semantic Web - Teil 2
4. Semantic Web Anwendungen
2
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
1. Einführung 1.1.Vom Internet zum Web 2.0
...eine historisch motivierte Einführung
1.2.Quo Vadis WWW? ...die Grenzen des WWWs
1.3.Semantic Web...die Perspektiven eines „intelligenten“ WWWs
1.4.Semantic Web Anwendungen...die Anfänge eines semantischen WWWs
3
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
4 Es war einmal....das Internet
ARPANET, 29. Oktober 1969
J.C.R. LickliderARPA IPTO Director
(1962-1964)
Robert TaylorARPA IPTO Director
(1966-1969)
Larry RobertsARPA IPTO Chief Scientist
(1966-1973)
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
5 Es war einmal....das Internet
Larry RobertsARPA IPTO Chief Scientist
(1966-1973)
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
6 Das Internet - Rechnerzentrierte Verarbeitung • Wie gelangte der Benutzer zu Informationen?
1.Terminal öffnen2.Verbindung zu entfernten Rechner
herstellen3.Dateien des entfernten Rechners
durchsuchen4.Datei von entfernten Rechner auf
lokalen Rechner übertragen5.Datei auf lokalem Rechner lesen
Problem:•Expertenwissen zum Informationszugriff notwendig•Informationszugriff sehr aufwändig•Informationsrecherche sehr aufwändig
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
7
Das World Wide Web wurde 1990 am europäischen Kernforschungszentrum CERN geboren
Robert CailliauSir Tim Berners-Lee
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
8 Das WWW - Dokumentenzentrierte Verarbeitung • Wie gelangt der Benutzer zu Informationen?
1.Browser öffnen2.Dokument laden3.Hyperlink zum nächsten Dokument
anklicken
Vorteile:•Informationszugriff ohne Expertenwissen•Informationszugriff sehr leicht•Informationsrecherche über Suchmaschinen
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
9
• Aber die ursprüngliche Idee hinter dem WWW reicht viel, viel weiter zurück.....
Denis Diderot(1713-1784)
Jean-Baptiste le Rondd'Alembert (1717-1783)
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
10
Agostino Ramelli (1588), Le diverse et artificiose machine;
composte in lingua Italiana et Francese
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
11
Vannevar Bush(1890-1974)
vgl. Vannevar Bush, As we may think ,The Atlantic Monthly, 1945, July
Vannevar Bush schlägt 1945 das erste Hypertext-System „MEMEX“ vor
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
12 • Warum das WWW so erfolgreich werden konnte...
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
12 • Warum das WWW so erfolgreich werden konnte...
Lynx 1993
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
12 • Warum das WWW so erfolgreich werden konnte...
Lynx 1993
NCSA Mosaic 1994
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
13 • Warum das WWW so erfolgreich werden konnte...
IPadSafari 2010
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
14 • Die Grenzen des Wachstums sind noch nicht abzusehen...
http://www.isc.org/(Stand: 10/2011)
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
15 Vom Web 1.0 zum Web 2.0• Webinhalte und Anwendungen verändern sich
Informationskonsumption
Informationsproduktion
interaktive Partizipation
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
16 • Die Inhalte und die Rollenverteilung verändern sich über die Jahre...
Web 2.0 is thebusiness revolution inthe computer industrycaused by the move tothe Internet asplatform, and anattempt to understandthe rules for successon that new platform " -- Tim O'Reilly, 2003
Semantic Web Technologien Vom Internet zum Web 2.0
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
17 1. Einführung 1.1.Vom Internet zum Web 2.0
...eine historisch motivierte Einführung
1.2.Quo Vadis WWW? ...die Grenzen des WWWs
1.3.Semantic Web...die Perspektiven eines „intelligenten“ WWWs
1.4.Semantic Web Anwendungen...die Anfänge eines semantischen WWWs
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
18 Wie findet man etwas im WWW?
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
19 Das WWW ist ,ziemlich groß‘•ca. 25 x 109 in Suchmaschinen
indizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005)
•Web Crawler: > 1012 Dokumente(The Official Google Blog: We knew the Web was Big....., Juli 25, 2008)
•Google Search Index Caffeine umfasst ca.100 Million Gigabytes i.e. 1017 Byte (SMX Video: Google’s Matt Cutts On Caffeine Launch, June 9, 2010,http://searchengineland.com/smx-video-googles-matt-cutts-on-caffeine-launch-43933)
•DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001)
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
20 Multimedia, Real-Time Data, Sensor Data, ....
in 06/2010: 7 TB/day new overall data in 05/2011: 155 million tweets/day
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
21 Multimedia, Real-Time Data, Sensor Data, ....
in 12/2010: •48 h of video upload / minute•3 billion streamed videos per day
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
22 Multimedia, Real-Time Data, Sensor Data, ....
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
23 Multimedia, Real-Time Data, Sensor Data, ....
Semantic Web Technologien Quo vadis WWW ?
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
24
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
24
•was ist wichtig, was nicht?•was ist Information, was ist Werbung?
•was bedeutet die Information?
•wie glaubhaft ist die Information?
•was gehört zusammen?•was ist redundant?
•Der Mensch verfügt über Kontextwissen / Weltwissen und kann daher Information (meist) richtig deuten…
Information im WWW
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
25
• Das WWW ist für die Nutzung durch den Menschen bestimmt
• Das WWW basiert auf der Markupsprache HTML
• HTML beschreibt• wie Informationen dargestellt werden sollen • wie Informationen miteinander verknüpft werden • aber nicht, was diese Informationen bedeuten….
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
26
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
27
Die Semantik (griech. σεμαντικος = zum Zeichen gehörend, Bedeutungslehre) ist das Teilgebiet der Sprachwissenschaft (Linguistik), das sich mit •Sinn und •Bedeutung
von Sprache beziehungsweise sprachlichen Zeichen befasst.
Die Semantik kümmert sich um die Frage, wie Sinn und Bedeutung von komplexen Begriffen aus denen von einfachen Begriffen abgeleitet werden können und stützt sich dabei in der Regel auf die Syntax.
Die Bedeutung (Semantik) einer Nachricht ist abhängig von Kontext und Pragmatik.
Semantik
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
28
Syntax (griech. σψνταξις = Zusammenstellung, Anordnung) bezeichnet in der Grammatik die Lehre vom Satzbau. • In den formalen Sprachen versteht man unter der Syntax ein
System von Regeln, nach denen erlaubte Konstruktionen bzw. wohlgeformte Ausdrücke aus einem grundlegenden Zeichenvorrat (Alphabet) gebildet werden.
• In der Informatik steht die Syntax für die normative Struktur von Daten.
Syntax
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
29
Der Kontext (lat. contextus = verflochten) wird durch das Umfeld eines Wortes (Begriffes) im Text bzw. dessen Zusammenhang mit umgebenden Worten (Begriffen) und weiteren damit im Bezug stehenden Elementen gebildet.
Der Kontext bezeichnet alle Elemente einer Kommunikationssituation, die das Verständnis einer Äußerung bestimmen, wie z.B. • allgemeiner Kontext:
Ort, Zeit und Handlungszusammenhang einer Nachricht• persönlicher bzw. sozialer Kontext:
Beziehung zwischen Sender und Empfänger einer Nachricht
Kontext
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
30
Die Pragmatik (griech. πραγμα = Handlung) spiegelt die Absicht wieder, in der die Sprache benutzt wird bzw. eine Nachricht kommuniziert wird.
In der Linguistik bezeichnet die Pragmatik die Lehre vom Gebrauch von Sprache in unterschiedlichen Situationen. Sie untersucht, in welcher Weise der Kontext einer Nachricht Einfluss auf deren Bedeutung besitzt.
Pragmatik
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
31
Die Semantik im WWW ist nicht explizit... Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
32
Problemfeld 1: InformationssucheDienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
32
Problemfeld 1: Informationssuche
• Keyword-Suche führt zu vielen nicht relevanten Ergebnissen•Bedeutungsunterschiede•Homonyme• unterschiedlicher Kontext
• Keyword-Suche findet nichtalle relevanten Ergebnisse• Synonyme• fehlende
Kontextpräzisierung
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
33
Problemfeld 2: InformationsextraktionDienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
33
Problemfeld 2: Informationsextraktion
•kann nur von menschlichem“Agenten“ korrekt durchgeführt und bewertet werden
•heterogene Anordnung von Information
•Software-Agent verfügt nicht über• Kontextwissen• Weltwissen
• um Informationen aus der Text-/ Bilddarstellung zu lösen
Dienstag, 18. Oktober 11
Problemfeld 2: Informationsextraktion
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
34
Dienstag, 18. Oktober 11
Problemfeld 2: Informationsextraktion
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
34
• implizites Wissen, d.h. Informationen, die nicht explizit spezifiziert werden, müssen durch logische Schlussfolgerungen aus der Kombination vorhandener Informationen ermittelt werden
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
35
Problemfeld 3: WartungDienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
35
Problemfeld 3: Wartung
• je komplexer und größer eine WebSite, desto aufwändiger die Wartung der oft nur schwach-strukturierten Daten
• Probleme:• syntaktische und
semantische (Link)konsistenz• Korrektheit• Aktualität
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
36
Problemfeld 4: PersonalisierungDienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
36
Problemfeld 4: Personalisierung
• Anpassung des dargestellten Informationsinhalts an die persönlichen Bedürfnisse und Anforderungen
• Probleme: • „woher kommen die
benötigten Informationen?“• Personalisierung vs.
Privatsphäre
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
37
GAME OVER
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
38 1. Einführung 1.1.Vom Internet zum Web 2.0
...eine historisch motivierte Einführung
1.2.Quo Vadis WWW? ...die Grenzen des WWWs
1.3.Semantic Web...die Perspektiven eines „intelligenten“ WWWs
1.4.Semantic Web Anwendungen...die Anfänge eines semantischen WWWs
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
39
Tim Berners-Lee, Semantic Web Roadmap, Sept 1998
„The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help… “
Vom World Wide Web zum Web of Data
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
40
Vom World Wide Web zum Web of Data
Voraussetzung:• Inhalte können von Maschinenkorrekt gelesen und interpretiert(=verstanden) werden
Natural Language Processing• Technologie des klassischen Information Retrievals (WWW Suchmaschinen)
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
41
Vom World Wide Web zum Web of Data
Voraussetzung:• Inhalte können von Maschinenkorrekt gelesen und interpretiert(=verstanden) werden
Natural Language Processing• Technologie des klassischen Information Retrievals (WWW Suchmaschinen)
Semantic Web• Web-Inhalte in natürlicher Sprache
werden explizit annotiert mit semantischen Metadaten
• Semantische Metadaten kodieren die Bedeutung (Semantik) des Web-Inhalts und können von Maschinen korrekt gelesen und interpretiert werden
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
43 Inhalte im Web maschinell „verstehen“ (I)
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
43 Inhalte im Web maschinell „verstehen“ (I)Text: „Jetzt spricht Poldi“
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
43 Inhalte im Web maschinell „verstehen“ (I)Text: „Jetzt spricht Poldi“
Lukas Podolski ?
Entity MappingDisambiguierung
• DisambiguierungAuflösung sprachlicher Mehrdeutigkeiten
Leopold Holusek ?
Leopold Kielholz ?
Deutscher Fußballspieler
Deutscher Tischtennisspieler
Schweizer Fußballspieler
Poldi Kladno ? Tschechischer Fußballverein
Poldi ? Drache bei „Hallo Spencer“
Lukasz Podolski ? Polnischer Radrennfahrer
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (II)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
44
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
• Die Bedeutung (Semantik) der Entitätenund Klassen muss ebenfalls explizit definiert werden.
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (II)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
44
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
Fußballspieler
ist ein
Klasse• Die Bedeutung (Semantik) der Entitäten
und Klassen muss ebenfalls explizit definiert werden.
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (II)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
44
Text: „Jetzt spricht Poldi“
Lukas Podolski
Entitäten-zuweisung
Entität
Fußballspieler
ist ein
Klasse
Person
ist eine
Klasse
• Die Bedeutung (Semantik) der Entitätenund Klassen muss ebenfalls explizit definiert werden.
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (III)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
45
Lukas Podolski (entity)
Fußballspieler
ist ein
(class)
Class-membership hat Typ
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (III)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
45
Lukas Podolski (entity)
Fußballspieler
ist ein
(class)
Class-membership hat Typ
Person
ist ein
(class)
superclass
subclass
Ist Subklasse von
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (IV)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person
ist einEntities
Classes
ist ein
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (IV)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlace
ist einEntities
Classes
ist ein
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (IV)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlace
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (IV)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlaceDate hasBirthDate
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Inhalte im Web maschinell „verstehen“ (IV)
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
46
• Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt
Lukas Podolski
Fußballspieler
Person PlacehasBirthPlaceDate hasBirthDate
ist einEntities
Classes
ist ein
GliwicehasBirthPlace
ist ein
hasBirthDate1985-06-04
ist ein
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
47
Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, 284(5), pp. 34-43(2001)
Was ist das Semantic Web?
„The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation"
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
48•Die Bedeutung der Informationen (Semantik) wird durch standardisierte Wissensrepräsentationen (Ontologien) explizit formalisiert (strukturiert)
• Damit wird es möglich,
•die Bedeutung der Informationen maschinell zu verarbeiten
•unterschiedliche (heterogene) Daten miteinander in Beziehung zu setzen
•implizite (nicht offensichtliche) Information aus der vorhandenen (offensichtlichen) Information automatisch zu folgern
Das Semantic Web ist eine Art globaler Datenbank, die ein universales Netz semantischer Aussagen bereit hält
Das Semantic Web - a Web of Data
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
49
Das Semantic Web
•
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
50
Lukas Podolski http://dbpedia.org/resource/Lukas_Podolski
URI - Uniform Resource Identifier
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
51
http://dbpedia.org/resource/Lukas_Podolski
http://de.wikipediapedia.org/wiki/Lukas_Podolski
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
52 http://dbpedia.org/resource/Lukas_Podolski
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
53
http://dbpedia.org/resource/Lukas_Podolski
RDF Resource Description Framework
:Lukas_Podolski dbpp:birthPlace :Gliwice .:Lukas_Podolski dbpp:birthDate “1985-06-04“ .:Lukas_Podolski rdfs:type dbpo:SoccerPlayer .:Lukas_Podolski rdfs:type dbpo:Person ....
:Lukas_Podolski rdf:type dbpo:SoccerPlayer .
RDF Tripel RDF Subject RDF Property RDF Object
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
54
http://dbpedia.org/ontology/SoccerPlayer
dbpo:SoccerPlayer rdf:type owl:class .dbpo:SoccerPlayer rdfs:subClassOf dbpo:Person .dbpo:SoccerPlayer rdfs:label “SoccerPlayer“ .dbpp:birthPlace rdf:type rdf:Property .dbpp:birthPlace rdfs:domain dbpo:Person .dbpp:birthPlace rdfs:range dbpo:Place .dbpp:birthDate rdf:type rdf:Property .dbpp:birthDate rdfs:domain :Person .dbpp:birthDate rdfs:range xsd:date ....
RDF Schema
Person PlacehasBirthPlaceDate hasBirthDate
SoccerPlayer
is a
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
55
Lukas Podolski
LivingPeople
PersonDate
hasBirthDate1985-06-04
hasBirthDate
is a
is a
is a
DeadPeople∩ =∅
logical constraintis a
+ Regeln (Beschreibungslogiken)
∀x.∃y.hasDeathDate(x,y) ∧ Person(x) ∧ Date(y) → DeadPeople(x)
entities
classes
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
56
SELECT DISTINCT ?l ?l2 ?g FROM <http://dbpedia.org> WHERE { ?s dbpp:nationalteam ?o . ?s rdfs:label?l FILTER langMatches( lang(?l), "EN" ) . ?s dbpp:nationalgoals ?g FILTER(?g>10). ?s dbprop:nationalteam ?nat . ?nat rdfs:label ?l2 FILTER langMatches( lang(?l2), "EN" ).} ORDER BY DESC(?g)
Suche alle Fußballer, dieals Nationalspieler mehr als 10 Tore geschossenhaben
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
57 Suche alle Fußballer, die als Nationalspieler mehr als 10 Tore geschossen haben
Semantic Web Die Perspektiven eines intelligenten Webs
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
58 Suche alle Fußballer, die als Nationalspieler mehr als 10 Tore geschossen haben
Semantic Web Die Perspektiven eines intelligenten Webs
Problem: Datenqualität....
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
59 1. Einführung 1.1.Vom Internet zum Web 2.0
...eine historisch motivierte Einführung
1.2.Quo Vadis WWW? ...die Grenzen des WWWs
1.3.Semantic Web...die Perspektiven eines „intelligenten“ WWWs
1.4.Semantic Web Anwendungen...die Anfänge eines semantischen WWWs
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
60 Linked Data□ Linked Open Data (LOD) bezeichnet im WWW frei verfügbare (RDF)-Daten, die per URI
identifiziert werden und damit direkt via HTTP abgerufen werden können und ebenfalls via URI auf andere Daten verweisen.
Semantic Web Technologien Semantic Web Anwendungen
The ,Web of Data‘• >31 billion facts• >500 million links
(Stand Okt. 2011)
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
61
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
62
Was ist das Besondere an der BBC Music Website?• Informationen werden aus externen, öffentlich
verfügbaren Daten automatisch aktuell zusammengestellt (Wikipedia, MusicBrainz,...)
• kein Screen Scraping der Website• kein spezielles API• Daten liegen im (Semantic) Web als Linked Open
Data vor• Zugriff über gewöhnlichen HTTP Request• Daten sind stets auf dem aktuellsten Stand, ohne
dass manueller Eingriff nötig
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
63
Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
63
Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
63
Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“
• Nachfrage zu “GOLF“: PKW oder SPORTART oder SONSTIGES ?Verfeinerung: PKW
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
64Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“
• Name: Volkswagen Golf• Kategorie: Auto• ...• Baujahr <Integer>• technischer Parameter• Hubraum <Integer>• Leistung <Integer>• ...
• ...
Wissensrepräsentation(Ontologie, Linked Data)
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
64Suchmaschinen - Document Retrieval•Eingabe in Suchmaschine: “GOLF von 2000“
•Nachfrage zu “2000“: Baujahr oder technische Parameter?Verfeinerung: Baujahr
• Name: Volkswagen Golf• Kategorie: Auto• ...• Baujahr <Integer>• technischer Parameter• Hubraum <Integer>• Leistung <Integer>• ...
• ...
Wissensrepräsentation(Ontologie, Linked Data)
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
65Suchmaschinen - Document Retrieval•Generelle Probleme:
•Korrekte Interpretation der Suchphrase
•Korrekte Identifikation von Entitäten
•Automatische Disambiguierung
•Usability
•Personalisierung
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
66
Suchmaschinen - Fact Retrieval•Eingabe in Suchmaschine:
“Wo kann ich hier am günstigsten tanken?“
Antwort: - Hohenfelden, xy-Str. 32 -> Super verbleit, 1,99 € - Route wird an das Navigationssystem weitergegeben - Leistung wird gedrosselt, damit das Benzin ausreicht…
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
67
Suchmaschinen - Explorative Suche•Oft weiß der Benutzer gar nicht exakt, was er eigentlich sucht
•Bsp. „Suche Texte ähnlich den Texten von Ernest Hemingway“
dbpedia:ontology/influences dbpedia:ontology/influences
Ezra Pound Ernest Hemingway J.D. Salinger
Suchmaschine nutzt externes Wissen, um Vorschläge (Recommendations)zu generieren und um mögliche Suchpfade aufzuzeigen...
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
68 Intelligente Agenten im Semantic Web
Anwender
Suchdienst(z.B. Google)
WWW-Dokumente
Präsentationsdienst(z.B. Firefox)
WWWheute
WWW - Dokumente
SemanticWebAnwender
persönlicherAssistent
intelligenteInfrastrukturdienste
Semantic Web Technologien Semantic Web Anwendungen
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
69 3 Generationen von Web-Dokumenten
Semantic Web Technologien Semantic Web Anwendungen
statischeWeb-Seiten
HTML / CSS
1. Generation
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
69 3 Generationen von Web-Dokumenten
Semantic Web Technologien Semantic Web Anwendungen
statischeWeb-Seiten
HTML / CSS
1. Generation
interaktiveWeb-Seiten
dynamischeWeb-Seiten
JavaScript / Applets
DatenbankzugriffTemplate-basierte
Generierung
2. Generation
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
69 3 Generationen von Web-Dokumenten
Semantic Web Technologien Semantic Web Anwendungen
statischeWeb-Seiten
HTML / CSS
1. Generation
interaktiveWeb-Seiten
dynamischeWeb-Seiten
JavaScript / Applets
DatenbankzugriffTemplate-basierte
Generierung
2. Generation
adaptiveWeb-Seiten
virtuelleWeb-Seiten
BenutzermodelleMachine Learning
Online Layout
NetbotsInformationsextraktionPräsentationsplaner
3. Generation
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
70 Werkzeugkasten für das Semantic Web•Sprachstandards, mit denen Semantik der Information im Web
ausgedrückt werden kann (XML/XSD, RDF(S), OWL, RIF)•Werkzeuge, um die Semantikinformation im Web nutzen zu können
(RDFa, GRDDL, ...)
•Beteiligung vieler unterschiedlicher Disziplinen der Informatik:• Künstliche Intelligenz
• Computer Linguistik
• Kryptografie
• Datenbanktechnik
• Theoretische Informatik
• Rechnerarchitektur
• Software Engineering
• Systemtheorie
• Computernetzwerke
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
1. Einführung 1.1.Vom Internet zum Web 2.0
...eine historisch motivierte Einführung
1.2.Quo Vadis WWW? ...die Grenzen des WWWs
1.3.Semantic Web...die Perspektiven eines „intelligenten“ WWWs
1.4.Semantic Web Anwendungen...die Anfänge eines semantischen WWWs
71
Semantic Web Technologien Vorlesungsinhalt
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
72
Wie geht‘s weiter...?
URI/URL - Bezeichner und Bezeichnetes
XML und XML Schema - eine Auffrischung....
Resource Description Framework
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
73
• P. Hitzler, S. Roschke, Y. Sure: Semantic Web Grundlagen, Springer, 2007.
• P. Hitzler, M. Krötzsch, S. Rudolph:Foundations of Semantic Web Technologies,CRC Press, 2009.
Semantic Web Technologien Literatur
Dienstag, 18. Oktober 11
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
74
• T. Heath, Ch. BitzerLinked Data - Evolving the Web into a Global Data Space,Morgan & Claypool, 2011.
Semantic Web Technologien Literatur
Dienstag, 18. Oktober 11
Materialien
□Bloghttp://wwwsoup2011.blogspot.com/
□Webseitehttp://www.hpi.uni-potsdam.de/studium/lehrangebot/veranstaltung/semantic_web_technologien.html
□bibsonomy - Bookmarkshttp://www.bibsonomy.org/user/lysander07/swt1112_01
Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam
75
Semantic Web TechnologienMaterialien
Dienstag, 18. Oktober 11