View
216
Download
0
Category
Preview:
Citation preview
Semantik in SuchmaschinenBeispiele
Karin Haenelt
7.12.2014
Inhalt
� Google Knowledge Graph� Freebase� schema.org
2© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Google Knowledge Graph
� Zuordnung von Suchtermen zu Weltentitäten� Darstellung von Zusammenhängen in einem Knowledge Graph
� Sammlung von Informationen über verschiedene Dinge� Beispiel Personen: Zusammenstellung von Informationen
wie Geburtsdatum oder Größe
3
http://www.youtube.com/watch?v=mmQl6VGvX-chttp://www.google.com/insidesearch/features/search/knowledge.html
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Google Knowledge Graph
� The Knowledge Graph is a knowledge base used by Google to enhance its search engine's search results with semantic-searchinformation gathered from a wide variety of sources.
� Knowledge Graph display was added to Google's search engine in 2012, starting in the United States, having been announced on May 16, 2012.[1]
� It provides structured and detailed information about the topic in addition to a list of links to other sites. The goal is that users would be able to use this information to resolve their query without having to navigate to other sites and assemble the information themselves.[2]
4
http://en.wikipedia.org/wiki/Knowledge_Graph
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
5
https://www.google.de/#q=leonardo+da+vinci 30.11.2013
http://www.google.de/intl/de/insidesearch/features/search/knowledge.html
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
6
https://www.google.de/#q=Kastanie ,30.11.2013, (6.12.2014: Reihenfolge
der Bilder geändert, aber weiterhin alle Bilder Rosskastanien)
Text aus:http://de.wikipedia.org/wiki/Kastanien
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Google Knowledge Graph
� „eine der ersten Funktionen von Knowledge Graph ist ein Feldneben den Suchergebnissen“
� „Google bereichert die Suche, indem die Informationen, die andere Nutzer nützlich fanden und die Informationen im Knowledge Graph kombiniert werden“
� „Die Suchanfragen der Nutzer lassen uns erkennen, welche Inhalte in die Datenbank aufgenommen werden sollen“
� „Je mehr die Informationen im Knowledge Graph wachsen, umso besser können wir Nutzeranfragen verstehen und die Informationen im Web einschätzen, um dann beide Aspekte sinnvoll miteinander zu verbinden.“
7
http://www.youtube.com/watch?v=mmQl6VGvX-chttp://www.google.com/insidesearch/features/search/knowledge.html
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Google Knowledge GraphDatenquellen
� online-Daten� gesammelte
� strukturierte Schemata� RDF, microformat-Daten, � Suchprotokolle� annotierte Daten aus Googles semantischer Datenbasis
Freebase� DBPedia
8
http://econsultancy.com/de/blog/62241-google-s-knowledge-graph-one-step-closer-to-the-semantic-web
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Inhalt
� Google Knowledge Graph� Freebase� schema.org
9© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase
� Datenbasis mit 1,9 Mrd. RDF-Tripeln zu den meistgesuchten� Personen� Orten� Dingen (world entities)
� 2010 von Google erworben
� Verbindung von� Internet der Dinge� Semantic Web
10
https://developers.google.com/freebase/ 30.11.2013
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase
11
https://developers.google.com/freebase/ 30.11.2013
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
http://www.freebase.com/
127.12.2014© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase – API
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
13
https://developers.google.com/freebase/ 7.12.2014
Freebase API – Suche
� Textuelle Bedingungen� Sprachspezifische Normalisierung: z.B. für Englisch:
Konvertierung in Kleinschreibung, Entfernung der Akzente� Präfixsuche� Stemming� Phrasensuche � Filter
� Sprachen, auch mehrere Sprachen gleichzeitig
14
query: "\"to be or not to be\""
query: "potatos" stemmed: true
query: "bob dy" prefixed: true
filter: "(all name:gore alias:gore type:/people/person)"
https://developers.google.com/freebase/v1/search-cookbook
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – Suche
� Schema Bedingungen mit type und domain
� Metaschema-Bedingungen: Filterung nach semantischen Prädikaten (60 unterstützte Prädikate)
15
query "john" filter: "(all type:/people/person /people/person/nationality:"Canada")"
query: "babar" domain: "/film" lang: "fr"
https://developers.google.com/freebase/v1/search-cookbook
filter: "(all discovered_by:curie)"
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – Suche
16
{ "status": "200 OK","result": [ { "mid": "/m/025scm7",
"id": "/en/radium","name": "Radium","notable": {
"name": "Chemical Element","id": "/chemistry/chemical_element"
},"lang": "en","score": 19.304518
}, { "mid": "/m/025s7y9", "id": "/en/polonium", "name": "Polonium", "notable": { "name": "Chemical Element", "id": "/chemistry/chemical_element" }, "lang": "en", "score": 18.961143 } ], "cost": 9, "hits": 2}
filter: "(all discovered_by:curie)"
https://developers.google.com/freebase/v1/search-cookbook
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – SucheScoring and Ranking
� Freebase entities have an inherent relevance score (ranking)� computed during indexing� function of its inbound and outbound link counts in Freebase
and Wikipedia� Some popular Freebase entities also have a popularity score
computed by Google� By default, both scores are combined together during queries.
17
https://developers.google.com/freebase/v1/search-cookbook
https://developers.google.com/freebase/v1/search-cookbook#scoring-and-ranking 7.12.2014
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – Suche: Metaschema
� Metaschema Eigenschaften: können zwei Funktionen haben� "super properties" (in einer Eigenschaften-Hierarchie)� mehrere Eigenschaften umfassen� z.Z (19.3.2013) über 3500 Freebase-Eigenschaften auf 46
Metaschema-Muster abgebildet
� MQL Queries (Metaweb Query Language)
18
https://developers.google.com/freebase/v1/search-metaschema
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – weitere Services
� Topic API ist ein Web Service, der zu einem gegebenen Thema alle bekannten Fakten, Bilder und Kurztexten
� Freebase Suggest Widget ist ein JQuery widget zum Einbinden auf Webseiten, das bei Suchanfragen auf der Basis von Freebase Vervollständigungsvorschläge liefert
19
https://developers.google.com/freebase/v1/topic-overview
https://developers.google.com/freebase/v1/suggest
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – Data Dumps
20
https://developers.google.com/freebase/ 30.11.2013
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase API – Data Dumps: RDFN-Tripel-Darstellung, Beispiel: Leonardo da Vinci
� 1202 Tripel (6.12.2014)
21
ns:m.04lg6 ns:architecture.architect.architectural_style ns:m.0bdgp;ns:base.argumentmaps.innovator.original_ideas ns:m.05my_3;ns:base.eating.practicer_of_diet.diet ns:m.07_jd;ns:base.kwebbase.kwtopic.assessment "Recognized as a genius, with immense energy …;…ns:visual_art.visual_artist.art_forms ns:m.06msq;ns:visual_art.visual_artist.art_forms ns:m.02csf;ns:visual_art.visual_artist.artworks ns:m.0jbg2;ns:visual_art.visual_artist.artworks ns:m.03djdc;
http://www.freebase.com/m/04lg6https://www.googleapis.com/freebase/v1/rdf/en/leonardo_da_vinci
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Freebase-Entitäten – Abbildung auf Wikipedia-Entitäten
22© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Inhalt
� Google Knowledge Graph� Freebase� schema.org
23© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Schema.org
� Markierungsvokabular , entwickelt von Suchmaschinen-Firmen wie beispielsweise Bing, Google, Yahoo! und Yandex
� standardisierte HTML-Tags zur Annotation von Webseiten
24
http://schema.org/
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
schema.org
25
http://schema.org/
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
schema.orgBeispiel: restaurant
26© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
schema.orgBeispiel: restaurant
27© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
schema.orgAnnotation: Beispiel: James Cameron
28
http://schema.org/docs/gs.html#microdata_how
© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Literatur
� Isidoro, Andrew (February 28, 2013). "Google’s Knowledge Graph: one step closer to the semantic web?". Econsultancy. Retrieved November 30, 2013. http://econsultancy.com/de/blog/62241-google-s-knowledge-graph-one-step-closer-to-the-semantic-web
� http://en.wikipedia.org/wiki/Knowledge_Graph� http://www.google.com/insidesearch/features/search/knowledge.
html� http://www.youtube.com/watch?v=mmQl6VGvX-c� https://developers.google.com/freebase/� http://schema.org/
29© Karin Haenelt, Semantik in Suchmaschinen, 7.12.2014
Recommended