Upload
territorio-creativo
View
357
Download
2
Embed Size (px)
DESCRIPTION
Tercera entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).
Citation preview
Material del curso sobre Tecnologías Semánticas en la Web de Datos
red.es, 29/11/2012
Ontology Engineering Group
Asunción Gómez-‐Pérez, Oscar Corcho García
Licencia de uso: Creative Commons Attribution-‐NonCommercial-‐ShareAlike 3.0 Unported (CC BY-‐NC-‐SA 3.0)
Más información sobre cursos disponible en: http://cursos.oeg-‐upm.net/
28/11/12
1
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Indice
1. Web de Linked Data: Conceptos Básicos A. Gómez Pérez (30 min)
2. RDF, RDF Schema y SPARQL O. Corcho (90 min)
3. Vocabularios A. Gómez Pérez (90 min)
4. Herramientas de publicación de datos para portales de datos abiertos
O. Corcho (30 min)
1
Vocabularios
Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net
Agradecimientos: D. Garijo, R. García, M. Poveda, J.A. Ramos, M.C. Suárez-Figueroa, D. Vila, L. Vilches, B. Villazón
Curso en Red.es. 29 de Noviembre de 2012
28/11/12
2
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Estadísticas: Data Cube • Bibliotecas: FRBR • Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados • Instituto Geográfico Nacional
3
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Caso de uso
¿Qué vocabularios debemos utilizar para describir en el formato de datos enlazados el organigrama de los diferentes Ministerios, las personas que forman parte de él y su
ubicación?
28/11/12
3
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Organigrama diferentes en los Ministerios
5
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Organigramas con diferente terminología
6
28/11/12
4
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Descripción de los ministros “a la carta”
7
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Diferentes formas de describir la dirección de contacto
8
28/11/12
5
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios 5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados 6. Conclusiones
9
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Clasificacion Informal
Catalogo/ID
Tesauro
Las organizaciones poseen vocabularios
ID Name Ve Vehículo 10.01 Coche 10.02 Motocicleta 10.03 Bicicleta 10.01 Vehículo 10.01.01 Rueda 10.01.02 Asiento 10.01.03 Puerta
?
?
Conocimiento implícito en los números
XX-YY-ZZ 02-01-02 02: transporte 01: carretera 02: 3 carriles
28/11/12
6
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontología
11
• Una ontología es: • Un conjunto de términos consensuados • Incluye:
• Conceptos • Taxonomias de Conceptos • Propiedades • Relaciones entre concpetos
• Visión compartida sobre cómo modelar un dominio de interés
• Implementadas en OWL o RDF(S) • Herramientas: Protégé, NeOn Toolkit, Topbraid composer, etc.
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 12
Ejemplos de ontologías
SIOC Ontology
28/11/12
7
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontologías: Conocimientos y Datos
13
13
Ontología
Instancias
Nivel de Conocimientos
Conceptos Taxonomías Relaciones Atributos Axiomas
Nivel de Datos Instancias de conceptos
Instancias de relaciones
Cer El Quijote Cervantes Es creador de
Cer
Obra Persona Es creador de
Es una Es una
Nivel de Conocimientos
Nivel de Datos
Año
Fecha de publicación
1960
Fecha de publicación
Es un
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ejemplo de ontología
28/11/12
8
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios 5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados 6. Conclusiones
15
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Vocabularios en la Web de datos
16
¿Qué vocabularios son los más utilizados?
28/11/12
9
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Modelar en la Web de Datos
Especificar
Modelar
RDF Generation
Publication
Links Generation
Exploitation
Misma visión (Shared
understanding)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Tendencias en la construcción de ontologías
• Reutilizar recursos ricos en conocimientos • Construcción de ontologías y vocabularios de forma
colaborativa • Conectar ontologías y vocabularios en redes
Construcción De ontologías
28/11/12
10
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Modelar
19
Buscar Ontologías
Linked Open Vocabularies
¿Son apropiados?
Construir el modelo reutilizando vocabularios
existentes
Si
No
Buscar recursos basados en conocimientos
Catálogos Institucionales y estándares
¿Son apropiados?
Transforma el recurso en una ontología
Si
No
Construye desde el principio usando la metodología NeOn
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Búscar vocabularios en LOV
• Ecosistema de vocabularios utilizados en datos abiertos enlazados (RDFS or OWL ontologies) • 300 vocabularios descritos con metadatos • Clasificados en espacios (vocabulary spaces) • Enlazados usando VOAF • Servicios
• Consulta • Búsqueda • Métricas
20
Linked Open Vocabularies (LOV)
http://labs.mondeca.com/dataset/lov/
28/11/12
11
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Los espacios en LOV
21
Generales
Bibliotecas
Organizaciones sociales
Espacio Tiempo Eventos
Multimedia
Ciencia
Web
Recomendaciones
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Descripción de vocabularios en LOV
22
Metadatos
Vocabularios que usa
Vocabularios que lo usan
Versiones
28/11/12
12
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Estadísticas: Data Cube • Bibliotecas: FRBR • Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados • Instituto Geográfico Nacional
23
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Vocabularios de Personas y Organizaciones
24
28/11/12
13
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF– Friend Of A Friend
• Vocabulario RDF para describir: • Personas • Grupos • Documentos
o http://www.foaf-project.org/
25
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF – relación con otros vocabularios
26
28/11/12
14
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF - Evolución
27
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF - El vocabulario
28
28/11/12
15
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF - Una parte del modelo
29
Extracto del modelo de FOAF
foaf:Person
foaf:Document
foaf:knows
foaf:Imagefoaf:publications- foaf:firstName- foaf:surname
owl:Thing
foaf:mbox
foaf:Agent
foaf:Group
foaf:Organization
- foaf:familyname
wgs_84:SpatialThing
foaf:based_near
foaf:homepage
foaf:img
foaf:depiction
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
FOAF- modelo e instancias
30
oeg : Asun
foaf : Person
foaf : Document
foaf : knows
foaf : Image foaf : publications - foaf : firstName - foaf : surname
owl : Thing
foaf : mbox
foaf : Agent foaf : Group foaf : Organization
- foaf : familyname
wgs _ 84 : SpatialThing foaf : based _ near
foaf : homepage
foaf : img
oeg : MC foaf : knows
asun @ fi . upm . es
foaf : mbox
http :// oeg - upm . net /
foaf : homepage
foaf : depiction
http ://.../ people / asun _ oeg . png foaf : img
http :// www . springer . com /.../ 978 - 3 - 642 - 24793
foaf : publications foaf : publications
foaf : firstName foaf : surname foaf : firstName
foaf : surname “Mari Carmen”
“Suárez de Figueroa”
“Asunción”
“Gómez-Pérez”
http :// springer . com / … / images / NeOnBook . tif
foaf : depiction
instanceOf instanceOf instanceOf
instanceOf
instanceOf
instanceOf
instanceOf
28/11/12
16
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
RDF de ejemplo instanciación de Foaf
31
XML
Turtle
V-Card– Tarjetas de presentación
• vCard automates the exchange of personal and organization information typically found on a traditional business card.
• RDF Classes: • Vcard • Name • Address • Organisation, • Location • Label • Tel • Email.
32
http://www.w3.org/Submission/vcard-rdf/
28/11/12
17
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ejemplo instanciación Vcard
33
vcard:Name
vcard:urlvcard:email
- vcard:given-name- vcard:family-name
owl:Thing
vcard:nvcard:VCard
oeg:Asun
vcard:email
http://oeg-upm.net/
vcard:urlvcard:given-name vcard:family-name
“Asunción” “Gómez”
oeg:AsunNamevcard:n
instanceOf
instanceOfinstanceOf
instanceOf
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
RDF de ejemplo instanciación de VCard
34
XML
Turtle
28/11/12
18
35
foaf:Person
foaf:Document
foaf:knows
foaf:Imagefoaf:publications- foaf:firstName- foaf:surname
owl:Thing
foaf:mbox
foaf:Agent
foaf:Group
foaf:Organization
- foaf:familyname
wgs_84:SpatialThing
foaf:based_near
foaf:homepage
foaf:img
foaf:depiction
vcard:Name
vcard:urlvcard:email
- vcard:given-name- vcard:family-name
owl:Thing
vcard:nvcard:VCard
FOAF VCard
36
vcard:Name
vcard:urlvcard:email
- vcard:given-name- vcard:family-name
owl:Thing
vcard:nvcard:VCard
oeg:Asun
vcard:email
http://oeg-upm.net/
vcard:urlvcard:given-name vcard:family-name
“Asunción” “Gómez”
oeg:AsunNamevcard:n
instanceOfinstanceOf instanceOf
instanceOf
FOAF
VCard
oeg : Asun
foaf : Person foaf : Document
- foaf : firstName - foaf : surname
owl : Thing foaf : mbox
foaf : Agent foaf : Group foaf : Organization
- foaf : familyname
foaf : homepage
asun @ fi . upm . es foaf : mbox
http :// oeg - upm . net / foaf : homepage foaf : firstName foaf : surname
“Asunción”
“Gómez-Pérez”
instanceOf instanceOf
instanceOf
28/11/12
19
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: Una ontología de organizaciones (W3C) • ORG es una ontología para representar datos de
organizaciones. • Estructura de la organización
• Noción • Sub-organizaciones y unidades • Fin
• Estructura de reporte • Miembros • Roles, • Relaciones entre miembros
• Ubicación • Edificios, direcciones, etc.
• Historia (fusiones, cambios de nombre)
37
http://www.w3.org/TR/vocab-org/
ORG: Una ontología para organizaciones
38
http://www.w3.org/TR/vocab-org/
28/11/12
20
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: Metadatos
39
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: Relación con otros vocabularios
40
28/11/12
21
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG - Evolución
41
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: El vocabulario
42
28/11/12
22
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG - Una parte del modelo
43
Extracto del modelo de ORG
org:Post
org:hasUnit/unitOforg:Organization
org:OrganizationalUnit
foaf:Agent org:membetOf
org:postIn/hasPost
org:headOf
org:holds/heldBy
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: modelo e instancias
44
instanceOf
instanceOf
instanceOf
instanceOf
instanceOfoeg:Asun
org:Post
org:hasUnit/unitOforg:Organization
org:OrganizationalUnit
foaf:Agent org:memberOf
org:postIn/hasPost
oeg:MCfoaf:knows
http://.../people/asun_oeg.png
foaf:img
foaf:firstNamefoaf:surname foaf:firstName
foaf:surname
“Mari Carmen”
“Suárez de Figueroa”
“Asunción”
“Gómez”
org:headOf
org:holds/heldBy
univEs:UPM
skos:prefLabel
“Universidad Politécnica de
Madrid”
upm:FI
skos:prefLabel
“Facultad de Informática”
fi:DIA
skos:prefLabel
“Departamento de Inteligencia
Artificial”
org:unitOf
org:unitOf
org:memberOf
org:memberOf
org:memberOf org:memberOf
org:memberOf
org:memberOf
org:headOf
fi:15
skos:prefLabel
“Director de departamento”
org:postIn
org:holds/heldBy
instanceOf
28/11/12
23
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: modelo e instancias – Sintaxis Turtle
45
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
ORG: modelo e instancias – Sintaxis RDF/XML
46
28/11/12
24
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Estadísticas: Data Cube • Bibliotecas: FRBR • Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados • Instituto Geográfico Nacional
47
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: The Bibliographic Ontology
• Dublin Core es un ontología para describir recursos mediante metadatos simples y generales (DC terms).
• Subconjunto de 15 elementos (DC elements) reconocidos por IETF RFC 5013, ANSI/NISO Standard Z39.85-2007 y ISO Standard 15836:2009.
• Pensado para ser utilizado junto con otros vocabularios especializados de acuerdo a las necesidades de implementación.
48
• http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms
28/11/12
25
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: Relación con otros vocabularios
49
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: Evolución
50
28/11/12
26
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: El vocabulario
51
126 Elementos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: Una parte del modelo
52
Extracto del modelo de DC
dc:BibliographicResource
owl:Thingdc:coverage
dc:Agent
dc:LocationPeriodOrJurisdiction
dc:MediaTypeOrExtent
dc:creatordc:contributordc:publisher
dc:descriptiondc:identifier
dc:format
dc:typedc:rights
dc:relationdc:sourcedc:subject
dc:language
dc:LinguisticSystem
dc:RightsStatement
dc:Class
- dc:title
28/11/12
27
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DC: modelo e instancias
53
oeg:MC
http://www.springer.com/.../978-3-642-24793-4
dc:creatoroeg:Asundc:contributor
stl:Aldo
dc:contributor
kmi:Enricodc:contributor
http://dbpedia.org/page/Springer_Publishing
dc:publisher
terms:title
“Ontology Engineering in a Networked World”
terms:identifier
“978-3-642-24794-1”
terms:created“2012”
dc:BibliographicResource
dc:Agent
- dc:titleinstanceOf
instanceOf
instanceOf
instanceOf
instanceOf
instanceOf
dc:creatordc:contributordc:publisher
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
RDF de ejemplo instanciación de Dublin Core
54
XML
Turtle
28/11/12
28
DC en Protégé
55
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: The Bibliographic Ontology
• Bibliographic Ontology (BIBO) para describir datos bibliográficos en la Web
• BIBO can be used as • Ontologia de citas • Clasificación de documentos
56
• bibliontology.com/ • http://purl.org/ontology/bibo/
28/11/12
29
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: Relación con otros vocabularios
57
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: Evolución
58
28/11/12
30
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: El vocabulario
59
189 Elementos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: Una parte del modelo
60
Extracto del modelo de BIBO
bibo:Document
bibo:Article
bibo:Agent bibo:editor
equivalentClass
bibo:Book
bibo:Thesis
bibo:Proceedings
foaf:Agent
28/11/12
31
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: modelo e instancias
61
instanceOf
instanceOf
instanceOf
instanceOf
oeg:Asun
bibo:Document
bibo:Articlebibo:Agent
bibo:editor
oeg:MC
http://.../people/asun_oeg.png
foaf:img
foaf:firstNamefoaf:surname
foaf:firstName
foaf:surname
“Mari Carmen”
“Suárez de Figueroa”
“Asunción”
“Gómez”
equivalentClass
springer:978-3-642-24794-1 dc:title“Ontology Engineering in a Networked World”@en
“2012”
bibo:Book
bibo:Thesis
bibo:Proceedings
foaf:Agent
dc:date
“978-3-642-24794-1”
bibo:isbn
“444”
bibo:numPages
kmi:EMotta
foaf:firstName
foaf:surname
“Enrico”
“Motta”
cnr:AGangemi
foaf:firstName
foaf:surname
“Aldo”
“Gangemi”
bibo:editor
bibo:editor bibo:editorbibo:editor
springer:Springer
bibo:publisher
instanceOf
instanceOf
BIBO in Protégé
62
bibliontology.com
28/11/12
32
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
BIBO: modelo e instancias – Sintaxis RDF/XML
64
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Estadísticas: Data Cube • Bibliotecas: FRBR • Otros vocabularios: sensores, provenance, VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados • Instituto Geográfico Nacional
65
28/11/12
33
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Puntos en cartografía: WGS84
• Vocabulario para representar Puntos • latitud • Longitud • @en
• http://www.w3.org/2003/01/geo/
66 Asunción Gómez Pérez
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"> <geo:Point> <geo:lat> 55.701</geo:lat> <geo:long>12.552</geo:long> </geo:Point> </rdf:RDF>
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Geoes: Modelo de Geometria
67
geoes:ontology/Polygon
geoes: http://geo.linkeddata.es/ geo: http://www.w3.org/2003/01/geo/wgs84_pos#
geoes:ontology/Geometry
geoes:ontology/Curve geo:Point
rdfs:subClassOf rdfs:subClassOf
rdfs:subClassOf
geo:lat geo:long Collection of 2 or more geo:Points Collection of 3 or
more geo:Points
Composed by Composed by
28/11/12
34
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Geoes: curvas
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
69
geoes:resource/Embalse/Embalse%20de%20Orellana
rdf:type
geoes:ontology/Embalse (reservoir)
geo:geometry
otalex:resource/4e994dad1c44d2b50597dd64ddfb
cac30de06d80
-5.498
38.985 geo:lat
geo:long
geoes: http://geo.linkeddata.es/ otalex: http://otalex.linkeddata.es/ geo: http://www.w3.org/2003/01/geo/wgs84_pos#
Embalse de Orellana
rdfs:label
otalex:resource/ 38.984222213320045_-5.49938294416971
otalex:resource/wgs84/38.982575823226234_-5.495821779307
759
geo:
form
adoP
or (c
ompo
sed
by)
otalex:resource/wgs84/38.98531526569159_-5.4985940847130
78
geoes:Polígono (Polygon)
rdf:type
otalex:resource/wgs84/…
69
Geoes: Polígonos
28/11/12
35
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ejemplo de RDF
70
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Bibliotecas: • Estadísticas: Data Cube • Descripcion de conjuntos de datos: VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados
6. Conclusiones
71
28/11/12
36
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Bibliotecas: FRBR
Works
Expressions
Manifestations
Obra 1
Obra 2
Obra 3
Expresión1 Expresión 2
Manifestación1 Manifestación2
Specification
Modelling
RDF Generation
Publication
Links Generation
Exploitation
72
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontología de la BNE: basada en los vocabularios de FRBR
28/11/12
37
Marimba genera RDF
BNE
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Bibliotecas: • Estadísticas: Data Cube • Descripcion de conjuntos de datos: VOID
5. Ejemplos de Redes de vocabularios en aplicaciones de datos enlazados
6. Conclusiones
75
28/11/12
38
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Data cubes
• Un cubo puede se r cons ide rado una ex tens ión multidimensional de tablas 2-D (igual que en geometría un cubo es una extensión tridimensional de un cuadrado)
• El término hiper-cubo se utiliza, en ocasiones, especialmente para los datos con más de tres dimensiones
• Cada dimensión representa algún atributo en la base de datos (como las ventas, los beneficios, los gastos, etc.)
• Las celdas en el cubo de datos representan la medida de interés. Por ejemplo, pueden contener un contador para el número de veces que se produce una combinación de atributo en la base de datos, o el valor mínimo, máximo, la suma o media de algún atributo)
• Las consultas se realizan en el cubo para recuperar información que sirva de apoyo a las decisiones
76
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Data cubes
78
Cubo
Dimensiones
Celdas
28/11/12
39
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Example: Desempleo
79
Dim
ensi
ón (C
CA
A)
Dimensión (Año)
Celdas (Datos de paro registrado)
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
RDF Data Cube: Vocabulario
80
Cubo
Celdas (Datos)
Dimensión
Fenómeno Observado
28/11/12
40
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ejemplo: Data Cube y Desempleo
81
qb:dataSet qb:dataSet
stats:unemployment/Cantabria_2004
stats:unemployment/Canarias_2008
……
rdf:type rdf:type
qb:Observation
stats:unemployment
rdf:type
qb:DataSet
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios
• Personas y Organizaciones: FOAF, vCard, ORG • Documentos: DC, BIBO • Geo: puntos, curvas y polígonos • Bibliotecas • Estadísticas: Data Cube • Otros Vocabularios: sensores, provenance, VOID,
DCAT, … 5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados • Instituto Geográfico Nacional
82
28/11/12
41
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 83
SSN Ontology with other Ontologies
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Provenance
84
RDF Store
PROVENANCE Model (RDF(S))
1
Del proceso • OPM, Provernir, PM, • PROV-O @W3C
Filev1. txt
Revision Process
generatedBy
File.txt
used
Meta-provenance • DC-PROV @ W3C (ongoing) • OAI-ORE
Del Recurso • DC, Premis, SWANL • EDM (including agregation)
creator
rights
creaJonDate
John
12-‐2-‐1900
GPL
28/11/12
42
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DCAT: Data Catalog Vocabulary
• DCAT es un vocabulario para facilitar la interoperabilidad de catálogos de datos publicados en la web.
• DCAT facilita la tarea de descubrir catálogos de datos y el consumo de metadatos procedentes de distintos catálogos.
• Los principales conceptos descritos en DCAT son: • Catálogo • Record de un catálogo • Conjunto de datos • Distribución • Descarga • Servicio web
85
• http://www.w3.org/TR/vocab-dcat/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
DCAT: El vocabulario
86
Imagen tomada de http://www.w3.org/TR/vocab-dcat/
28/11/12
43
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
¿Qué es voID?
• vocabulario en RDFS publicado por el W3C
• Permite la descripción de un conjunto de datos RDF
• Facilita el descubrimiento y la utilización del dataset por parte de usuarios potenciales (e.g. agregadores, indexadores, desarrolladores de aplicaciones)
87 Asunción Gómez Pérez
http://www.w3.org/TR/void/
• Metadatos generales: licencia, autor, temática, número de tripletas...
• Métodos de acceso: dirección SPARQL endpoint, ficheros descargables..
• Metadatos de estructura: recursos de ejemplo, patrón de URIs, vocabularios utilizados..
• Linksets (conjuntos de datos a los que enlaza el dataset): describe la propiedad utilizada (e.g. owl:sameAs, skos:closeMatch), la URI del dataset con el que se enlaza, enlaces de ejemplo…
VOID
88
28/11/12
44
BNE VOID
89 Asunción Gómez Pérez
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
adms: Asset Description Metadata Schema
• El vocabulario adms describe conceptos relacionados con la interoperablidiad semántica de recursos.
• Incluye conceptos como “Repositorio de recursos semanticos”, “Recurso semántico” y “Distribución de recursos semánticos” que son especializaciones de conceptos mas generales: Repositorio y Distribución.
• El vocabulario adms ha sido creado en el programa de soluciones de interoperabilidad para las administraciones públicas europeas (ISA: Interoperability solutions for European public administrations) de la comisión europea.
90
• http://www.w3.org/ns/adms#
28/11/12
45
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
adms: El vocabulario
91
Imagen tomada de http://www.w3.org/ns/adms
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios 5. Ejemplos de Redes de vocabularios en
aplicaciones de datos enlazados 6. Conclusiones
92
28/11/12
46
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontologias de geolinkeddata
93
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Acceso uniforme a BD
OMI
NGCE BCN200 NOMGEO
Lago Ontología de fenómenos
Redes de Ontologías
Lago Lago de Agua dulce Lago de agua salada
SPARQL Endpoints URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tae%C3%B1a%2C%20Laguna%20de URI: http://geo.linkeddata.es/NGCE/resource/Laguna/Tollos%2C%20Laguna%20de%20los […] URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Hilejas%2C%20Laguna%20de%20las URI: http://geo.linkeddata.es/NOMGEO/resource/Laguna/Tejo%2C%20Laguna%20del […] URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20de%20Paniagua URI: http://geo.linkeddata.es/BCN200/resource/Laguna/Laguna%20Laguna%20 […]
La respuesta final compuesta por 1.806 URI (38 de NGCE, 1.416 de NOMGEO y 406 de BCN200).
?
28/11/12
47
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
02
- Tipo • NDepresión • Glaciar • Batimétormal • rica - Categoría • Normal • Maestra • Auxiliar - Origen • Desconocido • Restitución • Digitalización • MDT
0201 Curva de nivel
http://mayor2.dia.fi.upm.es/oeg-upm/files/phenomontology/Phenom4.0.1.owl
Ontología de fenónmenos cartográficos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontología de Hidrología
Nivel superior
Nivel inferior
28/11/12
48
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Implementación
12
3
4
5
+ Pellet
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontologias de Geolinkeddata
hasStatisticalData
on
Ontology
Specification
Legend
hydrOntology
4
FAO
FAO Geopolitical ontology
WGS84
4W3C Vocabulary
GML
4GML Specification
O. Statistics
SCOVO
O. Time
W3C Time
hasLat/Long
hasGeometry
hasLat/Long
hasGeometry
hasLocation/isLocated
Thesaurus
UNESCO
4EGM / ERM
GeoNames…
scv:Dimension scv:Item
scv:Dataset
WGS84 Geo Positioning: an RDF
vocabulary hydrographical
phenomena (rivers, lakes, etc.)
Ontology for OGC Geography Markup Language
Vocabulary for instants, intervals, durations, etc.
Names and international code systems for territories and groups
Following the INSPIRE (INfrastructure for SPatial InfoRmation in Europe) recommendation. hydrOntology,SCOVO, FAO Geopolitcal, WGS84, GML, and Time
Classes 33 33
Object Properties 44 44
Data Properties 318 318
reused
28/11/12
49
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Ontologías de datos metereológicos
99
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
1. Introducción 2. Tipos de vocabularios 3. Proceso de Construcción 4. Ejemplos de Vocabularios 5. Ejemplos de Redes de vocabularios en aplicaciones
de datos enlazados 6. Conclusiones
100
28/11/12
50
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Conclusiones
Las AA.PP. deben consensuar qué
vocabularios van a utilizar para describir sus datos y facilitar la
interoperabilidad semántica
Los vocabularios deben ser multilingües
101 Asunción Gómez Pérez