Upload
jose-maria-alvarez
View
1.561
Download
0
Embed Size (px)
DESCRIPTION
My talk about researching in semantic web technologies at UPC, Lima, Perú
Citation preview
Researching in Semantic
Web Technologies
1º Congreso Internacional de Ingeniería
de Sistemas y Computación
Lima, Perú
Dr. Jose María Álvarez Rodríguez
GRUPO WESO-Universidad de Oviedo
www.josemalvarez.es
http://www.slideshare.net/josem.alvarez
Alguien podría decir o buscar
rápidamente…
“Escritores peruanos nacidos en
Lima antes de 1900”
Si ya lo tenéis ahora…
“Lugares con su latitud y
longitud a menos de 200Km de
Lima”
Y otra…
“Listado de países con nombre
en inglés, chino, código ISO-3
con su latitud y longitud”
Dónde estamos?
Qué hacemos?
Punto de Partida
Tim Berners-Lee's original World Wide Web browser
Fuente: http://info.cern.ch/NextBrowser.html
http://www.evolutionoftheweb.com/?hl=en
“Semantic Web Road map”
(TBL, 1998)
…y en 2001…
http://www.scientificamerican.com/article.cfm?id=the-semantic-web
Ora Lassila
James A. Hendler
Tim Berners-Lee
RDF
Sujeto Objeto
Predicado
#me “Jose María”
foaf:name
• Modelo de datos común (grafo)
• Uso de URIs
• Serializable en distintos formatos
• Semántica definida
• ….la Web como una base de datos!
Para nosotros…
http://www.renault.co.uk/ownerservices/shop/item/renaulttoys/pedalcar/eco2pedalcar/default.aspx
Y para las máquinas…
The heart of Google's operation
La Web como una
gran base de datos
Web of Data
Ontologías y OWL The subject of ontology is the study of
the categories of things that exist or may
exist in some domain. (Sowa)
Fuente:
http://www.jfsowa.com/ontology/index.htm
Ramón Llul
• Representación del conocimiento
• Formalismo lógico
– DL, PL, FOL, etc.
– Razonamiento, Completitud, etc.
• Lenguaje W3C-OWL
– (1.0, 1.1 y 2.0)
– Sintaxis: RDF, etc.
• ….
Diagnóstico Psicológico
Más ingredientes?
Tim Berners-Lee 2001
Two Towers 2005
Consulta DBPedia Escritores
PREFIX dbo: <http://dbpedia.org/ontology/>
SELECT ?name ?birth ?description ?person WHERE {
?person dbo:birthPlace :Lima.
?person <http://purl.org/dc/terms/subject> <http://dbpedia.org/resource/Category:Peruvian_writers> .
?person dbo:birthDate ?birth .
?person foaf:name ?name .
?person rdfs:comment ?description .
FILTER (?birth < "1900-01-01"^^xsd:date).
FILTER (LANG(?description) = 'en') .
}
ORDER BY ?name
http://dbpedia.org/snorql/
Consulta Webindex países
SELECT *
WHERE{
?country rdf:type wi-onto:Country.
?country rdfs:label ?label.
FILTER (lang(?label) = 'en').
?country skos:prefLabel ?countryLabel.
FILTER (lang(?countryLabel) = 'zh').
?country wi-onto:has-iso-alpha3-code ?id.
?country geo:lat ?lat.
?country geo:long ?long.
}
http://data.webfoundation.org/snorql
Evaluación
Artículos, libros,
etc.
Investigación
básica
Proyectos,
iniciativas, etc.
Investigación
aplicada
• Formalización lógica
• Razonadores
• Ontologías
• Vocabularios RDF
• Búsqueda Semántica
• Servicios web
• Interoperabilidad
• Integración
• Herramientas
• Dominios
• Turismo
• Medicina
• Legislación
• …
Base teórica
+
Base Tecnológica
+
Aplicaciones
http://www.w3.org/2001/sw/sweo/public/UseCases/CTIC/
…Por otra parte..
http://oreilly.com/web2/archive/what-is-web-20.html Tim O’Reilly
http://www.zdnet.com/blog/web2explorer/a-simple-picture-of-web-evolution/408
¿Dirección?
Web 2.0
+
Web
Semántica
Linked Data
Principios y Modelo 5*
http://lod-lam.slis.kent.edu/images/linked-data-image.jpg
1. Use URIs as names for Things
2. When someone looks up a URI,
provide useful information, using the
standards (RDF*, SPARQL)
1. Include links to other URIs.
2. Use HTTP URIs.
¿Estrellas?
Ventajas
1. Realización práctica de la Web Semántica.
2. Identicación única, uso de HTTP URIs.
3. Modelo y acceso estándar.
4. Enriquecimiento de recursos, creación de enlaces.
5. Estructuración, modelo estándar RDF.
6. Expresividad, vocabularios y datasets .
7. Reutilización de informacióny datos.
. . .
Publicación ¿Cómo promociono los datos al modelo 5*?
Consumo ¿Cómo exploto los datos?
Gestión ¿Cómo manejo los datos?
Datos e información masiva…
Para ser estructurada y utilizada…
Integración e interoperabilidad
http://www.w3.org/2011/gld/wiki/GLD_Life_cycle
Open Data
(Government)
RISP y los 8 principios
“Public Sector Information (PSI) in free open raw formats and ways that make it accessible to all and allow reuse”
Fuente: Josema Alonso
Data Must Be Complete.
. . . Primary.
. . . Timely.
. . . Accessible.
. . . Machine processable
Access Must Be Non-
Discriminatory
Data Formats Must Be
Non-Proprietary
Data Must Be License-free
Filosófica
Económica
Social
Linked Data
Open Data
e-Government
Government Linked Data
http://www.w3.org/2011/gld/wiki/Main_Page
Ventajas
• Transparencia
• Participación
• Colaboración
• Inclusión
• Reducción de costes
– Interoperabilidad
• Liderazgo
Ventajas
Linked Open Data
http://richard.cyganiak.de/2007/10/lod/
• 203 datasets ( 25 billones de tripletas RDF y 395 millones enlaces (Sept. 2010). • Dominios: Media, Geographic, Government (42,09 %), Publications, Cross-domain, Life sciences, etc. (Ago. 2011). • 393 datasets (Jun. 2012).
DBPedia
GEOLD
UK Gov
ACM PubMED
NATURE
DBLP
MOLDEAS
Y muchos más… (391)
SPARQL endpoints distribuidos para consulta…
Webindex
AEMET
http://labs.mondeca.com/sparqlEndpointsStatus/
“identify the data that one
controls, represent that data in a
way that people can use, and
expose the data to the wider
world.” Jeni Tennison
Estrategia
• Interna y externa
• Metodología
– Identificar
– Representar
– Exponer
– Consumir
• Participación
– Talleres y concursos
Reino Unido
Organizaciones
El Banco Mundial
Euroalert
España
Meteorología España
Turruta Ayto. de Zaragoza
Webindex
Biblioteca del Congreso de Chile
Búsqueda…
Publicación
Y ahora… ¿en qué investigamos?
Objetivo
Objetivos
Necesidades
Investigación
Conocimiento
Tecnología
Aplicación
Innovación
Datos Información
Conocimiento Aplicación
WS+LD
RDF y OWL2 Perfiles y expresividad
Vocabularios
Completitud, corrección, etc.
Reconciliación de entidades
Semántica en streaming
…
SPARQL 1.1 Consultas federadas
Descubrimiento endpoints
Expresiones y funciones
SPARUL
Reglas
…
Provenance &
Trust
Calidad
Semantic
Sensors
Multilinguismo
Razonamiento
distribuido
+ desafíos 1. Escalabilidad
2. Interfaz de Usuario
3. Cloud Computing y Semántica
4. Computational Linguistics
5. Computational Social Choice Theory
6. Open Data 1. Misión y Visión
2. Licencia, Seguridad, Integridad, Compatibilidad, etc.
3. Marco legal, Participación ciudadana, etc.
7. Linked Data 1. Algoritmos para crear enlaces
2. Reconciliación de entidades
3. Consultas distribuidas
4. Catalogación
5. Modelos de negocio
6. DataStore
7. Razonamiento, consistencia, etc.
. . .
Domótica Turismo Biomedicina
Bibliotecas
Digitales Cloud
Computing Legislación
Robótica Tráfico Emergencias
E-Health E-Procurement Retailing
eGov Catálogos Smart
Cities
Social
Media Estadística …
LOD2 project
Apache Drill
Apache Stanbol
Tecnología
relacionada
https://ec.europa.eu/digital-agenda/
Anja Jentzsch Jose Labra
Michael Hausenblas
Sören Auer
Christophe Gueret Richard Cyganiak
Frank van Harmelen
Chris Bizer
Óscar Corcho
Aidan Hogan
G. Tummarello
Juan Miguel Gomez
Irene Celino
Wikier
Axel Polleres
Peter Mika
http://ec.europa.eu/research/horizon2020/index_en.cfm
Jenni Tennison
¿Por dónde empiezo?
1. Leer, leer, leer… • Preguntar y participar
2. Buscar un problema… • Motivación intrínseca (prestigio, ego, etc.)
• Y extrínseca (aportación, salario, etc.)
3. Diseñar experimento y prototipos
4. Prueba, prueba, prueba…y mejora
5. Publicar
6. Volver al paso 1
http://tw.rpi.edu/launch/
Preguntar a los
expertos
• Tutoriales
• Participación en proyectos común
• Vocamp, Hackathon, Meet-up…
• After-hours hackathon
• Beer for Science – http://red.linkeddata.es/web/guest/events
– http://beerforscience.wordpress.com/
Colaboración…
DBPedia
Perú?
¿Qué podemos
hacer con los
datos del
gobierno?
Preguntas
Muchas gracias
por la Atención!
Sobre esta presentación…
• Agradecimientos
– José Emilio Labra
– Hernán Sagástegui
• Recursos gráficos
– Universidad de Oviedo, W3C, Proyectos FP, etc.
– Flickr.com (bajo licencia Creative Commons)
• Greeneydmantis, boston_public_library, Tjflex, arduinolabs,
redais, libertasacademica, friarsbalsam, jannem,
mr_t_in_dcIconfinder.com
• Licencia
– http://creativecommons.org/licenses/by-nc-sa/3.0/es/
Researching in Semantic
Web Technologies
1º Congreso Internacional de Ingeniería
de Sistemas y Computación
Lima, Perú
Dr. Jose María Álvarez Rodríguez
GRUPO WESO-Universidad de Oviedo
www.josemalvarez.es
#me
• Nombre: Jose María Álvarez Rodríguez
• Dirección: Departamento de Informática, Despacho 198, 3º Planta Facultad de Ciencias, C/Calvo Sotelo, S/N, 33007 Oviedo, Asturias
• Tlfno: 985 10 41 33 • E-mail: [email protected] • WWW: www.josemalvarez.es
BIO
Proyectos
Intereses
Algo más sencillo…
“Personas nacidas en Lima
antes de 1900”
Consulta DBPedia Personas
PREFIX dbo: <http://dbpedia.org/ontology/>
SELECT ?name ?birth ?death ?person WHERE {
?person dbo:birthPlace :Lima .
?person dbo:birthDate ?birth .
?person foaf:name ?name .
?person dbo:deathDate ?death .
FILTER (
?birth < "1900-01-01"^^xsd:date) .
}
http://dbpedia.org/snorql/
Consulta DBPedia lugares
PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>
PREFIX onto: <http://dbpedia.org/ontology/>
SELECT * WHERE {
?s a onto:Place .
?s geo:lat ?lat .
?s geo:long ?long .
FILTER(
xsd:double(?lat) - xsd:double(-12.05) <= 2 &&
xsd:double(-12.05) - xsd:double(?lat) <= 2 &&
xsd:double(?long) - xsd:double(-77.05) <= 2 &&
xsd:double(-77.05) - xsd:double(?long) <= 2).
}
LIMIT 100
http://dbpedia.org/snorql/
Unión Europea y otros