Upload
aims-agricultural-information-management-standards-fao-of-the-un
View
405
Download
0
Embed Size (px)
DESCRIPTION
El objetivo de este seminario es introducir el nuevo web de AGRIS (inagurado el 2 de Deciembre 2013) y sus funcionalidades. El web fusiona el sístema tradicional de AGRIS con OpenAGRIS, y, a su vez, proporciona un punto de acceso para buscar datos bibliográficos en la base de datos de AGRIS más fácilmente. El seminario web está orientado a investigadores agrícolas, bibliotecarios, especialistas en la gestión de la información, desarrolladores de software, editores de revistas, proveedores de datos agrícolas y otras personas interesadas.
Citation preview
AGRIS 2.0 : datos bibliográficos enlazados en el contexto de la información agrícolahttp://agris.fao.org
Imma Subirats-Coll
Oficial en la gestión del conocimiento y la informaciónOrganización de las Naciones Unidas para la Alimentación y la Agricultura
Seminario Web
7 febrero 2014
¿Qué es AGRIS?El camino a los datos vinculadosEl flujo de datos y la interoperabilidadEl consumo de datos AGRIS
Centralización Interconexión
ProcedenciaAlgunos númerosIndexación de AGRIS en Google
Sumario
AGRISRecursos en Ciencias Agrícolas y Tecnología de la
Información
• Sistema cooperativo internacional• Da acceso libre a recursos bibliográficos y
datos abiertos • Abarca casi cuarenta años de investigación
agrícola• Sus metadatos se estructuran e indexan
usando el tesauro AGROVOC, usado para enriquecer la indexación de datos en los sistemas de información agrícola
• Mantenido por la FAO
Qué es AGRIS
• Colección de más de 7,7 millones de registros bibliográficos
• Sistema RDF, una aplicación mashup que permite a los usuarios consultar el contenido AGRIS-RDF, e interconectar todos los registros a fuentes externas de información
• 7,000,000 registros bibliográficos se convierten en 7,000,000 páginas
mashup!
Qué más sabemos sobre AGRIS
Flujo de datos
• Aplicación web enteramente basada en estándares de la Web Semántica
• Crea páginas de mashup y interconecta los registros a fuentes externas de información
• Utiliza AGROVOC como columna vertebral para la interconexión con otros conjuntos de datos existentes (DBPedia, worldbank, Ontología geopolítica ...)
AGRIS 2.0
El consumo de datos en AGRIS (1)
• Centralización: referencias bibliográficas en el dominio AGRIS (la agricultura, la silvicultura, la ganadería, ciencias acuáticas y la pesca, y la alimentación humana)
• Interconexión: otro tipo de información relacionada con el dominio AGRIS (estadísticas, mapas, perfiles de países, etc)
El consumo de datos en AGRIS (2)
• AGRIS consume metadatos proporcionados por la comunidad y los publica como datos abiertos
• Los metadatos se obtienen• (1) A través de la recolección da datos (por
ejemplo, agregadores, repositorios institucionales, a través de protocolos como OAI-PMH)
• (2) A recibiendo datos a través de proveedores interesados (por ejemplo bibliotecas nacionales o editoriales de revistas)
Interoperabilidad
Flujo de Datos
Centralización: Centro de proceso de datos
• Los nuevos metadatos se verifican manualmente y aleatoriamente en busca de inconsistencias o errores semánticos recurrentes
• El formato de entrada se asigna a AGRIS RDF• Los metadatos se convierten en AGRIS RDF,
usando AgroTagger cuando las palabras clave de AGROVOC no están disponibles
• Antes de añadir metadatos al triplestore e indexar en el índice Solr, se detectan y gestionan los duplicados, ya que el mismo registro puede ser indexado en varias colecciones o ser duplicado en el mismo repositorio
Agrotagger
13
Todavía no se ha implementado
Maui es el nombre del héroe mitológico y semidiós polinesio, que se transform en diferentes tipos de
ave para realizar hazañas
“RDF-ization”
bibo:Articlebibo:abstractbibo:doibibo:isbnbibo:languagebibo:presentedAt -> bibo:Conference -> dct:titlebibo:uridct:alternativedct:creator -> foaf:organization -> foaf:namedct:creator -> foaf:Person -> foaf:name
dct:dateSubmitteddct:descriptiondct:extentdct:identifierdct:isPartOfdct:issueddct:publisher -> foaf:Organization -> foaf:namedct:sourcedct:subjectdct:titledct:typedct:rights
Elección de vocabularios y equivalencias!
RDF-XML
Procedencia
• Cada registro tiene un identificador AGRIS (ARN), que tiene una estructura predefinida y contiene información sobre la fuente de datos junto con el año de registro bibliográfico de creación
• "IT 2008 0 00091" se refiere a un registro creado en 2008 a partir de un proveedor específico de datos AGRIS en Italia, cuyo número progresivo es 91
• Datos de proveedores de información se almacenan en CIARD RING y son “triplificados” en el centros de datos AGRIS (cada proveedor de datos tiene su propio URI único)
Enlaces: ¿cómo funcionan?
• AGROVOC es la columna vertebral• AGROVOC está enlazado con otros
tesauros mediante un procedimiento semi-automático (skos: exactMatch, skos: closeMatch)
• SPARQL endpoints publicados en la Web• Webservices y APIs
18
El Caso IFPRI
Un usuario consulta el
sistema
Registro AGRIS con palabras clave Agrovoc
Por lo menos una palabra clave Agrovoc es un
nombre de país
El sistema de consultas SPARQL endpoint IFPRI (http://data.ifpri.org/sparql/) recupera el Índice Global del Hambre (GHI) y la tasa de mortalidad infantil relacionada con el País
Algunos números• 7.632.842 registros bibliográficos generados por
248 proveedores de contenido ubicados en 153 países, en 52 idiomas en más de 20.000 revistas científicas.
• 187.238.716 triples en el conjunto de datos AGRIS http://202.45.142.113:10035/repositories/agris
• 372.462 triples en la series de datos AGRIS http://202.45.142.113:10035/repositories/jad
• 11.414 triples en los centros de datos AGRIS http://202.45.142.113:10035/repositories/centers
AGRIS RDF RECORD
AGROVOC