2
Interoperabilidad, la llave para alcanzar el verdadero valor del acceso abierto para la ciencia
Eloy Rodrigues (UMinho)
Chair of COAR Working Group on Repository Interoperability
Conferencia Virtual
HACIA LA UNIVERSALIDAD DEL ACCESO ABIERTO
22 de mayo de 2013
El valor de los repositorios
• Cada repositorio individualmente es muy valioso para su institución o comunidad;
• Pero cada repositorio tiene un valor muy limitado para la ciencia y la investigación…
"Por primera vez en la historia,
Internet nos ofrece la posibilidad de
crear una representación global e
interactiva del conocimiento humano,
incluido el patrimonio cultural y la
garantía de acceso en todo el
mundo"
Berlin Declaration, 2003
“Con el fin de hacer realidad la visión de una representación global y accesible del conocimiento, la futura Web tiene que ser sostenible, interactiva y transparente. El contenido y las herramientas de software deben ser libremente accesibles y compatibles”
De nuevo... El valor de los repositorios
• Cada repositorio individualmente es muy valioso para su institución o comunidad;
• Pero cada repositorio tiene un valor muy limitado para la ciencia y la investigación…
El valor de los repositorios
El valor real de los repositorios recae en el
potencial de interconexión para crear una red de repositorios, una red que puede proveer un acceso unificado a los resultados de la investigación y son (re-) utilizados por las máquinas y los investigadores.
(El caso de Interoperabilidad para Repositorios de Acceso Abierto - COAR Briefing Paper)
El valor de los repositorios
Para lograr este potencial de crear un cuerpo unificado de resultados de la investigación necesitamos…
Interoperabilidad
Contenidos OA …y el “adhesivo técnico” que hace esta
integración posible …
Los repositorios OA en todo el mundo, tienen que trabajar con políticas, términos y condiciones, esquemas de datos, protocolos, etc. similares para construir un recurso (transparente) de contenidos basado en una red mundial de repositorios de acceso abierto
Donde estamos hoy? % Gold and % Green
for 2005-2010 (tested 2011)
Source Harnad, Stevan (2012) How and Why RCUK Open Access Policy Needs Revision.
http://www.flickr.com/photos/maxx361/
Capacidad de
trabajar, comunicar
y de interactuar entre
diversos sistemas.
Capacidad para pasar información, metadatos y objetos digitales de ida y vuelta entre sistemas en un formato utilizable
INTEROPERABILIDAD
CONECTAR – Diferentes repositorios
– Repositorios con otros sistemas de información • Current research information systems (CRIS)
• Learning Management Systems (LMS)
• Virtual Research Environments (VRE)
• Virtual Learning Environments (VLE)
• Etc…
– Y transferir metadatos y/ objetos digitales
Interoperabilidad para…
CREAR NUEVOS SERVICIOS y HERRAMIENTAS
– “Por en cima” de los repositorios, con los contenidos agregados de los repositorios…
– …utilizando la capacidad computacional que hoy tenemos para procesarlos y hacer datamining, generando nueva información y nuevo conocimiento
Interoperabilidad para…
Cuestiones y Retos Actuales
Retos Técnicos:
– Nuevos tipos de contenido
– Software y sistemas
– Nuevas capas de Servicio
Cuestiones y Retos Actuales
Retos Técnicos (continución):
– Datos de uso (usage data)
– Identificación consistente y terminología (ex:
nombres de autores, agencias de financiación)
– Desafíos de Idioma
Towards Repository Interoperability
Berlin 10 Workshop – 6 November 2012
Current Issues & Challenges
Retos Administrativos y Organizacionales:
– Contexto Global
– Sostenibilidad a largo plazo de las directrices y
estándares
– Apoyo a la implementación de directrices
Situación actual de Interoperabilidad de los OAR
• Mucho trabajo en varias áreas, pero aún
trabajo en curso
COAR Current State of Open Access Repository Interoperability (2012)
Público destinatario: Instituciones y administradores de
repositorios, que operan en diferentes puntos en
términos de infraestructura, recursos,…
- Para instituciones nuevas en OA y repositorios: proporcionará
orientación en ponerse en marcha - aportando ideas sobre los tipos
que los repositorios pueden ofrecer
- ¿Qué normas y protocolos de interoperabilidad son necesarios
implementar para proporcionar esos servicios
- Para las instituciones y gestores de repositorios ya involucrados en
OA y repositorios: Ideas para una funcionalidades adicionales,
nuevos servicios posibles de proporcionar
State of Open Access Repository Interoperability
• Section I – Introduction and Background Information: general overview of the interoperability landscape, identifying main
challenges, current state and emerging areas.
• Section 2 – Description of current
standards/guidelines/projects a) Description – Information about specific interoperability guidelines and standards
referenced in the roadmap. Each item summarized in a consistent way.
b) Applications : concrete examples of services or applications that have been developed
using the standards/guidelines/projects.
c) Additional resources for further readings, particularly focusing on explanatory texts
and other useful information.
OA Repository Interoperability
Metadata Harvesting
Repository Networks
Usage Statistics
Cross-System Content Transfer
Author Identification
Persistent Identifiers
Managing Compound
Objects
Áreas de enfoque de iniciativas de interporabilidad de repositorios
Iniciativas específicas de interoperabilidad
Areas Associated Initiatives
Metadata Harvesting OAI-PMH
Repository
Networks
DRIVER
OpenAIRE
National repository networks
UK RepositoryNet+
Usage Statistics COUNTER
KE Usage Statistics
OA-Statistik
PIRUS/IRUS-UK
SURE
Cross-System
Content Transfer
SWORD
Open Access Repository Junction
CRIS-OAR Metadata Interoperability
Iniciativas específicas de interoperabilidad
Areas Associated Initiatives
Author Identification AuthorClaim
ORCID
Persistent Identifiers PersID
Handle System
DataCite
Managing
Compound Objects
OAI-ORE
29
Trabajo en curso en COAR
• COAR Roadmap on Repository
Interoperability
– Current State of Open Access Repository
Interoperability – October 2012
• Roadmap (Future Directions) – en
preparación (2013)
COAR Roadmap on Interoperability • Introduction
• Current Situation and strategic challenges
• Vision, Goal and Objectives
• Users needs and corresponding services
• The Repository Landscape
• (…)
30
COAR Roadmap on Interoperability • Interoperability criteria / consequences
– Visibility
– Data issues
• Metadata formats
• Metadata quality
• Enhanced Publications
• Related Fulltext
• Citation, citation formats
• Linked (Open) Data
• Research Data (Primary, secondary)
• De-Duplication/Versioning
– Usability
31
COAR Roadmap on Interoperability • Interoperability criteria / consequences
– Sustainability
• Long-term preservation
• Persistent identifiers
– Add-On-Services
• Summary: Technical Interface issues
• Best Practices
32
Nacional: Portales de acceso abierto a la producción científica nacional, BDCOL, RECOLECTA…
Regional (Europa): DRIVER > OpenAIRE >OpenAire+
Global: COAR
Construyendo la infraestructura RI de la ciencia abierta
OA Publication Infrastructure
Open Data Infrastructures
ES
FR
i, E-
Scie
nce-/D
ata
infra
stru
ctu
res
…
La visión europea: íntegración en la
infraestructura global del conocimiento
Visión Europea 2030
“Our vision is a scientific e-Infrastructure that supports seamless access, use, re-use and trust of data. In a sense, the physical and technical infrastructure becomes invisible and the data themselves become the infrastructure – a valuable asset, on which science, technology, the economy and society can advance.”
High-Level Group on Scientific Data
“Riding the Wave: how Europe can gain from the raising tide of scientific data”
• Desarrollar su potencial para apoyar la visión de
acceso abierto y ser una parte esencial de las e-
infraestructuras para la investigación abierta
Retos para los RI de acceso abierto
En estos momentos eso significa: Mantener el foco en conseguir más contenidos
de acceso abierto en los repositorios Buscar y aprovechar todas las oportunidad para
conectar, interoperar o integrarse con otros sistemas o componentes de la e-infraestructura de la investigación
La interoperabilidad es una herramienta valiosa!
Es nuestra navaja suiza
Retos para los repositorios
Become active in the global COAR community!
Contact:
¡Muchas gracias por vuestra atención!
Antecedentes • Crecientes costos de las bases de datos y disminución de presupuestos;
por ende acceso al conocimiento científico, tecnológico y de innovación en la región, limitado.
• Restricciones o poca claridad de las legislaciones actuales de derecho de autor sobre el acceso y diseminación de la información científica.
• Ausencia de políticas públicas relacionadas con AA (institucionales, nacionales y regionales)
• Pocos repositorios en los países de la región y poco conocimiento sobre su importancia en la visibilidad de la ciencia.
• Fragmentación de esfuerzos regionales en AA. Sin embargo
Las dos terceras partes de las inversiones en investigación y desarrollo en AL, se financian con fondos estatales (UNESCO, 2010)
Antecedentes
• Poca participación de los autores de la región en la difusión tradicional de la ciencia (2%)
• Poca colaboración internacional
• Carrera por publicar en revistas de impacto y apatía frente al AA
Producción LA comparada con otras regiones
Antecedentes
• Nacimiento de Internet y la posibilidad de representación global
• Nacimiento de Redes Académicas Avanzadas en la región – Red CLARA
• Facilidades de las TICs Por primera vez en la historia,
Internet nos ofrece la posibilidad de
constituir una representación global
e interactiva del conocimiento
humano y la garantía de su acceso
mundial . Declaración de Berlin (2003)
Antecedentes – nacimiento de AA
• “los editores de nuestras revistas científicas tienen legítimo derecho a obtener una recompense financiera justa por su papel en la comunicación científica. Creemos, sin embargo, que el registro de las ideas y la investigación científica no deben pertenecer ni ser controladas por los editores, sino que deben pertenecer al público y deben estar disponibles libremente a través de una biblioteca pública online”.
Carta abierta del grupo llamado Public Library of Science (PloS) en la que se exigía un vuelco al sistema de comunicación científica (2000).
LA Referencia – Iniciativa de la Red Clara
– Trabajo del grupo de colaborados
de algunos países
– Financiamiento BID, en el marco
del Programa - Bien Público Regional
Aprobación – 18 de junio del 2012
Estrategia Regional y Marco de Interoperabilidad y Gestión para una Red Federada Latinoamericana de
Repositorios Institucionales de Documentación Científica
LA Referencia
• Su misión fundamental es fomentar las políticas científicas nacionales y los acuerdos regionales, para facilitar la creación de Repositorios Institucionales y sistemas nacionales, capacitar los recursos humanos, ampliar los contenidos y servicios disponibles, y promover su amplia difusión para favorecer utilización local e internacional.
Socios
MIN CyT Innova Red
IBICT
CONICYT REUNA
Colciencias MEN RENATA
SENESCYT CEDIA
RAICES CBUES
CONACYT CUDI
CONCYTEC RAAP
CENIT REACCIUN
Componentes
• Componente I: Estrategia Regional Consensuada de la Red Federada
• Componente II: Establecimiento de un marco de acuerdos y políticas comunes.
• Componente III. Desarrollo e implementación piloto .
• Componente IV. Diseño de una estrategia de Capacitación
Entregables
• Primer diagnóstico regional sobre situación de AA y desarrollo de RI.
• Esquema de trabajo en proyectos colaborativos (interoperabilidad humana)
• Página web y Plan de difusión. • Herramienta de recolección y prueba piloto. • Diagnóstico y esquema regional de capacitación. • Firma del Acuerdo de Cooperación entre altas autoridades de
ciencia, tecnología e innovación de America Latina – Noviembre, 2012
• Adhesión a la Declaración de Berlin.
• Plan de sostenibilidad
Factores claves
1. Construcción de políticas y acuerdos comunes, basadas en el diagnóstico
regional.
3. Estándares para garantizar la interoperabilidad e inserción en redes
internacionales.
4. Disponibilidad de infraestructura tecnológica .
5. Construcción de modelo de Gestión y Sostenibilidad.
6. Divulgación y Capacitación.
Desafíos hay muchos…. • Reconocimiento verdadero de publicación en AA,
como factor de aumento de prestigio del autor y de su trabajo.
• Conocer las prácticas científicas de las diferentes disciplinas para romper la “inercia” de los autores y para que depositen sus artículos.
• Lograr total apoyo de Agencias Financiadoras para el acceso abierto, con el fin de hacer más ampliamente disponibles, recuperables y útiles los resultados de las investigaciones financiadas con fondos públicos.
Desafíos para la Red
• Lograr la sostenibilidad mas allá del proyecto. • Lograr la participación de TODOS los países de la
región. • Ofrecer los servicios de valor añadido y de calidad
Convertirse en el principal portal de acceso a la producción científica latinoamericana en AA.
Visibilizando LA ciencia
Co-ordination & Harmonisation of Advanced e-Infrastructures
Research Infrastructures – Grant Agreement n. 260011
Data Infrastructures for e-Science Roberto Barbera, University of Catania and INFN
Luis A. Núñez RedCLARA and Univ Industrial Santander
Webinar La Referencia/COAR – 22 May 2013
Community Model
Webinar La Referencia/COAR – 22 May 2013 59
Outline
Introductory concepts and driving considerations
The CHAIN-REDS Knowledge Base
The KLIOS semantic enrichment
Semantic search on CHAIN-REDS Linked Data
Summary and conclusions
Webinar La Referencia/COAR – 22 May 2013 60
e-Infrastructure
“e’-Infrastructure is an environment where research resources (hardware, software and content) can be readily shared and accessed where necessary to promote better and more effective research. Such environments integrate hard-, soft- and middleware components, networks, data repositories, and all sorts of support enabling virtual research collaborations to flourish globally.” (*)
(*) EC-endorsed definition: http://cordis.europa.eu/ictresults/index.cfm?ID=90825§ion=news&tpl=article
Webinar La Referencia/COAR – 22 May 2013 61
What do researchers do and how
can e-I’s help them to improve it ?
Data Infrastructures
Open Access Doc. Repos.
Data Repos.
Sem
an
tic-w
eb
en
rich
men
t o
f lin
ked
data
Data
pre
servati
on
HT
C/H
PC
Clu
sters
Gri
ds,
Clo
ud
s
The Scientific Method (worldwide,
cross-domain,
collaboration enabler)
Webinar La Referencia/COAR – 22 May 2013 63
Reshaping Collaborations.
from Networks to Communities
Building
innovation communities
from an unlimited bandwith
e-infrastructure
• Hiperconnected faculties & students
• Virtual Research Communties
• Increasing sustainability
Webinar La Referencia/COAR – 22 May 2013 64
Projects Cooperating
Building VRC and
Sustainability Plans
EELA
GISELA
CHAIN
ALICE2
CHAIN-REDS
ELCIRA
MesoAmerica
EELA-2
ALICE2 defines RedCLARA Live Product Cycle
definitions. Deploys important connectivity e-
infrastructure & RedCLARA Portal Services.
EELA-EELA2. Building and consolidated e-
infrastructure
GISELA profits from the operation of the e-
infrastructe & LPC devices a Services Model and
builds an Advanced Computing Business Plan.
Start the VRC concept
CHAIN :
Uses the LPC definitions & Identifies Advance
Computing Services to build a wide portfolio
Strengthens the VRC Concept
Provides Science Gateway & Identity Federation
Fosters Sustainability
ELCIRA Deploys Identity Fed, EU-LA, HD
VideoConf Standards, VRC Building
MesoAmerica, Uses e-infrastructure expertise
in disaster mitigations in Central America
Sharing interest
in VRC and
Sustainability
Plan for services
Before
CHAIN
Webinar La Referencia/COAR – 22 May 2013 65
Science Gateway Approach for
Services for Researcher &
Student Communities
Webinar La Referencia/COAR – 22 May 2013 66
Community Model
• Under Mesoamerican Integration and Development Project
(MIDP) IDB Funded Project
http://www.proyectomesoamerica.org/
• Sharing Sensors, Computing & Communications Resources
• Profiting from Data Management for modeling severe climate
events
• Defining Mitigation actions and responses to handle severe
climate events
• Mexico, Central America Countries, Colombia & Caribbean
Countries
• RedCLARA IDB Promoted VRC
• Researchers from: mx,gt, sv, cr, pa, co, ve, ec, cl
✔
✔ ✔ ✔ ✔
✔ ✔
✔
✔ ✔
Webinar La Referencia/COAR – 22 May 2013 67 67
The CHAIN-REDS Project (www.chain-project.eu)
Started: 1 Dec 2012
Duration: 30 months
Targeted regions: Africa,
Middle-East and Gulf
Region, Latin America,
China, India, and
Far-East Asia
Webinar La Referencia/COAR – 22 May 2013 68 68
The CHAIN-REDS virtuous cycle
Sustainability
Access
Inclusion
Webinar La Referencia/COAR – 22 May 2013 69
International Collaboration DCI •Provide ongoing support of the DCI road-map for intercontinental DCI collaboration, specified within the CHAIN project
Regional Operation Centres ROC •Support stability of existing and emerging Regional Operation Centres. Cooperate with other projects & initiatives (e.g. AfricaConnect, TEIN3) to support the development of eInfrastructures and key VRCs in Africa, Asia, Latin America and the Middle-east
For Research and Education Cloud •Support for coordination of Cloud developments for Research & Education with other regions (e.g. China, India, Latin America)
Infrastructures and Repositories Data •Extend the CHAIN Knowledge Base with information on Data Infrastructures: collecting issues, best practices and identifying data repositories of direct interest for VRCs
Support the study of data infrastructures for a target subset of VRCs (e.g. Climate Change, HEP-SuperB, Genomics, etc.)
Science Gateways SG •Promote the usage of Science Gateways as a means for attracting new communities and promote the use of eInfrastructures for every researcher
Federations of Identity Providers IDF •Foster the creation of Identity Federations in cooperation with Certification Authorities; promote and coordinate their usage. Support integration of different AA approaches
Chain Ingredients
Webinar La Referencia/COAR – 22 May 2013 70
The CHAIN Knowledge Base (www.chain-project.eu/knowledge-base)
RREN(s)
NREN
NGI
CA(s)
Ident. Fed(s)
ROC(s)
Grid site(s)
Application(s)
Largest e-Infrastructure related knowledge base. Information both from the
survey and other sources for more than half of the countries of the world
Webinar La Referencia/COAR – 22 May 2013 71
CHAIN-REDS program for
Data Infrastructures
Identify standards to easily gather and access both Open Access
Document Repositories (OADRs) and Data Repositories (DRs)
Build a demonstrator to easy visualise and access OADRs and DRs
(both geo-views and tab-views)
Correlate OADRs and DRs to create linked data and discover
new knowledge through semantic enrichment of metadata
Promote Data Infrastructure standards and identify new OADRs
and DRs from regions addressed by the project (Africa, Middle-
East and Gulf Region, Latin America, China, India, Far-East Asia)
Populate the demonstrator with these new repositories, add them
to the semantic enrichment tool, and set-up at least two use-cases
from different domains
Webinar La Referencia/COAR – 22 May 2013 72
Open Access Document
Repositories (OADRs)
• 2,500 repos
• >33 M docs
Webinar La Referencia/COAR – 22 May 2013 78
KLIOS: Knowledge Linking and sharIng in research dOmainS - http://klios.ct.infn.it
Aims to develop an open access, participatory
infrastructure for linking scientists and scientific
data/information resources
The approch is based on two fundamental pillars:
Interconnection and integration of scientific resources through
semantically enriched metadata
Social network of scientists as well as non-experts (the
«citizen scientist»)
Webinar La Referencia/COAR – 22 May 2013 79
Linked data semantic search
Semantic enrichment
Metadata harvesting
Multi-layered
architecture
Webinar La Referencia/COAR – 22 May 2013 80
OA
DR
s
Data
Rep
os.
OAI-PMH OAI-PMH
Harvester
(running on
grid/cloud)
Linked-data search engine
Semantic-web enrichment
End-points
Harvester
(running on
grid/cloud)
Multi-layered architecture
Webinar La Referencia/COAR – 22 May 2013 81
Summary and conclusions
Data Infrastructures are becoming an essential component of e-
Infrastructures
Next years’ biggest challenge will be to uniquely correlate scientific
papers with data used to write them with applications used to analyse
them so to be able to go across the knowledge path both ways
Semantic-web and linked-data technologies can play a major role in this
context and CHAIN-REDS aims to promote these standards in the
targeted regions
OADRs’ and DRs’ managers/owners in are welcome to contact me to
share their data within the CHAIN Knowledge Base (both in Africa and
Latin America this is already happening)
CHAIN-REDS is also looking forward to receiving feedbacks from all
interested organisations on the Knowledge Base and the semantic
search service