Estado de situación del Acceso Abierto en Argen3na: Ges3ón de Datos Cien8ficos
Fernando Ariel López @fernando__lopez | [email protected]
Quién es Quién 2016 “Creando futuro: tecnologías
e innovación en las bibliotecas universitarias”
7 de octubre de 2016
¿Qué es el Acceso Abierto? El acceso libre, gratuito, inmediato y sin restricciones a la literatura cienMfica, a través de Internet. Cualquier persona puede leer, descargar, copiar, distribuir, imprimir, comparQr y enlazar los textos completos de producción cienMfica, sin barreras financieras, legales o técnicas. La única limitación es citar al autor y respetar la integridad de la obra.
Caminos para lograr el Acceso Abierto
vía DORADA
REVISTAS CIENTÍFICAS
• Portales de Revistas CienMficas: – Regionales – TemáQcos – InsQtucionales
vía VERDE
REPOSITORIOS
• InsQtucionales • TemáQcos • Cosechadores • de Datos …
vía DORADA
• LaQndex = 3774 revistas en Directorio = 670 revistas en Catálogo
• SciELO = 126 revistas (118 vigentes) • NBR = 217 revistas • Redalyc = 75 revistas (22.640 arMculos y 1872 fascículos) • DOAJ = 128 revistas (en proceso de reevaluación)
Portales de Facultades y Universitarios
vía VERDE SNRD (MINCYT): * Datos al 14/06/2016
-‐ 40 repositorios digitales adheridos al SNRD (proyectos, en desarrollo e implementados)
-‐ 18 repositorios digitales adheridos e integrados al Portal SNRD.
-‐ 74.391 objetos digitales disponibles en Acceso Abierto a través del Portal SNRD.
-‐ 9 proyectos financiados por el SNRD.
-‐ $ 2.310.626 es el monto total aprobado para los proyectos de financiamiento.
Ley 26.899 Creación de Repositorios Digitales Ins3tucionales de Acceso Abierto, Propios o Compar3dos (noviembre de 2013)
• producción cienMfico-‐tecnológica: arMculos de revistas, trabajos técnico-‐cienMficos, tesis académicas, entre otros.
• 6 meses después de la fecha de su publicación oficial o de su aprobación. • DATOS PRIMARIOS: 5 años del momento de su recolección.
Los DATOS son el petróleo…
… pero si no se ges3onan NO SIRVEN
BIG DATA à REDES SOCIALES + IOT + Smart City
CIENCIA à Ciencia Abierta GOBIERNO à Gobierno Abierto
LEGISLACIÓN • LEY 26.899 (2013)
Creación de Repositorios Digitales InsQtucionales de Acceso Abierto, Propios o ComparQdos
• RESOLUCIÓN 538 de JFG (2013) Sistema Nacional de Datos Públicos
• DECRETO 117 (2016) Plan de Apertura de Datos
• Ley Acceso a la Información Pública (2016) Acceso a la Información Pública
¿De qué DATOS me hablas? LEY 26.899 (2013)
• Datos Primarios (data set) • Plan de Ges3ón de Datos (DMP) • Deposito “data set” en Repositorio de Datos • Fecha: Diciembre de 2018
DECRETO 117 (2016) • Datos Públicos (organigramas del EjecuQvo; declaraciones juradas de funcionarios; personal contratado; escalafones y escalas salariales; contrataciones públicas; y las solicitudes de AIP).
• Relanzamiento del “Portal Nacional de Datos Públicos” • Fecha: 11 de Julio de 2016
→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)
→ pueden ser numéricos, descriptivos o visuales.
→ pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales.
→ pueden ser abiertos o cerrados
¿Qué son los datos de invesQgación? ¿Qué son los datos de investigación?
Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba.
Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras.
En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.”
¿Qué son los datos de invesQgación? ¿Qué son los datos de investigación?
Observacionales: datos capturados en tiempo real, comúnmente únicos e Experimentales: datos provenientes de resultados experimentales Ej: Aquellos que provienen de aparatos de medición en laboratorios, comúnmente reproducibles, pero caros. Simulación: datos generados de modelos de prueba donde el modelo y los metadatos pueden ser mas importantes que los datos de salida del modelo. Ej: Modelos económicos o climáticos. Desarrollados o compilados: resultado de procesar y/o combinar datos “crudos”, comúnmente reproducibles pero caros. Ej. Bases de datos compiladas,Resultados de text mining, Datos de censos
consolidados. Reference or canonical: Una (estática u orgánica) conglomeración o colección de datasets mas pequeños (revisados por pares), la mayor parte de ellos publicados y “curados” Ej. Bancos de datos genéticos, bases de datos cristalográficas.
¿Qué son los datos de invesQgación? Tipos de Datos Científicos
● Es una colección de datos reunidos durante la ejecución de un proyecto de invesQgación.
● Son objetos digitales compuestos y heterogéneos. ● ConsQtuye la base de la invesQgación y va asociado a una publicación
cienMfica (resultado de la invesQgación). ● Se almacena y gesQona en Repositorios Interoperables conforme a
estándares internacionales.
Es el objeto específico de control, organización,
descripción y preservación de datos científicos
DATASET
BENEFICIOS #DatosAbiertos
● Ayuda a verificar los resultados. ● Evitar la fabricación y falsificación de datos. ● Diferentes interpretaciones o enfoques aplicados a datos existentes contribuyen a los avances cienMficos.
● OpQmización en el uso de recursos. ● Preservación a largo plazo bien gesQonada, permite mantener la integridad de los datos.
TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and
Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101
ACTORES INVOLUCRADOS Bibliotecario embebido Curador de Datos Bibliotecarios de Datos / DataLabririan
CIENCIA
Líneas de Trabajo:
1. POLÍTICA DE DATOS CIENTÍFICOS 2. CICLO DE VIDA DE LOS DATOS CIENTÍFICOS 3. PLAN DE GESTIÓN DE DATOS CIENTÍFICOS
4. E-‐INFRAESTRUCTURAS
1. Diseño y planificación de la creación/extracción de datos
2. Creación/Extracción de Datos 3. Limpieza, Normalización y Descripción de Datos
4. Almacenamiento y Preservación de Datos
5. Exploración, Explotación y Visualización de Datos 6. DataMining & Knowledge Discovery
CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
¿Qué es un PGD? Un plan de ges3ón de datos cien8ficos (Data Management Plan -‐ DMP) es un documento elaborado por el invesQgador o grupo de invesQgación donde se define:
• qué datos van a ser creados y cómo,
• cómo se van a describir, organizar, almacenar y gesQonar los datos
• de qué forma van a ser comparQdos, explicando cualquier restricción de uso
• que pueda ser aplicada.
• Quién o quiénes serán los responsables de realizar cada una de estas
• acQvidades.
• de qué forma van a ser comparQdos, explicando cualquier restricción de uso
• que pueda ser aplicada.
DMP ArgenQna (CAICYT-‐CONICET)
Propuesta para Proyecto de InvesQgación: • Bloque de Datos administraQvos • Bloque de Recolección de datos • Bloque de Documentación y metadatos • Bloque de Almacenamiento y copias de
seguridad • Bloque de Selección y preservación • Bloque de Re-‐uso de Datos
e-‐INFRAESTRUCTURAS Repositorio Interoperable de Datos• Datos Públicos Argentina (CKAN, OKF),• Zenodo (Invenio, CERN)• DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),• Harvard DATAVERSE (Eprints)
Plataforma de Trabajo para Investigadores• OSF, HubZero, MyExperiment.org, etc.
Cluster de Almacenamiento y/o Procesamiento
NUEVOS PERFILES
La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísQcos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos.
Data Scien3st / Cien8ficos de Datos
Bibliotecari@ de Datos / Data Librarian
Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.El perfil del bibliotecario de datos requiere:• Competencias informáticas• Conocimiento de la disciplina (corpus, prácticas de
investigación y flujos de trabajo)• Gestión de datos:
q adquisición (desarrollo de la colección),q organización (catalogación y metadatos),q preservación y conservación a largo plazoq implementación de servicios adecuados para los
usuarios.
NUEVAS COMPETENCIAS
COMPETENCIAS
• Estadística, Algebra y Programación• Tecnologías y Formatos Abiertos• XML, PYTHON, R, etc.• Herramientas de normalización, procesamiento
y visualización.• Comunicación (visual y audiovisual)
• Diseño Centrado en el Usuario (UX)
OPORTUNIDADES Comunidad Cien8fica:
• Acordar estándares de trabajo, normalización y ges3ón de datos
• Empoderar en Ges3ón de Datos Cien8ficos
• Contribuir al avance de la ciencia, maximizando la visibilidad y el
impacto de la inversión en Inves3gación
• Financiamiento y Desarrollo de e-‐infraestructuras para el
aprovechamiento de la Big Data Cien8fica
• Encuentro con otras comunidades de Gobierno Abierto, Periodismo
de Datos, HackAcQvismo Cívico, IoT, etc.
• Repensar formas de producción, medición e impacto cien8fico
¿PREGUNTAS?
Recommended