46
Depozite digitale pentru instituții de cercetare și surse de informații privind Accesul Deschis în România și Uniunea Europeană IFIN HH, București, ianuarie, 2016 Kosson Nicolaie Constantinescu, arhitect informațional

Depozite digitale pentru instituții de cercetare și surse de informații privind Accesul Deschis în România și Uniunea Europeană

Embed Size (px)

Citation preview

Depozite digitale pentru instituții de cercetare și surse de informații privind Accesul

Deschis în România și Uniunea Europeană

IFIN HH, București, ianuarie, 2016

Kosson

Nicolaie Constantinescu, arhitect informațional

Câteva motive pentru care trebuie să ai „locul” tău în ecosistemul

informațional local

https://www.flickr.com/photos/dmh650/4031607067/in/gallery-wlef70-72157633022909105/

Clădirea 514, CERN

Ferma de servere din clădirea principală are 1450m2 și găzduiește un Tier 0 de prelucrare a datelor.

Tier O reprezintă însăși capacitatea de calcul al Centrului de date CERN

Capacitatea de calcul și stocare este dezvoltată pe 1200m2, până la 20000 de unități de calcul și stocare, 40 km de cablu, 3200 m de țează de oțel, 400.000 de ore de muncă. Este un Tier 0

http://home.cern/about/computing

Tier 0 distribuie datele brute și rezultatele reconstruite către structurile de calcul de tip Tier 1 și reprocesează datele atunci când LHC nu lucrează.

Tier 1 constă din 13 centre de prelucrare computerizată din întreaga lume îndeajuns de mari pentru a prelua (10Gb/s prin Rețeaua privată de fibră optică a LHC - LHCOPN) și stoca datele LHC. Au și rolul de a distribui date către Tier 2.

Tier 2 sunt universitățile și alte institute de știință care stochează îndeajuns de multe date și oferă îndeajuns de multă putere de prelucrare pentru sarcini de analiză specifice.

Tier 3 sunt clusterele locale din departamentul unui institut sau chiar un PC ca unitate individuală.

România participă prin Romanian Tier-2 Federation (7 instituții) din a cărei componență fac parte NIPNE și IFIN HH

Necesitatea unei infrastructuri care să asigure servicii de calitate

Softwarecu sursedeschise

StandardeDeschise

România: 12 instanțehttp://www.dspace.org/

http://files.eprints.org/

http://invenio.readthedocs.org

http://kosson.ro/know-how/212-oais-modelul-functional

REFERENCE MODEL FOR AN OPEN ARCHIVAL INFORMATION SYSTEM (OAIS)

http://ckan.org/

JSON

XML MARC21

http://cds.cern.ch/

ELI - THE EXTREME LIGHT INFRASTRUCTUREELI - THE EXTREME LIGHT INFRASTRUCTURE

THE ELI - NUCLEAR PHYSICS FACILITY THE ELI - NUCLEAR PHYSICS FACILITY

Biblioteca are un rol mult

mai activDate

Contribuțiilecercetătorilor

Servicii

Tehnologie

Management

Expertiză

Științe Deschise

AccesDeschis

DateDeschise

Cercetaredeschisă

reproductibilă

Însemnări de laborator/experiment

Instrumentede

evaluare

Politicilenecesare

deschiderii

Instrumentede lucrudeschise

Fluxuri de lucru ușor de reprodus

Instrumente licențiate deschis pentru cercetare

Metrici noi de evaluare

Folosirea datelor în formate standardizate

Îngemănarea politicilor guvernamentale cu cele ale Finanțatorilor cercetării și ale

Instituțiilor de cercetare

Depozite digitale deschise

Depozitul digital trebuie considerat parte a valorificări interne a rezultatelor de cercetare, a rețelei de referințe bibliografice locale, naționale și internaționale și o componentă activă a procesului de cercetare prin indicatorii și metricile pe care le poate genera.

Stabilirea autorității privind înregistrările

Atribuirea de identificatori pentru Cercetători – de tip ORCID,

Articole și/sau date – de tip DOI (Crossref)

Specialiștii bibliotecii stabilesc, creează, adoptă și atribuie vocabularele controlate

pentru facilitarea indexării și regăsirii

Stabilesc în consultare cu departamentele de cercetare grupurile și comunitățile

de date și informații din depozitul digital

Asigură stabilirea și întreținerea mecanismelor de prezervare digitală

a conținutului

Asigură compatibilitatea și schimbul de datecu instituții similare din țară și străinătate

Oferă metrici propriilor cercetători privindpropriile contribuții

Elaborează politicile privind- DMP – Data Management Plan

- TDM – Text and Data Mining

Elaborează și recomandăpoliticile privind Accesul Deschis de la

politică editorială până la licențele și termenii drepturilor de autor

Asigură migrarea conținutului din punct de vedere al formatelor bibliografice

Necesar:

● Mandatarea bibliotecii pentru a crea infrastructura● Un mandat pentru dezvoltarea unei politici interne privind publicarea rezultatelor folosind licențe deschise

● Interconectarea depozitului digital cu resursele la nivel european precum openaire.eu

● Instruirea prin intermediul bibliotecii a întregului personal privind publicarea deschisă a rezultatelor de cercetare

● Scanarea resurselor de cercetare care sunt cele mai importante și constituirea unei colecții care să acopere contribuțiile retroactiv.

● Pilotarea unui sistem de colectare a notelor de laborator în infrastructura bibliotecii.

O largă cunoaștere aîntregului ecosistem utilizat de cercetătorii proprii.

În acest moment, cercul de colaborare nu se mai oprește la nivelul institutului.

Datele și lucrările de cercetare sunt supuse atenției colegilor înainte de publicarea propriu-zisă

Publicații

Postere

Prezentări

Seturi dedate

Imagini

Audio /Video

Software

Cursuri

Plan de diseminare

Rezultate de cercetare

Plan de management

al datelorCE

RC

ETA

RE Decizie de

diseminare/distribuire

Decizie deexploatare/protejare

Publicații

Depozitareadatelor de cercetare

Patentare (sau alte forme de

protecție)

Accesare și Utilizare fără

taxare

Restricționarea Accesului și/sau a

utilizării

AD de aur

AD verde

http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf

http://access.okfn.org/2015/08/26/pasteur4oa-data-visualisations/

ROARMAP: http://roarmap.eprints.org/ (octombrie 2015)

www.pasteur4oa.eu

http://www.pasteur4oa.eu/sites/pasteur4oa/files/resource/Policy%20typology%20-FINAL.pdf

https://ec.europa.eu/commission/2014-2019/oettinger/blog/open-science-knowledge-and-data-driven-economy_en

Günther Oettinger

Comisar pentru Economia Digitală și Societate Digitală

Carlos MoedasComisar Cercetare, Știință și Inovare

Bruxelles, 22 iunie, 2015

Reprezintă o schimbare sistemică în modus operandi al științei și cercetării. Afectează întregul ciclu al cercetării și toți actorii săi, crește știința prin facilitarea unei mai mari transparențe, deschideri, interconectare, colaborare și refocalizează știința de la paradigma „publish or perish” (publică sau dispari) la perspectiva cunoașterii distribuite.

Despre ce este Despre ce este știința deschisă?știința deschisă?

Știința Deschisă descrie tranziția continuă a modului în care se face cercetarea, cercetătorii colaborează, cunoașterea este distribuită și știința este organizată.

https://ec.europa.eu/research/consultations/science-2.0/consultation_en.htm

https://ec.europa.eu/digital-agenda/en/open-science

http://ec.europa.eu/research/openscience/index.cfm

ȘTIINȚĂ DESCHISĂ

http://ec.europa.eu/research/conferences/2015/era-of-innovation/index.cfm

a new path for European a new path for European

research and innovation policyresearch and innovation policy

„Avem nevoie de mai mult acces deschis la rezultatele de cercetare și datele pe care se generează”http://europa.eu/rapid/press-release_SPEECH-15-5243_en.htm

„trebuie să ne uităm serios la date deschise”

Politica Olandeză privind Știința Deschisă

„În această politică, rezultatele de cercetare finanțate public, trebuie să fie liber disponibile fără taxare pentru toată lumea. Aceasta va fi o prioritate pe perioada Președenției Olandeze a Uniuni Europene în primul semestru al lui 2016”.

Sander Dekker

Secretar de Stat

Pentru Educație,

Cultură și

Știință

Olanda

https://ec.europa.eu/commission/2014-2019/moedas/announcements/commissioner-moedas-and-secretary-state-dekker-call-scientific-publishers-adapt-their-business_en

Declarație comună Bruxelles, 12 octombrie, 2015

OPENAIRE

Colaborareștiințifică deschisă

Știință Deschisă

24

Contextualizarea cercetării

Promovarea și alinierea politicilor privind AD

Infrastructuri naționale

interconectate

Legături către infrastructuri de date

pe domenii

O legăturăla inițiativeleguvernamentale pentru date deschise

O legătură către educația deschisă și mediile de învățare

Infrastructură participatorie

Cine suntem•Începând cu dec 2010

• OpenAIRE• OpenAIREplus• OpenAIRE2020• O entitate de sine stătătoare

din 2016

•Un consorțiu de 50 de

parteneri

perspective instituționale, naționale și internaționale privind politicile AD, e-infrastructuri

Experți în Accesul Deschis

• Elaborarea unor tehnologii pentru infrastructuri

• big data, linked data

Experți în domeniul informațiilor și informaticieni specializați

• Recomandări legale și pe politici

Experți zona legală

• Bune practici privind datele• Legături cu infrastructurile de date

Comunități de date

25

26

Depozite literatură

Reviste AD

Info finanțări

Validare

Curățare

Deduplicare

Inferring

Interconectare

Organizații

OrganizațiiProiecteProiecte

AutoriAutoriSeturi date

Seturi date

PublicațiiPublicații Furnizori date

Furnizori date

Monitorizare

Raportare

Evaluare

Impact

Clasificare

Clustering

Analiză

Sisteme CRIS

Un mini EU-CRIS system

Depozite date

Metadata

Text integral

Date deutilizare

Regăsire informație

Crowdsourcing

Zenodo

API-uri

Furnizori de date Platforma OpenAIRE Servicii

Rezultate: Un sistem de informare științific integrat

11.5 mil. De publicații unice

7 mil. autori590+ furnizori de date130 K publicații legate

de proiectele lor de la 3 agenții de finanțare 5.5 K seturi de date legate la publicații33 K de organizații

27

Rețeta

28

1. Date deschise…pentru distribuire, reutilizare, validare… de la sursă

2. Interoperabilitatea datelor furnizorilor…normalizare, îmbogățire, date interconectate

3. Servicii robuste oferite…pentru creșterea încrederii …Pentru preluare de la părți terțe

Procese de luare a

deciziilor transparente

și testate

1. Deschidere•Peisajul divers al Europei necesită sprijin la nivel local

•Practici diferite, mentalități diferite

29

O rețea de specialiști•33 de noduri expert în

toată Europa•Alinierea politicilor (AD)•Asistență tehnică• Instruire

• Un pas către

comunitatea

internațională prin COAR

2. Interoperabilitate•Ghiduri și standarde

•Ghiduri OpenAIRE guidelines pentru literatură, date, CRIS•Aliniere Globală și standarde (RDA, WDS, W3C, …)

•Folosirea schemelor de identificatori•Sinergii cu e-infrastructurile existente

•Vocabulare uniforme•Clasificare interdisciplinară•Multilingvism (ex., EUROVOC)

•Legături către alte domenii•Maparea modelelor de date (DCAT, LOM, …)•LOD – Date Deschise Interconectate

30

3. O infrastructură orientată pe servicii•Suport & Instruire

•Distribuirea rezultatelor științifice•Publicare AD & Depozitare•Validare și evidență

•Regăsirea informațiilor & Crowdsourcing

•Raportate & Monitorizare

•Analize pe date de utilizare

•…

31

32

Grant id level

From text mining

MONITORIZAREReportare

35

Estimate AD privind FP7

36

FP7116.6K publicationsLinked to 11.5 K projects50% OA

0

5000

10000

15000

20000

25000

0

5000

10000

15000

20000

25000

O creștere a publicațiilor din proiectele FP7 în depozitele instituționale

Alte tipuri de monitorizări

37

ENV

38

7%

50%

29%

8%

5%

Distribution of publications by Journal Impact Factor value

<2 2 to 5 5 to 10 10 to 15 >15

Journal of antimicrobial chemotherapy (SJR: 2.4)

Nature (SJR: 21.3)

Journal of neuroscience (SJR: 5.8)

Human molecular genetics (SJR: 5.0)

Nature genetics (SJR: 24.1)

Proceedings of the National Academy of Sciences of the US (SJR: 7.0)

Nucleic acids research (SJR: 6.7)

Journal of biological chemistry (SJR: 3.4)

Antimicrobial agents and chemotherapy (SJR: 2.4)

PLoS One (SJR: 1.7)

0 100 200 300 400 500

147

147

154

162

185

186

197

218

233

1222

Number of publications by periodic: top 10

42%

35%

16%

7%

Distribution of publications by SJR value

<2 2 to 5 5 to 10 >10

Nature Medicine (SJR: 11.0)

Immunity (SJR: 14.3)

Nature Neuroscience (SJR: 11.9)

Neuron (SJR: 12.9)

Molecular Cell (SJR: 14.7)

Nature Methods (SJR: 10.7)

Science (SJR: 12.5)

Cell (SJR: 28.2)

Nature (SJR: 21.3)

Nature Genetics (SJR: 24.1)

020

4060

80100

120140

160180

200

40

41

41

47

48

75

75

77

147

185

Number of publications in periodics with SJR>10: top 10

Legături la baze de date

externeex., Scimago

ANALIZE PE DATE DE UTILIZARE

pentru a sprijini procesul decizional

39

Ce analizăm?•Mediul academic – cine ce face, care sunt tematicile

în top / trendurile•O cartografiere a autorilor, relațiilor, colaborărilor,

trendurilor, …

•Analiză pe rezultatele de cercetare pentru sprijinirea

deciziei politice•Comunități, corelații, domenii științifice• Identificarea lipsurilor și a tendințelor atipice•Corelare cu programele de finanțare• ...

40

1 2 3

From data acquisition to analysis

Get the data. Involve as many sources as possible.

Clean. Clean. Clean.

Link to many data sources & external dbs.

Classify content based on known classifications.

Cluster and classify based on statistical methodology – Find the unknown (trends)

Work with experts to give meaning to statistical output.

Visualize: use online tools to see different facets.

41

Clustere

42

43

Corelații

Relation of HEALTH programme to other

FP7 programmes based on TDM/topic modelling

techniques.

Machine Learning, Feature selection, .. is “hot” after 2003 Trenduri44

https://www.openaire.eu/postgrantoapilot

www.openaire.eu@openaire_eufacebook.com/groups/openaire linkedin.com/groups/OpenAIRE-3893548

Thank you!

kosson@gmail

46

Vă mulțumesc!