Community Workshop - The NFDI Consortium for Biodiversity ... · Biodiversity Research Data Commons...

Preview:

Citation preview

Frank Oliver Glöckner and Michael Diepenbroek

Kubus Leipzig, 06.06.2019

Community Workshop

21998

3

Good Scientific Practice

Recommendation 7: Safeguarding and Storing of Primary Data

Primary data as the basis for publications shall be securely stored for ten years in a durable form in the institution of their origin.

The disappearance of primary data from a laboratory is an infraction of basic principles of careful scientific practice and justifies a prima facie assumption of dishonesty or gross negligence (9).

(9) Danish Committee on Scientific Dishonesty: Guidelines for Data Documentation, in: DCSD Annual Report 1994, København: The Danish Research Councils 1995

4

Value of Research Data

2007

2010

5

Value of Research Data2011

2014

6

Example DFG – DMP

FAIR Data

http://www.dfg.de/download/pdf/foerderung/antragstellung/forschungsdaten/guidelines_biodiversity_research.pdf

2015

7

Summary

THE GERMAN COUNCIL FOR SCIENTIFIC INFORMATION INFRASTRUCTURES

About the RfII

§ Founding resolution 2013, establishment 2014

§ Advisory board of the Joint Science Conference

§ Initially a four-year pilot phase, extended for another 4 years

§ 24 members, nominated using the same process as for the German Council of Science and Humanities

§ The composition of the Council “reflects our conception that the future of scientific information infrastructures is a joint task of the providing institutions, the scientific users, the funders, and related national and international stakeholders." (Joint Science Conference paper 13.48, 2013)

2

Diagnose

§ Dramatisches Anwachsen der Menge/Heterogenitätan Forschungsdaten in Deutschland- Forschungsdaten sind alle Daten, die im Zuge wissenschaftlicher Vorhaben entstehen, z.

B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen.

§ Viele informative Stellungnahmen zu FDM,aber „Vollzugsdefizit“

§ Erheblicher Finanzierungs- und Personalbedarf

§ Zahlreiche Hürden bremsen den Wandel- Heterogene Förderlandschaft, fehlende Koordination, Technik- statt Prozessorientierung,

fachkulturelle Diversität und unklare Qualitätssicherungs- sowie Reputationsmechanismen, „Projektitis“ ohne Verstetigungschancen für erfolgreiche Projekte, Unsicherheiten der Akteure in Bezug auf strategische Investitionen

Vgl. RfII (2016)4

§ Nachhaltige Antwort auf den digitalen Wandel: Qualität und Dynamik von Datennutzung im Zusammenspiel mit digitalen Methoden im Gesamtsystemvoranbringen

§ Dienste-Portfolios organisiert entlang fachlich-thematischer Domänen, starke Rolle der wissenschaftlichen Datenerzeuger und -nutzer

§ Vernetzung horizontal zu den bestehenden Säulen im Wissenschaftssystem

§ Bundesweit gleichermaßen gute Versorgung mit Forschungsdaten-infrastrukturen (über Fach- und Institutionengrenzen hinweg)

§ International, und speziell europäisch, eingebunden („starker Knoten“ der EOSC)

Zum Konzept der NFDIKurzüberblick

5

Nationale Forschungsdateninfrastruktur (NFDI)Blick auf die Zeitschiene

Empfehlung RfII

Forschungsdaten-management als gemeinschaftliche Aufgabe der Wissenschaft und ihrer Träger

Grundsatzbeschluss GWK

Errichtung einer NFDI,Auftrag an Ad-hoc-AG

Zahlreiche positiveReaktionen aus demWissenschaftssystem

Vorbereitung der Umsetzung

Kommunikation/Planung in der Wissenschaft

Bund-Länder-Vereinbarung (Nov 2018)

2016 2017 2018 2019/20

Start der NFDI

Beginn des Auswahl-verfahrens (DFG)

Findung Direktorat und Einrichtung Geschäftsstelle

Kick-ff Konsortien (ca. Mitte 2020)

Parallelprozess EOSC

Coordination, working groups, standards, certification…

7

13

https://ww

w.dfg.de/foerderung/program

me/nfdi/index.htm

l

§ Gemeinsame Förderung durch Bund und Länder (Verhältnis 90:10)

§ Start 2019, mit der ersten von drei Ausschreibungsrunden und Findung Direktorat

§ Förderzeitraum zunächst 10 Jahre, in der Endausbaustufe bis zu 90 Mio. € pro Jahr

§ Ausgestaltung durch Nutzer und Erzeuger von Forschungsdaten, im Zusammenwirken mit Einrichtungen der wissenschaftlichen Infrastruktur („NFDI-Konsortien“)

§ Wissenschaftsgeleitetes Verfahren zur Begutachtung der Förderanträge von Konsortien, durchgeführt durch die Deutsche Forschungsgemeinschaft (DFG)

Ende 2018: Bund-Länder-Vereinbarung zur NFDIBeschluss der GWK - Eckpunkte

8

16

What is already available?

User oriented, national data infrastructure facilitating data sharing for biological and environmental research.

Established 2013

www.gfbio.org

17

Transition

DFG funded “Research” project with 20 partners

Single legal entity, sustainable

18

Whom do we serve? Biodiversity Community

• Diversity of

• Species

• Genomes

• Functions

• Interactions

• Ecosystems

Pictures provided by Wolfgang Reichert

19

Who are we? Institutions and Infrastructures

20

Who are we? Universities

Objectives & Work Program

Objectives

• Data management as an integral part of research• Lack of funding for data management• lack of awareness for existing data management services• data infrastructure services not optimally adapted to scientists needs• missing incentives for the management, archiving, and publication of data.• Insufficient data management skills -> data science

• FAIRness of data (re-usability)• data scattered across repositories, not findable and/or not accessible at all, • heterogeneity of measurements and observation types• substantial lack of standard compliance• Lack of interoperability

• Embedding NFDI4BioDiversity into the national & international landscape of data infrastructure services and science.• Fragmentation of existing data infrastructures, initiatives, & projects

Work program

• User engagement J• Data management services - FAIRness• Data integration, exploration, and exploitation• Cross-community engagement – ONE NFDI• Governance & sustainability of supplied infrastructures and services

User engagement

• Requirements analysis for the digital change - SWOT• Education – curricula, training• Reputation systems• Project data management (early mobilization of data)• Instant quality surveys, user feedback, quality management• Learned societies, authorities, organisations, associations

• GBIF, VBIO, GfÖ, GfBS, BfN, DZG, RDA, GoFAIR …

• Active participation in the development, maintenance & governance of NFDI4BioDiversity

User engagement

Expand our community• Crop science – system plant• Farm animals – functional biodiversity• Systems Biology – model management• Citizen Science – monitoring• de.NBI network – catch the users by data analysis

Data management services - FAIRness

• Data production & acquisition• Curation/Harmonisation• Archiving• Publication• Quality management and standards• Certification

Data integration, exploration, and exploitation

• virtual expandableinfrastructure• building on and

extending the federated infrastructure GFBio• allows users to store,

share, combine, & analyse diverse data• also cross-domain –

linking NFDI consortia

BiodiversityResearch Data Commons (BRDC)

BiodiversityResearch Data Commons (BRDC)

• Data structures• Content standards

• Semantics• Terminologies,

taxonomies• Concepts

BiodiversityResearch Data Commons (BRDC)

• Technical data types & packaging• Measurement &

observation types• Users & usages

(domains, tools …)• Producers

• Spot measurements to time series (days to decades)

• Local to global data• Observation data• Experimental data• Collected to sensor

data• Remote sensing

BiodiversityResearch Data Commons (BRDC)

Data availability & usability

Infrastructure development

Collaborative applications, Data science

• Development process

BiodiversityResearch Data Commons (BRDC)

Thank You

https://www.gfbio.orginfo@gfbio.org

Recommended