Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Infrastructure de recherche PNDB
(Pôle National de Données de Biodiversité)
Yvan LE BRAS, Chef de projet (UMS PatriNat)
Anne-Sophie ARCHAMBEAU, GBIF-France (UMS PatriNat)
Cécile CALLOU, Dir UMS BBEES (CNRS-MNHN)
Aurélie DELAVAUD (FRB)
Dominique JOLY, DAS CNRS (INEE)
Laurent PONCET, Dir. Adj., en charge du Centre de données (UMS PatriNat)
Jean-Denis VIGNE, DGD-Recherche, expertise, valorisation, enseignement (MNHN)
Séminaire SIST 5-8 nov. 2019
1. Hétérogénéité des données (et des communautés scientifiques)
• En fonction du domaine• En fonction des technologies• En fonction des usages
2. Dispersion de la donnée • Au niveau des Infrastructures• Au niveau des organismes de recherche• Au niveau des laboratoires et projets
3. Interactions complexe entre• Les différents niveaux d’organisation du vivant• Les facteurs abiotiques• Les pressions d’origines variées
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Analyse de la situation
WIP
Séminaire SIST 5-8 nov. 2019
Mettre à la disposition de la communauté scientifique des voie d’accès simples et directes aux données/métadonnées
Rendre les données Facile à trouver, Accessibles, Interopérables et Ré-utilisables(FAIRisation des données de biodiversité)
Accompagner la structuration en cours des communautés scientifiques concernées,
Développer les interfaces avec les autres composantes du « Système Terre »
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Défis
WIP
Séminaire SIST 5-8 nov. 2019
1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,
2. Répondre aux besoins des communautés scientifiques au jour le jour :
3. Faire progresser la consolidation de toutes les connaissances
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Objectifs opérationnels
en tenant compte :- De tous niveaux d’organisation du vivant, du génome aux communautés,- Des facteurs abiotiques (IR Syst. Terre-Env. : surf. continentale, océans, atmosphère, terre interne),- Des pratiques et comportements des sociétés humaines (socio-écosystèmes),- Des échelles de temps emboitées (collections d’histoire naturelle, bioarchéologie, paléontologie).
Privilégier la qualité (quality data) au-delà de la quantité
WIP
Séminaire SIST 5-8 nov. 2019
1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,
2. Répondre aux besoins des communautés scientifiques au jour le jour :
3. Faire progresser la consolidation de toutes les connaissances
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Objectifs opérationnels
- Accéder aux métadonnées et, autant que possible, aux données, adaptées à la question posée (y compris données « expertise »),
- Faciliter la mise à disposition, la validation et l’analyse des métadonnées/données en dépassant leurs hétérogénéité, dispersion et provenance,
- Accroître la caractérisation et la fiabilité des données en améliorant la documentation et les formats des métadonnées (équilibre entre « big data » et « quality data ») ,
- Favoriser la réutilisation et le couplage des données dans une approche intégrée.
Promouvoir la flexibilité des services
Articuler avec les autres SI et IR
Privilégier la qualité (quality data) au-delà de la quantité
WIP
Séminaire SIST 5-8 nov. 2019
1. Contribuer aux recherches concernant l’état et la dynamique de la biodiversité,
2. Répondre aux besoins des communautés scientifiques au jour le jour :
3. Faire progresser la consolidation de toutes les connaissances disponibles,
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Objectifs opérationnels
Promouvoir la flexibilité des services
notamment en promouvant : - La bancarisation des données de recherche (information, formation, accompagnement),- Les approches intégrées (réutilisation, couplage),- L’animation des communautés scientifiques concernées, en lien avec les dispositifs internationaux.
Offrir des services à valeurs ajoutées
Articuler avec les autres SI et IR
Contribuer à l’animation et structuration
des communautés scientifiques
Privilégier la qualité (quality data) au-delà de la quantité
WIP
Séminaire SIST 5-8 nov. 2019
1. S’appuyer sur bases de métadonnées/données et systèmes d’information existant :
2. Contribuer à étendre l’existant avec d’autres BdD de recherche ou d’expérimentation :
3. Potentialiser les données à travers la mise à disposition d’outils (y compris existant) :
4. Générer une dynamique d’animation et d’échanges entre chercheurs/communautés :
5. Veiller à la cohérence avec les efforts nationaux, européens et internationaux
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
- en les mettant en relation et en générant des synergies (notamment référentiels et ontologies)- en contribuant à renforcer leur visibilité et leur cohérence les uns par rapport aux autres
GBIF, SINP-INPN, INDOR, SIB-SIMM, SISMER, INFOTERRE…Data-Terra, ReColNat, RARe, AnaEE, RZA…iBOL2…
Développer, faciliter et favoriser la
description fine des données
BARcoding, « omiques », communautés, socio-écosystèmes, pressions, temps long…
- d’aide à la bancarisation (e.g. ajout de métadonnées ; format et correspondance des métadonnées)- de traitement/croisement des jeux de données et d’accès aux plateformes de calcul intensif,
- en s’appuyant sur l’existant et le valorisant (e-learning GBIF, CES, CESAB…)- par une stratégie de communication, d’information, de rencontres/colloques- en sensibilisant toutes les communautés aux enjeux de l’open data et de leur FAIRisation
WIP
Séminaire SIST 5-8 nov. 2019
An
aEE
Eco
tro
n
So
cio
-éco
syst
RZ
A
An
aEE
Nat
ura
BDD
RZA
BDD AnaEE
France
eLTER
2018
e-IR : « Pôle de données de Biodiversité »
An
aEE
e-IR : « Data Terra »
Enjeux, Objectifs Stratégie GouvernanceCahier des
chargesWIP
Séminaire SIST 5-8 nov. 2019
An
aEE
Eco
tro
n
So
cio
-éco
syst
RZ
A
An
aEE
Nat
ura
BDD
RZA
BDD AnaEE
France
eLTER
2018
e-IR : « Pôle de données de Biodiversité »
An
aEE
e-IR : « Data Terra »
Interface « terre vivante » IR
Enjeux, Objectifs Stratégie GouvernanceCahier des
chargesWIP
Séminaire SIST 5-8 nov. 2019
An
aEE
Eco
tro
n
So
cio
-éco
syst
RZ
A
An
aEE
Nat
ura
BDD
RZA
BDD AnaEE
France
eLTER
2018
e-IR : « Pôle de données de Biodiversité »
An
aEE
Co
mm
un
au
tés d
e
la r
ech
erc
he
(et d
e l’e
xp
ert
ise
)
e-IR : « Data Terra »
Interface « terre vivante » IR + chercheurs surtout via organismes + SI fédérateurs AFB
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
SIMM
SIO
SIB
WIP
Séminaire SIST 5-8 nov. 2019
An
aEE
Eco
tro
n
So
cio
-éco
syst
RZ
A
An
aEE
Nat
ura
BDD
RZA
BDD AnaEE
France
eLTER
2018
e-IR : « Pôle de données de Biodiversité »
An
aEE
Co
mm
un
au
tés d
e
la r
ech
erc
he
(et d
e l’e
xp
ert
ise
)
e-IR : « Data Terra »
Interface « terre solide » IR
Enjeux, Objectifs Stratégie GouvernanceCahier des
chargesWIP
Séminaire SIST 5-8 nov. 2019
An
aEE
Eco
tro
n
So
cio
-éco
syst
RZ
A
An
aEE
Nat
ura
BDD
RZA
BDD AnaEE
France
eLTER
2018
e-IR : « Pôle de données de Biodiversité »
An
aEE
Co
mm
un
au
tés d
e
la r
ech
erc
he
(et d
e l’e
xp
ert
ise
)
e-IR : « Data Terra »
EBVs operationalization pilot
PNDB - French BON
FAIR WGs
Biodiversity & Ecosystem
EuroGEOSS Action Group
GO-FAIR IN BiodiFAIRse
RDA
GO FAIR
EuroGEOSS
GEO BON
GBIF France - PNDBGBIF
EOSC Pillar infraeosc
H2020 GAPARS SwafS
Monitoring ecosystems through research, innovation
and technology CSA SC5-33-2020 début échanges
BOLD France - PNDBiBOL2
VRE pilot en discussionNextGEOSS
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Cohérence avec les dispositifs internationaux
WIP
Séminaire SIST 5-8 nov. 2019
lignes de force1. Orientation FAIR (aussi FAIR et Open que possible)
2. Relier/mutualiser avec les composantes existantes du Syst. Terre-Env.
3. Articuler/mutualiser avec le SIB-SIMM
4. Offrir des services à valeur ajoutée
5. Privilégier la qualité (quality data), au-delà de la quantité (big data),
6. Promouvoir la flexibilité des services (« à la carte »)
7. Développer, faciliter et favoriser la description fine des données
8. Viser une portée internationale (couverture & utilisation)
9. Articuler le PNDB avec les initiatives européennes et internationales
10. Pour commencer, s’appuyer sur un petit nombre de cas d’étude
(preuve de concept)
volets
1. Accès aux métadonnées et données
2. Accès aux outils de traitement, de couplage, d’analyse (calcul)
3. Animation et accompagnement
10
3
Enjeux, Objectifs Stratégie GouvernanceCahier des
charges
Séminaire SIST 5-8 nov. 2019
WIP
• Volet « Animation et accompagnement »
– Formations • Structuration des données via métadonnées et ontologies• Accès et traitement de données de biodiversité via services PNDB
– Workshops / ateliers • PNDB (produits et services / communautés utilisateurs PNDB / Partenaires PNDB)• EBVs• Collaboration IR PNDB/Data Terra• Collaboration PNDB/CESAB
– Hackathon• Métadonnées en écologie• Développement de matériel de formation (gestion des métadonnées et le traitement)• Développement d’outils de traitement de la donnée en écologie
– CESAB et positionnement lié au traitement de la donnée – Entrées CESAB/GBIF/PNDB & synergie à mettre en place avec instituts partenaires
Enjeux, Objectifs Stratégie GouvernanceCahier des
chargesWIP
Séminaire SIST 5-8 nov. 2019
Enjeux, Objectifs Stratégie Gouvernance WIPCahier des
charges
Séminaire SIST 5-8 nov. 2019
Chemin de la donnée
Communautés de la recherche (et de l’expertise)
SIMM
SIO
SIB
PNDB via pivot de métadonnées :
Ecological Metadata Language
…
…
…
Données « terre vivante »
Données « terre solide et fluide »
Autres données d’intérêt
Aut
res
SI «
biod
iv»
d’un
ité,
labo
(65
MO
, BB
EE
S,…
)
SI o
rgan
ism
es d
e re
cher
ches
part
enai
res
(dat
a.in
ra.fr
,
data
.ifre
mer
.fr,
…)
EM
L
(Meta)data
Replication
Data + Metadata
Replication
EM
L
• Volet « Données et métadonnées »
Enjeux, Objectifs Stratégie Gouvernance WIPCahier des
charges
Application R Shiny consultation et saisie EML en cours de réalisation par Elie Arnaud :
https://github.com/earnaud/MetaShARK-v2
Séminaire SIST 5-8 nov. 2019
Implémentation technique
•Volet « Outils de traitement / couplage / analyse (calcul)
Enjeux, Objectifs Stratégie Gouvernance WIPCahier des
charges
Outils Galaxy-E, datatypes, training-material, Interactivetools (Rstudio, Shiny apps, Jupyter Notebook,… ):Alan Amossé, Simon Bénateau, Benjamin Yguel, Valentin Chambon, Thimothée Virgoulay, Eloïse Trigodet, Elisa Michon
Codes sources :https://github.com/65MO/Galaxy-E
https://github.com/galaxyecology/tools-ecology
Training material: https://training.galaxyproject.org/
European Galaxy for Ecology instance:https://ecology.usegalaxy.eu/
Séminaire SIST 5-8 nov. 2019
Implémentation technique
Merci de votre attention