Samlingsportaler for universitetsmuseene, MUSIT seminar, GBIF Norge (2013)

Preview:

DESCRIPTION

MUSIT seminar 6 februar 2013: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata? Presentasjon fra GBIF Norge.

Citation preview

MUSIT seminar: Trenger de naturhistoriske museene egne portaler for tilgjengeliggjøring av samlingsdata?

Global Biodiversity Information FacilityGBIF Norge

Dag Endresen og Christian SvindsethGBIF Norge, NHM-UiONaturhistorisk museum, Universitetet i Oslo (NHM-UiO)Global Biodiversity Information Facility (GBIF)

6 februar 2013

Emner

2

• Hva er GBIF?• GBIF data portal• Portal toolkit (NPT)• Darwin Core (DwC), DwC arkiv• Stabile ID nøkler (UUID)• Data manuskript, sitering for datasett

Status data portalFebruar 2013

3

GBIF arbeider for fri og åpen tilgang til biodiversitetsdata online.

Vi er et internasjonalt og statlig initiert og finansiert nettverk med fokus på å bidra til at biodiversitetsdata er tilgjengelig for alle og enhver, for vitenskapelig forskning, bevaring og bærekraftig utvikling.

4Norge ble medlem i februar 2004.

Etter anbefaling fra OECD Global Science Forum (1999):

“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.

Etter anbefaling fra OECD Global Science Forum (1999):

“[E]stablish and support a distributed system of interlinked and interoperable modules (databases, software and networking tools, search engines, analytical algorithms, etc.) that together will form a Global Biodiversity Information Facility (GBIF)”.

GBIF’s unike rolle

• Register for biodiversitet data ressurser.• Verktøy og support for publisering av biodiversitetsdata.• Nettverk på nasjonalt, regionalt og globalt nivå.• Ett globalt virtuelt naturhistorisk datasett.• Tverrsektoriell lenke mellom data fra samlinger, økologi

og genetikk.• Tilgang til biodiversitetsdata for GIS analyse og

miljøovervåking.– Aggregerte data for stedfestede artsobservasjoner.

Basert på ett lysbilde av Donald Hobern (2012)6

Forbedrer ”fitness-for-use”Aggregate

Data Indexes

Data Quality

Expert Curation

• Progressiv forbedring– Dataindeks

• Sentralisert søkesystem.• Standardisering av stabile nøkler.• Konsekvensanalyse for metadata.

– Datakvalitet• Uoverenstemmelser innenfor poster.• Validering av poster mot metadata.• Identifisering av avvikende data.• Statistikk per post og per datasett.

– Ekspert korrigering• Interface med fagmiljø for artsnavn.• Rapportering av feil og annoteringer fra

databrukere.

Basert på ett lysbilde av Donald Hobern (2012)

Samarbeidspartnere– Biologisk litteratur

• Biodiversity Heritage Library (BHL).• Annoteringer fra brukere for å ekstrahere stedfestede

artsobservasjoner.• Lenke mellom artsbeskrivelser fra litteratur til taxonomi og

artsnavn.

– Artsinformasjoner• Encyclopedia of Life (EOL).• Assistere EOL som global aggregator av artsbeskrvninger.• Include EOL summary box on each GBIF species page

– Artsnavn, nomenklatur• Catalogue of Life (CoL), etc.• Publisere globale og regionale datasett med artsnavn.• GBIF infrastruktur kan levere artsnavn til CoL (etc.).

8 Basert på ett lysbilde av Donald Hobern (2012)

1.Informasjonsinfrastruktur – en Internet-basert indeks for et globalt distributert nettverk av interoperative databaser som inneholder primær biodiversitet data.

1.Programvare, standarder og protokoller – verktøy som dataleverandører behøver for å formattere og publisere data.

1.Opplæring– og tilgang til et globalt nettverk med eksperter.

9

http://data.gbif.org/

GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.

GBIF portal: 17,281,052 artsobservasjoner og objekter (16,076,604 med koordinater). GBIF Norge: 11,777,738 artsobservasjoner og objekter er publisert FRA norske dataleverandører.

Ta gjerne kontakt med oss med tilbakemeldinger og forslag til endringer og forbedringer for denne portalen!

GBIF leverer data for artsobservasjoner og museumsobjekter til “Artskart”.

14

15

• Programvare fra GBIF for å implementere online dataportaler for biodiversietsdata.– Nasjonal, tematisk eller regional.

• Åpen kildekode, fritt tilgjengelig (Google Code).• Drupal 7 (PHP, Javascript).• Bygger videre på Scratchpads 2 .

– ViBRANT, NHM London, EU 7th framework.– http://scratchpads.eu/

16

Basert på ett lysbilde av David Remsen (2011)

NPT Startup

Basert på ett lysbilde av David Remsen (2011)

NPT kan utvides ved å utvikle eller installere ferdige Moduler.

Basert på ett lysbilde av David Remsen (2011)

En modul kan vise en kalender på din webportal.

Basert på ett lysbilde av David Remsen (2011)

En annen modul kan vise en liste med artsnavn basert på artsobservasjoner

rapportert inn til GBIF portalen.

Basert på ett lysbilde av David Remsen (2011)

Modul som viser et GBIF data kart for hver taxon i en artsliste

Basert på ett lysbilde av David Remsen (2011)

Standard oppsett fra GBIF leverer et startpunkt for videre utvikling.•Leverer en konfigurerbar webportal.•Leverer et rammeverk for der nye moduler kan legges til.•Viser GBIF portal data som datakart for ditt land eller din region.

Basert på ett lysbilde av David Remsen (2011)

Ulike portaler vil implementere helt ulike sett av moduler for å

imøtekomme sine egne behov.

Basert på ett lysbilde av David Remsen (2011)

Basert på ett lysbilde av David Remsen (2011)

Basert på ett lysbilde av David Remsen (2011)

27

Darwin Core – terminologi, vokabulær

Wieczorek J, Bloom D, Guralnick R, Blum S, Döring M, De Giovanni R, Robertson T, and Vieglais D (2012) Darwin Core: An Evolving Community-Developed Biodiversity Data Standard. PLoS ONE 7(1): e29715. (doi:10.1371/journal.pone.0029715)

Tverrsektorell artsdata

Integrert tilgang for artsobservasjoner for alle arter:

• Hva?• Når?• Hvor?• Bevis og

dokumentasjon?• Dataeier?• Lenke til originaldata

Forekomst av art

Collections

EcologicalMonitoring Genomics

Darwin Core

Basert på ett lysbilde av Donald Hobern (2012)

Collections

EcologicalMonitoring Genomics

Darwin CoreUtvidelser kompatibel med Darwin Core standarden, pluss:

• Hvilke arter er funnet sammen?

• Hvilke datasett er direkte sammenlignbare?

• Hvilke arter er mest tallrike på ulike lokaliteter?

Forekomst og fraværs-data

Darwin Core+ Core Survey

Fields

Sample IdMethod Id

Relative abundance...

Basert på ett lysbilde av Donald Hobern (2012)

Integrert tilgang for artsobservasjoner for alle arter:

• Hva?• Når?• Hvor?• Bevis og

dokumentasjon?• Dataeier?• Lenke til originaldata

Forekomst av art

Tverrsektorell artsdata

http://rs.tdwg.org/dwc/terms/

Darwin Core Arkiv (DwC-A) Publiseringsformat for Darwin Core

termer inkludert flere standardiserte utvidelser.

Enkelt tekstbasert format. Zip-komprimert filarkiv.

Germplasm.txt

32

MUSITPortal…?

Artskart

33

UiT

UiB

NTNU

Darwin Core Arkiv

Samlinger publiseres fra dataeier som ett Darwin Core arkiv (DwC-A). Ulike datatyper fra samme DwC-A kan inkluderes til ulike data portaler.

GBIFPortal

Muligheter med Darwin Core:

• Stabile ID nøkler (UUID, QR code)• Datasett metadata (data manuskript)

34

• Globalt unike ID nøkler.• Skalerbar modell, antall ID nøkler.• Sosial aksept i fagmiljø.• Lang livssyklus for ID nøkler.• ”Resolution service(s)”.• Kostnad per ID nøkkel.• Bruker- eller maskin-vennlig.• Løsning for å generere nye ID nøkler.

– Sentralisert system for nye ID nøkler. – Føderert generering av ID ved kilde.

35

• En UUID er et 16-octet (128-bit) nummer.• Eksempel:

C37E3F9B-BCAF-4479-8EB7-3346A2DB2373

• Sannsynligheten at en duplisert nøkkel blir generert er omkring 50% dersom alle personer på hele jorden lager 600 million UUIDs hver.

• Tillater lettvindt generering av nøkler ved kilden i et føderert nettverk.

36

• “Quick Response Code” (QR code).• En type matriks strekkode (eller to-

dimensjonal kode).• Populær grunnet hurtig maskinlesbar og

stor kapasitet for lagring.• Anvendelsen av QR koder er gratis uten

begrensende lisensbetingelser.• Format for QR koder er entydig definert og

publisert som en ISO standard.• Oppfunnet i Japan av et datterselskap til

Toyota: Denso Wave i 1994.37

QR-kode for museumsobjektene ved NHM-UiO ville kunne levere:

•Maskinlesbar id med en ordinær smart phone (eller PDA).•Ny og effektiv arbeidsflyt for samlingsarbeide.•Implementering av stabile id nøkler velegnet for databaser.

38

• Peer review løsning for biodiversitetsdata.• Vitenskapelig anerkjennelse for publisering

av data.• Mekanisme for bedre datakvalitet.• Mekanisme for sitering av data.• Metadata format: Ecological Metadata

Language (EML), Dublin Core, Darwin Core, Natural Collections Descriptions (NCD)…

• Nye muligheter Hvert datasett publisert til GBIF med eget data manuskript…?

39

FNs “Millennium Ecosystem Assessment” (2005) viste at menneskelige handlinger ofte leder til irreversible tap innen det biologiske mangfoldet, og at disse tap har vært større i de siste 50 årene enn noen gang før i menneskehetens historie.

Biologisk mangfold er nøkkelen til en bærekraftig fremtid – og evnen av naturlige og sosiale systemer for å tilpasse seg endringer, er avgjørende for nesten alle aspekter av menneskets velvære.

Fordi menneskeskapte trusler mot biologisk mangfold oppstår over brede romlige og tidsmessige skalaer, biologisk mangfold og økosystem overvåkning, varsling, og risikovurderinger krever data som er organisert i en globalt og lett-tilgjengelig, integrert infrastruktur.

GBIF’s Data Portal leverer denne infrastruktur.

41

Takk for oppmerksomheten!

GBIF Norge

Dag Endresendag.endresen@nhm.uio.no

Christian Svindsethchristian.svindseth@nhm.uio.no

Innlegg ved MUSIT seminar på Gardermoen, 6 februar 2013

Recommended