Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Persistente IdentifiersHennie Brugman
Technical coordinator CATCHPlus
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Samenvatting• Wat is eigenlijk het probleem?• De basisoplossing• Wat is er beschikbaar: voorbeelden van
persistente identifiers• Wat doet CATCHPlus?• Zelf toepassen van persistente identifiers
– Welke keuzen? Stappen? Consequenties? Kansen?
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Probleem:
• Steeds meer digitale objecten, met steeds meer identifiers– In web context: identifier = URL
• Steeds vaker extern aangeboden (web)
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Probleem:Steeds meer verwijzingen•Web links•Contextualisering•Samenwerkingsverbanden•Virtuele collecties en tentoonstellingen
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Probleem:
•Identifiers zijn vaak niet uniek
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Probleem:
•Identifiers zijn vaak niet persistent
•Verwijzingen worden makkelijk ongeldig
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Probleem
object_1
new_object_1
http://.../object_1
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Basisoplossing • Ontkoppel naam/identifier en locatie(s)• Registreer combinaties van identifiers met locaties
in een tabel• Externe referenties gebruiken de identifier
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Basisoplossing
object_1
new_object_1
id1
id1 http://.../object_1
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Basisoplossing
new_object_1
id1
id1 http://.../new_object_1
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Resolver dienst
new_object_1id1
“wat is huidige URLvoor id1?”
“http://.../new_object_1”
GET http://.../new_object_1
web-pagina
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Naming Authority• Naming Authority: beheerder van de inhoud van de
tabel• NA heeft ook een unieke persistente identifier• Globaal geregistreerd waar de resolver voor de NA
is te vinden.
• Veel soorten persistente identifiers hebben de basisvorm:
<unieke-id-van-NA><unieke-locale-id>
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Naming AuthorityGlobal repository
NA1 NA2 NA3
id-van-NA adres van resolver voor NA
id-van-object adres van object
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Global resolvingGlobal repository
NA3
id1new_object_1
Local repository Local repository
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Voorbeelden van PID oplossingen• Er bestaan een aantal verschillende oplossingen• Binnen erfgoed in NL spelen een rol
– Gewoon URLs gebruiken– URN-NBN – Handles– DOI– ARK– PURL
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
http URL • http://identifiers.erfgoed.nl/local_id_1821
URN-NBN • urn:nbn:nl-local_id_1821
Handles • 10574/local_id_1821 • http://hdl.handle.net/10574/local_id_1821
DOI • doi:10.1594/PANGAEA.726855 • http://dx.doi.org/10.1594/PANGAEA.726855
ARK • http://identifiers.erfgoed.nl/ark:/128014/local_id_1821
PURL • http://purl.org/vocabularies/iconclass/concept1821
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
HOST
NA
LOCAL IDXX
X
http URL • http://identifiers.erfgoed.nl/local_id_1821
URN-NBN • urn:nbn:nl-local_id_1821
Handles • 10574/local_id_1821 • http://hdl.handle.net/10574/local_id_1821
DOI • doi:10.1594/PANGAEA.726855 • http://dx.doi.org/10.1594/PANGAEA.726855
ARK • http://identifiers.erfgoed.nl/ark:/128014/local_id_1821
PURL • http://purl.org/vocabularies/iconclass/concept1821
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Mogelijke selectie-criteria(1)Software ondersteuning
• Goede resolving oplossing voorhanden• Die is beproefd, stabiel en 100% betrouwbaar• Schaalbaar, met betrekking tot
– Aantallen identifiers– Performance
• Werkt globaal• Ook delen van objecten te identificeren• Metadata te associëren met identifiers• “actionable”: (ook) dmv http URLs te resolven• Ook ondersteuning voor identifier-beheerfuncties
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Mogelijke selectie-criteria (2)Identifier beheer
• Beheer van identifiers onafhankelijk van– Systeembeheer– Web server beheer– Hosting van resolverdiensten
• Beheer vanuit collectie beheer systeem mogelijk– B.v. door verantwoordelijke collectiebeheerder
• Beheer is eenvoudig en efficient
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Mogelijke selectie-criteria (3)Organisatie en beleid
• Welke keuzes maken partner-instellingen?• Betrouwbaarheid en duurzaamheid van de
dienstverleners• Beperkte en beheersbare kosten• Vrijheid om te switchen van dienstverlener
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Wat doet CATCHPlus?1. Technisch
1. Local Handle System(s)
2. REST web service voor resolving en PID beheer
3. Web-prototype voor PID-beheer functionaliteit
4. Toepassen in enkele pilot-projecten
2. Organisatie en beleid
1. Duurzame hosting en dienstverlening
2. Informatie verstrekken
3. “tussenpersoon”
1. Tussen erfgoedinstellingen en –projecten
2. CATCH/CATCHPlus en andere NL en EU PID initiatieven
4. Streven naar bundeling van erfgoedbelangen
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Wat doet CATCHPlus?1. Technisch
1. Local Handle Systems
2. REST web service voor resolving en PID beheer
3. Web-prototype voor PID-beheer functionaliteit
4. Toepassen in enkele pilot-projecten
2. Organisatie en beleid1. Duurzame hosting en dienstverlening
2. Informeren
3. Tussenpersoon
4. Streven naar bundeling van erfgoedbelangen
• Voldoet als enige aan alle criteria mbt software ondersteuning
• Eerste pilot (B en G): prefix voor NA aangevraagd en Local Handle System geïnstalleerd bij/door SARA
• Kosten: 50 dollar, plus 50 dollar per jaar
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Wat doet CATCHPlus?1. Technisch
1. Local Handle Systems
2. REST web service voor resolving en PID beheer
3. Web-prototype voor PID-beheer user interface4. Toepassen in enkele pilot-projecten
2. Organisatie en beleid1. Duurzame hosting en dienstverlening
2. Informeren
3. Tussenpersoon
4. Streven naar bundeling van erfgoedbelangen
Web service• Resolving, aanmaken en beheer van Handles• SARA bouwt eerste versie in opdracht van CATCHPlus
User interface• Prototype tbv evaluatie door collectie-beheerders• Implementatie door bedrijfsleven
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Wat doet CATCHPlus?
1. Technisch1. Local Handle Systems2. REST web service voor resolving en PID beheer3. Web-prototype voor PID-beheer functionaliteit
4. Toepassen in enkele pilot-projecten2. Organisatie en beleid
1. Duurzame hosting en dienstverlening2. Streven naar bundeling van erfgoedbelangen3. Informeren4. Tussenpersoon
Toekennen van persistente identifiers aan:
• Concepten in de Vocabulary Repository
• Deelcollectie van Beeld en Geluid
Interesse vanuit diverse andere erfgoedinstellingen en -projecten
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Wat doet CATCHPlus?
1. Technisch1. Local Handle Systems2. REST web service voor resolving en PID beheer3. Web-prototype voor PID-beheer functionaliteit4. Toepassen in enkele pilot-projecten
2. Organisatie en beleid1. Duurzame hosting en dienstverlening2. Streven naar bundeling van erfgoedbelangen3. Informeren4. Tussenpersoon
EPIC (European Persistent Identifier Consortium)
• SARA (NL), CSC (Finland), GWDG (DLD), …
• (intentie tot aanbieden van) redundante en betrouwbare PID diensten tbv wetenschap en erfgoed
• Op basis van Handles
• Stakeholders kunnen deelnemen aan bestuur en o.m. meebeslissen over business model
• Europese mirror van de z.g. Global Handle Repository
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Toepassen van persistente identifiers• Keuzen?• Stappen?• Consequenties?• Kansen?
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Keuzen• Welke objecten krijgen een persistente identifier toegekend?
(versies, samenstellingen, verschillende formaten, ...)
• Wat is de relatie van die identifier met mogelijk al bestaande identifiers?
• Wat is het formaat van de aan te maken PIDs? (CoolURI?)
• Naar welke “landingspagina” wordt de PID geresolved? Welke informatie hoort daar wel en niet op?
• Verantwoordelijkheden voor creatie en beheer• Welke garanties mbt persistentie kunnen gegeven worden,
en hoe kan dat worden waargemaakt?• Oplossing voor hosting en dienstverlening
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Stappen• Voor bestaande objecten
– Beleidskeuzen maken
– Bepaal URLs voor “landingspagina’s”
– Maak en publiceer PIDs
– Sla die PIDs locaal op, geassocieerd met/in plaats van intern object id
– Vervang referenties op basis van interne id’s door referenties op basis van PIDs
• Voor nieuwe objecten en collectiebeheer
– Integreer PID-creatie en -beheer in collectiebeheer-workflows en –tools
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Consequenties
• Externe beschikbaarheid data en diensten afhankelijk van één cruciale dienst (mag dus geen ‘single point of failure’ zijn!)
• Identifier management wordt een expliciete taak• Commitment mbt persistentie moet worden waargemaakt• Tool-support voor PID management moet worden geregeld
(anders te arbeidsintensief en foutgevoelig)• Intern (re-)organiseren van data wordt eenvoudiger• Aanbieden digitale collectie aan derden wordt eenvoudiger,
consistenter en duurzamer (zeker i.c.m OAI)
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Kansen• Mede vormgeven aan PID dienstverlening en de
voorwaarden waaronder dat gebeurt• Voortrekkersrol mbt publiceren museale collecties
op internet• Samenwerking met andere erfgoedinstellingen
– Minder eilandjes– Betere gezamenlijke belangenbehartiging– Kennis delen
Rijksmuseum Amsterdam - CATCHPlus, 1 december 2009
Vragen?
Recommended