Hva er mapping? Og hva er poenget?
Seminar om mapping til Dewey11.06.2012
Hva er mapping?
kildevokabular målvokabular
begrep begrep(er)
arbeidarklasse 305.562
voldtektsdop 362.883615.31
Hva er poenget med mapping?
• Flere innganger til et emne for den som indekserer• Flere innganger til et emne for sluttbruker
Hvorfor mapping til Dewey?
• Internasjonalt• Språkuavhengig• Termer på flere språk kan mappes til Dewey• Mapping kan gjøres mellom Dewey og andre
klassifikasjonssystemer • Mapping kan gjøres mellom Dewey og emneord• Mapping kan gjøres mellom Dewey og
autoritetsregistre for navn
Mapping til Dewey-for klassifikator• Hjelp til klassifikasjon
-flere termer å søke på• Hjelp til å sette emneord
- flere termer å søke på• Letter gjenbruk og utveksling av data
• Mapping mellom Dewey og emneord på flere språk
Mapping til Dewey-for sluttbruker• Utvidelse av et søk: • Muliggjør søk med eget vokabular i samlinger med
ulike vokabularer• Ved en underliggende mapping, kan man søke med
emneord også i samlinger som bare har Dewey. • Ved en underliggende mapping mellom vokabularer på
flere språk, kan man søke med eget språk i poster på andre språk
Noen valg som bør tas før man begynner å mappe…
1. Hvorfor mapper jeg*?
For å konvertere eller supplere et målvokabular med termer fra mitt eget vokabular «Særnorske» begrep i utenlandske vokabularer
Feks: særbo, kransekaker, dugnadNynorske / samiske termer i «bokmålske» vokabularer--> Begrep og termer som ikke finnes i målvokabularet!
Når vil jeg konvertere/supplere?Til hjelp i indekseringsprosessen?Til hjelp i søkeprosessen?Begge?
*jeg, som eier eller drifter et vokabular
Hjelp i indekseringsprosessen Hvordan skal jeg klassifisere denne artikkelen om voldtektsdop?
Hjelp i søkeprosessen
Hvordan finner jeg alt biblioteket har om voldektsdop?
• Underliggende mapping mellom voldektsdop og Dewey klasse 362.883 og Dewey klasse 615.31
• Søk på «voldtektsdop» i bibliotekkatalogen gir treff på «voldtektsdop» + dokumenter klassifisert med 362.883 eller 615.31
• Men: både 362.883 (voldtekt) og 615.31 (syntetiske legemidler) er mye videre begreper enn voldtektsdop!
• Dersom koblingen er automatisk, vil det føre til mye støy i trefflisten!
• Hvordan utnytte mappingen på mest effektiv måte??
Legg inn relasjonstyper!
Dermed kan vi lage systemer der brukeren selv velge om han/hun vil utvide søket når mappingen ikke er ekvivalent eller snevrere!
2. Hvilke relasjonstyper skal jeg bruke?
Kun til hjelp i indeksering?A. “Tilknyttet-klasse”
• Ett begrep er knyttet til et eller flere begrep fra målvokabularet
Feks)voldektsdop «tilknyttet-klasse» 362.883 voldektsdop «tilknyttet-klasse» 615.31
• Ingen semantiske relasjoner definert!• Enkleste måte å mappe• Innebygd i MARC 21 Authorities
(når målvokabularet er et klassifikasjonssystem)
2. Hvilke relasjonstyper skal jeg bruke? (forts.)Til indeksering og/eller søking?B. “Tilknyttet-klasse” med overensstemmelsesgrad
• Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og det er gitt en overensstemmelsesgrad som definerer likheten mellom begrepene
Feks) Overensstemmelsesgrad 1-4 (4 = helt ekvivalent)voldektsdop «tilknyttet-klasse» 362.883 B1voldektsdop «tilknyttet-klasse» 615.31 B1
• Krever at man selv definerer gradene – vanskelig!• Kan bruke lokale løsninger i MARC 21 Authority • Men ingen standard format for å registrere gradene
2. Hvilke relasjonstyper skal jeg bruke? (forts.)Til indeksering og/eller søking? Og kanskje til og med for å publisere som Linked data? C. ISO-standarden for mapping (ISO/DIS 25964-2)
• Ett begrep er knyttet til et eller flere begrep fra målvokabularet, og den semantiske relasjonen mellom begrepene er definert
• Ekvivalens relasjoner (=EQ, ~EQ)• Hierarkiske relasjoner (BM, NM) • Assosiative relasjoner (RM)
Feks)voldektsdop «RM» 362.883 voldektsdop «BM» 615.31
• Kan bruke lokale løsninger i MARC 21 Authority • Og lett konvertere til SKOS
3. Hvordan skal jeg gå frem?
Automatisk?IntellektueltAutomatisk + intellektuelt
Hva innebærer det intellektuelle arbeidet?• God kjennskap til kildevokabularet og
målvokabularet• Analysere, analysere, analysere
(parse, parse, parse)
Eksempel: HUMORD + Dewey
KunstArkitekturBildekunstDansFilmFolkekunstImprovisasjonKalligrafiKunstforståelseKunsthistorieKunsthåndverkKunstnerisk virksomhetKunstpsykologiKunstsosiologiLevende bilderMusikkStil (Uttrykksmåte)Teater (Scenekunst)
700 (Kunst og underholdning)Her: Konseptkunst, arkitektur, billedkunst, kunsthåndverk, offentlig kunstpolitikk
710 Arealplanlegging og landskapsarkitektur720 Arkitektur730 Skulptur og lignende kunstformer740 Grafiske kunstarter og kunsthåndverk750 Malerkunst og malerier760 Trykkekunst og grafiske blad770 Fotografering, datakunst, kinematografi, videografi780 Musikk790 Fritidsaktiviteter, sport, utøvende kunst
BM eller ~EQ
Eksempel: HUMORD + Dewey, forts.
MARC 21 Authority040 $aUiO
$bnor$fHUMORD
08300 $a700$223/nor$9~EQ eller $9BM
150 $aKunst
SKOS
<skos:Concept rdf:about="http://humord.uio.no/#kunst"><skos:prefLabel>kunst</skos:prefLabel>
<skos:closeMatch rdf:resource="http://dewey.info/class/700/2013/about.no"/>eller:<skos:broadMatch rdf:resource="http://dewey.info/class/700/2013/about.no"/>
</skos:Concept>
http://www.nb.no/webdewey
WebDewey
? ?
MeSH
AmerikanskwebDewey
LCSH
Tysk webDewey
Svensk webDeweySAO
SWD
NorskwebDewey
RAMEAU
BISAC
GeoNames
Klassifikasjonssystemer som er mappet til Dewey• Mellom UDC og Dewey på øverste nivåer (Tsjekkia)• RVK-Deweykonkordanse (Tyskland).• SAB –Dewey-konkordanse (Sverige)
• Hensikt: Gjøre nytte av eksisterende Dewey-klassifikasjon og/eller skritt på veien til å gå over til Dewey
• Problem: Ulike nivåer, ulikt innhold i klassene
Noen verbale vokabularer som er mappet til Dewey • LCSH (Library of Congress Subject Headings)• Bisac Subject Heading List • Mesh (Medical Subject Headings)• GND (Gemeinsame Normdatei) (tidl. SWD)• Svenska ämnesord
Mapping til Melvil (tysk webDewey)CrissCross-prosjektet• Mapping fra GND til Dewey• Mål: Flere verbale innganger til Dewey både i
indekserings- og søkeprosessen• Metode: 4 grader av overensstemmelse mellom
emneord og Deweynummer
Prosjekter som er i gang
• Fast og Dewey • VIAF og Dewey• MSC og Dewey • Geonames og Dewey• AGROVOC geografiske områder til 9xx-numre
Hvordan kan vi dra nytte av andre lands mappingarbeid?• Planer om mulighet for abonnement på andre lands
vokabularer i WebDewey (ikke mulig i dag)• Dewey gir allikevel mulighet til å nyttiggjøre oss
mappingene mellom de andre vokabularene (LCSH /GWD/Rameau/Svenska ämnesord), men ikke automatisk• Mangler samordnet nasjonalt emneordssystem• Språkforskjeller
Hva har vi i Norge?
• Utstrakt bruk av Dewey• Vokabularer på bestemte fagområder:
• Humord, Realfagstermene, Tekord, Mesh, Riksantikvarens nøkkel, Musikktesaurus, Juridisk klassifikasjon, UDK, Medisinsk klassifikasjon osv.
• Vokabularer knyttet til Dewey:• Lokale emneregistre • Biblioteksentralens emneord
Veien videre
• NB jobber med å mappe DDK 5 til DDC 23• Undersøke potensialet i de enkelte vokabularene? • Hvordan bruke Bibbi og emneregistrene?• Hvordan kan en evt. mapping organiseres?• Samarbeidsprosjekter mellom de som «eier»
vokabularene og Nasjonalbiblioteket?