Upload
trinhkiet
View
217
Download
0
Embed Size (px)
Citation preview
การใชมาตรฐานเมตะดาตา ในการจดการขอมลวจยในคลงสารสนเทศ
โดย นนทพร ธนะกลบรภณฑ
สานกบรรณสารสนเทศ มหาวทยาลยสโขทยธรรมาธราช E-mail: [email protected]
ในการสมมนาทางวชาการ เร อง การอนรกษขอมลวจยในคลงสารสนเทศของมหาวทยาลย (Data Curation in Thai Institutional Repositories)
ณ หองประชม 5209 อาคารสมมนา 1 มหาวทยาลยสโขทยธรรมาธราช
วนพฤหสบดท 22 พฤษภาคม 2557 เวลา 14.15-16.30 น.
1
หวขอบรรยาย
มาตรฐาน Metadata สาหรบหองสมดดจทล - Metadata Object Description Schema-MODS - Metadata Encoding and Transmission Standard-METS ประเดนการใช Metadata สาหรบขอมลวจย ในคลงสารสนเทศ - ความแตกตางในการจดการขอมลวจย - ลกษณะของ Metadata สาหรบขอมลวจย - Collection vs Item Description
2
หองสมดดจทล • เทคโนโลยทเก ยวของกบการจดการและพฒนา
หองสมดดจทล - Hardware = Server (s) ของ digital library /
แตละdigital collection - Software ตางๆ อาท:- software ระบบปฏบตการ ระบบจดการฐานขอมล การแปลงขอมล การจดการ
ภาพการสรางและกระจายสผใช ฯลฯ
• สวนประกอบของหองสมดดจทล - วตถดจทล (Digital objects/information objects/ content objects/digital information resources) - การรวมกลมของทรพยากรฯ ดจทล (Digital collection) - ตวแทนของทรพยากรฯ ดจทล (Metadata for digital objects/collection) 3
มาตรฐานทใชในหองสมดดจทล Metadata สาหรบพรรณนาสารสนเทศลกษณะเดยวกบ AACR2R - DCMES - Dublin Core Metadata Element Set - MODS - Metadata Object Description Schema - MIX - Metadata for Images In XML Schema (ระบและจดการภาพ) - MADS - Metadata Authority Description Schema แบบแผนการใชชอ/คา ของ Access point ใน Descriptive metadata - PREMIS – Preservation Metadata Framework สาหรบจดการ objects ตางๆ ใน document (1 กลม
เอกสาร) ทเปนมาตรฐานเพอการจดการและแลกเปลยน metadata ในลกษณะเดยวกบ MARC format อาท METS, RDF
- METS - Metadata Encoding and Transmission Standard - RDF - Resource Description Framework XML (eXtensible Markup Language) สาหรบประมวลผล แสดงผล แลกเปลยน metadata/documents บนเวบ และแปลงโครงสรางเอกสาร - XML schema language กากบ documents และเปนไวยากรณ สาหรบ matadata - XSL - eXtensible Stylesheet Language แสดงผล card catalog - XSLT - eXtensible Stylesheet Language Transformation แปลงโครงสรางระหวาง schemas
4
ระดบของ Metadata (Levels of complexity) 1. Simple format - จดเปน unstructured data - พบอยในตว resource เชน search engine ทจดการเทคนค การทาดรรชนอตโนมตบนเวบ 2. Structured format - กลมขอมลเชงโครงสรางทออกแบบสาหรบผใชโดยท วไป - มกม basic template เพอการสราง metadata - ไมตองการการพรรณนาในระดบ professional level - ตวอยางเชน Dublin Core Metadata Element Set 3. Rich format -ใชใน Libraries, archives, และ museums -ใชกบระเบยนบรรณานกรมทสรางโดยใช MARC format และ หลกเกณฑการลงรายการแบบ AACR2R, RDA - รวมถงกลม archival records ทสรางโดยใชมาตรฐาน EAD (Encoded Archival Description)
5
ประเภทของ Metadata จาแนกไดหลายประเภท และอาจคาบเกยวกน ขนกบการจดการ
และการตดสนใจของแตละสถาบน ในทน จาแนกเปน 6 ประเภท 1. Descriptive Metadata 2. Structural Metadata 3. Administrative Metadata 4. Technical Metadata 5. Preservation Metadata 6. Use Metadata Descriptive Metadata เปน metadata ทบรรยายเกยวกบวตถสารสนเทศ เชน ระบชอ เร อง ชอผรบผดชอบ ลกษณะรปราง หวเร อง ฯลฯ Descriptive Metadata ทรจก:- - DCMES-Dublin Corc Metadata Element Sets, - EAD- (Encoded Archival Description), - MARCXML - MODS
6
MODS (Metadata Object Description Schema) เปนมาตรฐาน Metadata ระดบ rich format รเร มโดย Library Of Congress. Network Development and MARC
Standards Office ซงเปนผพฒนา MARC & METS (Framework ทจดการ และถายโอน document) & MADS (มาตรฐานการใชชอหรอคา)
MODS ใช XML schema เปน syntax ทาใหสะดวกตอการประมวลผล การแสดงผลบนเวบ จนถงการแลกเปลยนทางานรวมกน (interoperability) กบ site ทใช XML schema แมจะใชตางระบบ
MODS มพนฐานมาจาก MARC21 & MARCXML เกอบทก element เทยบไดกบ fields ใน MARC bibliographic format
ม MODS Stylesheets สามารถแปลงไปมาไดกบ MARC และ DC Records ทหองสมดใชอย โดยใช XSL (eXtension Stylesheets Language)
- MARCXML to MODS , MODS to MARCXML - Dublin Core to MODS, MODS to Dublin Core ม MODS Mappings เทยบระหวาง - MARC to MODS - MODS to MARC - Dublin Core (simple) to MODS - MODS to Dublin Core (simple
7
ลกษณะของ MODS ใช Language-based tags เขาใจไดงาย ไมตองพงพาการ
ถอดรหส เหมอน MARC tags ทเปนตวเลข เชน สวนชอเร องใช <titleInfo>(tag245) , สวนชอใช<name>(tag1XX, 7XX)
จดกลมขอมลเปนสวนๆ /ระดบตางๆ - ระดบเขตขอมล = main elements - ระดบเขตขอมลยอย = child elements/subelements - ระดบสวนยอยของเขตขอมลยอย = sub of subelements ทก elements/subelements ใชซาได และ เปน optional ม attributes ทใชระบคามาตรฐานขยายความหมายของ
elements/subelements Main elements บางตวทาหนาทเปน wrapper tag รวมกลม
child elements ทบนทกขอมลเร องเดยวกนไวดวยกน
8
สวนประกอบของ MODS 1. MODS elements (กลม/เขตขอมล ) ม 20 elements และอก
64 subelements 2. MODS attributes (ตวขยาย/กากบ elements/subelements
เพอระบคาของขอมลใน elements/subelements หนงๆ ใหชดเจน เฉพาะเจาะจงยงข น)
แบงไดเปน 5 กลม คอ 2.1 language attributes และ attributes ท เกยวกบภาษา ตวระบชอภาษาตามสากล รวมท ง ตวอกษรในภาษา
2.2 date attributes ตวระบขอมลวนเวลาทใชโดยเฉพาะ ป 2.3 linking attributes ตวระบขอมลการเชอมโยง 2.4 authority attributes ตวระบท มาของคา/term ตาง ๆ ทใช 2.5 อน ๆ นอกเหนอจากกลม 2.1-2.4 อาท type, DisplayLabel 9
Top-level MODS elements
เปรยบเทยบกบ Dublin Core elements)
1. titleInfo (Title) 11. note (Description) 2. name (Creator, Contributor) 12. subject (Subject, Coverage) 3. typeOfResource (Type) 13. classification (Coverage) 4. genre (Type) 14. relatedItem (Relation, Source) 5. originInfo (Publisher, Date) 15. identifier (Identifier) 6. language (Language) 16. location (Identifier) 7. physicalDescription (Format) 17. accessCondition (Rights) 8. abstract (Description) 18. part 9. tableOfContents(Description) 19. extension 10. targetAudience 20. recordInfo
10
MODS attributes
1. กลม language attributes ทเกยวของกบภาษา เชน - ชอภาษา ใช ISO639-1 (xml:lang) - เชน en ISO639-2b (lang) - เชน eng - ตวอกษรตนแบบ (script) ใช ISO15924 เชน basic Roman ตวอยาง
<titleInfo lang=“rus” script=“Latin” transliteration=“Coded to be determined”>
<title>Geodezja I urzadzenia roline</title>
</titleInfo>
11
MODS attributes
2. กลม date attributes (encoding; point (start, end); keydate (yes ระบวาเปน keydate); qualifier) - Encoding (รปแบบของ date) เชน w3cdtf รปแบบ- yyyy-mm-dd, iso8601- yyyymmdd, MARC - yymmdd - Qualifier (ประมาณคาของ date) เชน approximate
(ca.1972), inferred = ชวงเวลา (not before 1952), questionable (1972?)
ตวอยาง <dateModified encoding=“iso8601”>20031008 </dateModified >
12
MODS attributes
3. กลม linking attributes (ID, xlink) 4. กลม authority attributes (authority files, controlled lists, value lists) ระบชอแหลงของคาควบคม /คา ทนามาใช 5. อน ๆ เชน type, displayLabel
ตวอยาง <titleInfo type=“alternative” displayLabel=“Spine
title”> <title>Science and public affairs</title> </titleInfo> <name type=“personal” authority=“naf”> <namePart>Woolf, Virginia</namePart> </name>
13
<titleInfo>
บนทกชอเร องทเหมาะสม ชอเร องอน ๆ และขอมล เกยวกบชอเร อง
Attribute: “type” ประเภทของชอเร อง abbreviated, translated, alternative, uniform Subelement: <nonsort>, <title>, <subtitle>, <partNumber>, <partName> ตวอยาง: ชอเร อง Bush Cheney รจกในอกชอคอ Bush-Cheney 2000 <titleInfo><title>Bush Cheney</title></titleInfo> <titleInfo><title type=“alternative” displayLabel =“also known as:”>Bush-Cheney 2000</title> </titleInfo>
14
<name> บนทกชอผรบผดชอบสาคญในงาน ท งทเปน persons,
organizations หรอ events Attribute: ม “type” ระบประเภทของชอ personal, corporate, หรอ conference Subelements: <namePart>,<displayLabel>, <affiliation>, <role>, <description> ตวอยาง: MARC: John Paul II, Pope, 1920- <name type="personal"> <namePart type="given">John Paul</namePart> <namePart type="termsOfAddress">II</namePart> <namePart type="termsOfAddress"> Pope</namePart> <namePart type="date">1920-/namePart> </name>
15
<typeOfResource> ระบประเภทของทรพยากรทพรรณนา 11 ประเภท 1) text 2) cartographic 3) notated music 4) sound recording-musical 5) sound recording-nonmusical 6) sound recording 7) still image 8) moving image 9) three dimensional object 10) software, multimedia 11) mixed material ตวอยาง: ทรพยากรประเภทวสดบนทกเสยงทไมใชเสยงดนตร <titleInfo> <title>Camp Council meeting; speech by Dewey Rodgers</title> </titleInfo> <typeOfResource>sound recording-nonmusical </typeOfResource>
16
17
<genre> • ระบลกษณะเฉพาะหรอรปแบบการนาเสนอเนอหาของทรพยากร
ทพรรณนา เชน ระบ style, form, หรอ content ซงเจาะจงมากกวา terms ใน<typeOfResource>
Attributes: ของ <genre> authority ระบชอ authoritative list ทม genre terms อย
เชน authority="marcgt" ดชอแหลงของ genre terms ทwww.loc.gov/marc/sourcecode/genre/genresource.html
สวน genre source code list ตาม MARC 21 ดไดท : www.loc.gov/marc/sourcecode/genre/genrelist.html Subelements: ไมม ตวอยาง: <genre authority="marcgt">folktale</genre> <genre>rock music</genre>
18
<originInfo> บนทกขอมลเกยวกบการผลต การเผยแพรทรพยากรทพรรณนา
เชน ชอสถานทพมพ ชอสานกพมพ ปทผลต ปทเผยแพร ปทสราง ฯลฯ คร งทพมพ คาระบความตอเนองของการผลตเผยแพร กาหนดออก ฯลฯ
subelement ม 12 ตว ดงน 1) <place> (260 $a) (< placeTerm>) 2) < publisher>(260 $b) 3) <dateIssued>(260 $c)
4)<dateCreated>(260 $g) 5) <dateCaptured>(033) 6) <dateValid> (046 $m) 7) dateModified>(046 $j) 8) <copyrightDate>(260 $c)
9) <dateOther>(046 $d) 10) <edition> (250$a) 11) <issuance>(ldr/07=m,s) (Value: continuing, monographic) 12) <frequency>(310 $a)
19
<originInfo> ตวอยาง <originInfo> <place> <placeTerm type="code" authority="marccountry">cau</placeTerm> <placeTerm type="text">Menlo Park,CA</placeTerm> </place> <publisher>Center for Computer Assisted Research in the Humanities</publisher> <dateIssued>1988</dateIssued> <dateIssued encoding="marc"point="start“>1985</dateIssued> <dateIssued encoding="marc" point="end">1988</dateIssued> <issuance>continuing</issuance> <frequency>annual</frequency> </originInfo>
20
<language> บนทกชอ/รหสของภาษาทบนทกเนอหาของทรพยากรทพรรณนา
ม subelement คอ <languageTerm>ใชคามาตรฐานระบชอและรหสชอของภาษา authority=iso639-2b, rfc3066
ตวอยาง <language> <languageTerm type="code" authority="iso639-2b">eng <languageTerm> </language> <language> <languageTerm type="code" authority="iso639-2b">fre <languageTerm> </language> [The resource contains both English and French text]
21
<physicalDescription> บนทกขอมลระบลกษณะทางกายภาพของทรพยากรทพรรณนา
เชน รปแบบ/รปลกษณทางกายภาพ ขนาด รปราง ฯลฯ ม subelement 6 ตว คอ
1) <form>(245 $h, 008/23 BK,MU,SE,MM, 008/29 MP,VM, 008/26 CF) 2) <reformattingQuality> (value: access (007/13 CF=a), preservation (007/13 CF=p), replacement (007/13 CF=r) 3) <internetMediaType>(856 $q) 4) <extent> (300 $a, 256$a) 5) <digitalOrigin> (007/11 CF) และ 6) <note> ตวอยาง <physicalDescription> <form authority="marcform">print</form> <extent>ill., music ; 26 cm</extent> <reformattingQuality>replacement</reformattingQuality>
</physicalDescription>
22
<abstract>
บนทกสาระสงเขปหรอเนอเร องยอของทรพยากรทพรรณนา อาจกาหนดประเภทของเรองยอดวย type เชน summary, review, scope and content
ตวอยาง < abstract>A poem about numbers and their
characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</abstract>
23
<tableOfContent>
บนทกสารบญเนอหาของทรพยากรทพรรณนา ตวอยาง <tableOfContents>Who made Web sites? – What could people do? – Search the archive – Visit this site – Analysis The September 11 Web Sphere </tableOfContents>
24
<targetAudience> ระบระดบของผใชสารสนเทศทเหมาะสมกบเนอหาของ
ทรพยากรทพรรณนา ตวอยาง <targetAudience authority="marctarget">juvenile
</targetAudience> <targetAudience authority="marctarget">adolescent </targetAudience>
25
<note> บนทกขอความหมายเหตสาคญเกยวกบทรพยากรท
พรรณนา ตวอยาง <note>Based on a play which originally
appeared in France as "Un peu plus tard, un peu plus tet"</note>
26
<subject> หวเรอง บนทกหวเร องแทนเนอหาของทรพยากรทพรรณนา พรอมระบ
แหลงทมาของคาหวเร องน น Subelement: 1) <topic> 2) <geographic> 3) <temporal> 4) <titleInfo> 5) <name> 6) <geographicCode> 7) <hierarchicalGeographic> (<continent>,<country>, <province>, <region>, <state>, <territory>, <county>, <city>, <island>,<area>) 8) <cartographics> (<coordinates>, <scale>, <projection>) 9) <occupation>
27
<subject> หวเรอง (ตอ)
ตวอยาง หวเร องของ MARC 650#0 $a Real property $z Mississippi $z Tippah County $v Maps
แสดงผล Real property--Mississippi--Tippah County--Maps
บนทกแบบ MODS <subject authority="lcsh"> <topic>Real property</topic>
<geographic>Mississippi</geographic> <geographic>Tippah County</geographic <topic>Maps</topic> </subject>
28
<classification> บนทกหมายเลขหมวดหมเนอหาของทรพยากรท
พรรณนา พรอมระบชอระบบหมวดหมของหมายเลขหมวดหมน น
ตวอยาง <classification authority="lcc">TH6493 </classification> <classification authority="ddc"
edition="11">683 </classification>
<relatedItem>
ระบลกษณะความสมพนธของงานชนอนกบทรพยากรทพรรณนาโดยระบขอมลรายละเอยดทสาคญของงานชนอนน นดวย
Attribute: “type” ระบประเภทของความสมพนธ คอ 1) preceding 2) succeeding 3) original 4) host 5) constituent 6) series 7) otherVersion 8) otherFormat 9) isReferencedBy Subelements: 20 elements ของ MODS
29
<relatedItem> (ตอ) <titleInfo>
<title> Directory of computer assisted research in musicology</title>
</titleInfo>
<relatedItem type=“succeeding">
<titleInfo><title>Computing in musicology</title> </titleInfo>
<identifier type="issn">1057-9478</identifier>
<identifier type=“lccn">91656596</identifier>
</relatedItem>
30
31
<identifier> บนทกหมายเลขประจาตวของทรพยากรทพรรณนา โดยเฉพาะ
เลขมาตรฐาน เชน isbn (020 $a, $z) , doi (024 $a) , sici (024 $a, $z) , uri (856 $u, $3), lccn (010 $a, $z) ฯลฯ
ตวอยาง <identifier type="isbn" invalid="yes">0877780116
</identifier> <identifier type="lccn">##2001336783</identifier>
<location> ระบแหลงทจดเกบทรพยากรทพรรณนาอาจเปน ชอ
หนวยงาน/องคกร, url Subelements: <physicalLocation> และ<url> ตวอยาง: <location> <physicalLocation>Library of Congress
Manuscript Division</physicalLocation> </location> <location> <url dateLastAccessed=“2004-01-27”>
http://www.loc.gov/marc/</url></location> 32
33
<accessCondition> เง อนไขการเขาถง/เขาใช
บนทกขอความระบขอจากดในการเขาถง หรอเง อนไขในการใช/ทาสาเนาทรพยากรทพรรณนา
Attribute: “type”ม 2 ขอความระบขอจากด/เง อนไข คอ 1) restrictionOnAccess 2) useAndReproduction ตวอยาง <accessCondition type="restrictionOnAcces"> Restricted: cannot be viewed until 2010; Members of
donor's family </accessCondition>
34
<part>
ใชบนทกรายละเอยดเกยวกบลกษณะทางกายภาพของสวนชนงานยอยทสมพนธกบชนงานอนอยางมแบบแผน <part> อาจใชบนทกในระดบของ top level element เพอระบลกษณะทางกายภาพของชนงานสวนยอยกบงานในกลมเดยวกน หรออาจถกใชอยภายใต <relatedItem> element เพอระบตาแหนงทอยของชนงานสวนยอยหนงๆ ทเผยแพรอยภายในแหลงฯ อน
Attributes สาคญ type - <detail> ; order - <detail> ; unit - <extent> ; encoding -
<date>; point - <date> ualifier - <date> Subelements <detail>; <extent> ; <date> ; <text>
35
<part> ตวอยาง • <titleInfo> • <title>Dana</title> • <subTitle>an Irish magazine of independent • thought</subTitle> • <partNumber>Vol. 1, no.4</partNumber> • </titleInfo> • <part> • <detail> • <title>Wayfarers (Poem)</title> • </detail> • <extent unit=”pages”> • <start>97</start> • <end>98</end> • </extent> • </part>
<extension>
“extension” ใชระบขอมลเพมเตมอน ๆ ทนอกเหนอจากทกาหนดไวใน MODS เทยบไดกบ MARC21 bibliographic format fields 9XX อาจใชในกรณทตองการขยายการใช MODS
Attributes ไมม Subelements ไมม ตวอยาง <extension xmlns:dcterms="http://purl.org/dc/terms/" > <dcterms:modified>2003-03-24</dcterms:modified> </extension> [ใช extension element เพ อระบ Dublin Core element ของวนเดอนป ทปรบปรงตวทรพยากร]
36
<recordInfo>
บนทกขอมลทจาเปนในการจดการระเบยนของทรพยากรทพรรณนา subelement ม 6 ตว คอ 1) <recordContentSource> (040 $a) 2) <recordCreationDate>(008/00-05) 3) <recordChangeDate>(005 4) <recordIdentifier> (001) 5) <recordOrigin> 6) <languageOfCataloging> (040 $b) (<languageTerm>) ตวอยาง <recordInfo> <recordContentSource authority="marcorg"> DLC</recordContentSource> <recordChangeDate>June 24, 2001</recordChangeDate
</recordInfo>
37
MODS Transformation (1) <?xml version="1.0" ?>
<mods xmlns:xlink=http://www.w3.org/TR/xlink xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/" xsi:schemaLocation="http://www.loc.gov/mods/ http://www.loc.gov/standards/mods/mods.xsd"> <titleInfo> <title>Arithmetic /</title> </titleInfo> <name type="personal"> <namePart>Sandburg, Carl</namePart> <namePart type="date">1878-1967</namePart> <role> <text>creator</text> </role> </name> <name type="personal"> <namePart>Rand, Ted</namePart> <role> <text>ill.</text> </role> </name> 38
MODS Transformation (2)
<typeOfResource>text</typeOfResource> <originInfo> <place> <code authority="marc">cau</code> <text>San Diego</text> </place> <publisher>Harcourt Brace Jovanovich</publisher> <dateIssued>c1993</dateIssued> <dateIssued encoding="marc">1993</dateIssued> <edition>1st ed.</edition> <issuance>monographic</issuance> </originInfo> <language authority="iso639-2b">eng</language> <physicalDescription> <form authority="marcform">print</form> <extent>1 v. (unpaged) : ill. (some col.) ; 26 cm.</extent> </physicalDescription>
39
MODS Transformation (3) <abstract>A poem about numbers and their characteristics.
Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</abstract>
<targetAudience>juvenile</targetAudience> <note type="statement of responsibility">Carl Sandburg ; illustrated as an anamorphic adventure by Ted Rand.</note> <note>One Mylar sheet included in pocket.</note> <subject authority="lcsh"> <topic>Arithmetic</topic> <topic>Juvenile poetry</topic> </subject> <subject authority="lcsh"> <topic>Children's poetry, American</topic> </subject> <subject authority="lcshac"> <topic>Arithmetic</topic> <topic>Poetry</topic> </subject>
40
MODS Transformation (4)
<subject authority="lcshac"> <topic>American poetry</topic> </subject> <subject authority="lcshac"> <topic>Visual perception</topic> </subject> <classification authority="lcc">PS3537.A618 A88 1993</classification> <classification edition="20" authority="ddc">811/.52</classification> <identifier type="isbn">0152038655 :</identifier> <identifier type="lccn">92005291</identifier> <recordInfo> <recordContentSource>DLC</recordContentSource> <recordCreationDate encoding="marc">920219</recordCreationDate> <recordChangeDate encoding="iso8601">19930521155141.9 </recordChangeDate> <recordIdentifier source="DLC">92005291</recordIdentifier> </recordInfo> </mods>
41
ระเบยนเดยวกนตามมาตรฐานดบลนคอร Dublin Core Transformation
<?xml version="1.0" ?> <dc xmlns="http://purl.org/dc/elements/1.1/"> <title>Arithmetic /</title> <creator>Sandburg, Carl, 1878-1967.</creator> <creator>Rand, Ted, ill.</creator> <type /> <publisher>San Diego : Harcourt Brace Jovanovich,</publisher> <date>c1993.</date> <language>eng</language> <description>A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</description> <description>One Mylar sheet included in pocket.</description> <subject>Arithmetic</subject> <subject>Children's poetry, American.</subject> <subject>Arithmetic</subject> <subject>American poetry.</subject> <subject>Visual perception.</subject> </dc>
42
METS
Metadata Encoding and Transmission Standard จดทาโดย Library of Congress. Network
Development and MARC Standards Office และ Digital library Federation
ใช XML-based Standard ไมผกตดกบ software, OS, และ Plateform ใดๆ
เปน Framework เชอมโยง ระบ จดระเบยบ metadata ทกประเภท และวตถดจทลทเก ยวของกน ท งทอยภายนอกและภายใน METS document น น
ตวอยาง METS document ทม ระเบยน MODS
43
Building a METS Document: The Framework
• <METS:mets> • <METS:metsHdr/> Header • <METS:dmdSec/> Descriptive MD • <METS:amdSec/> Administrative MD • <METS:fileSec/> File list • <METS:structMap/> Structural Map • <METS:structLink/> Structural links
</METS:mets>
44
สวนประกอบของ METS document
1. METS header = <metsHdr> บนทกขอมล วนเดอนปท สราง วนเดอนปทปรบปรงลาสด สถานภาพ รวมท ง ชอและ หนาทของผรบผดชอบสราง METS document 2. Descriptive metadata = <dmdSec> บนทก metadata ทพรรณนาวตถสารสนเทศดจทล ใน METS document 3. Administrative metadata = <amdSec> ม 4 ประเภท - technical metadata = <techMD> - intellectual property rights metadata = <rightsMD> - source metadata = <sourceMD> แหลงทมาของ วตถในรป analog - digital provenance metadata = <digiprovMD> ระบความสมพนธระหวาง master file กบ derivative files
45
สวนประกอบของ METS document
4. File section = <fileSec> ใช “<fileGrp>” จดระเบยบไฟลวตถฯ ระบไฟลเวอรช นตางๆ ของวตถฯดจทลทเก ยวของกน ใช <file> ระบไฟลแตละเวอรช น ทประกอบกนรวมเปนหนงกลม
5. Structural map = <structMap> ระบโครงสรางตาม ลาดบช นของไฟลวตถฯ ดจทลทเก ยวของกน เชน โครงสรางของบทตาง ๆ ของ eBook เปนตน
6. Structural links = <structLink> บนทก hyperlinks ทเชอมโยงไฟลของวตถฯ ดจทล ดวย <smLink>
46
ตวอยาง METS Document: Maps & Geographic Northwestern University African Maps Collection
http://fedora.library.northwestern.edu/fedora/get/inu:inu-afrmap-4333843/source
<?xml version="1.0"?> <mets:mets xmlns:dc="http://purl.org/dc/elements/1.1/" LABEL="A map of the Gold Coast, from Issini to Alampi / by M. d'Anville ; G. Child sculpt." TYPE="map" OBJID="4333843" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-0.xsd http://www.loc.gov/mix/ http://www.loc.gov/standards/mix/mix.xsd http://www.loc.gov/standards/premis/v1 http://www.loc.gov/standards/premis/v1/PREMIS-v1-1.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/simpledc20021212.xsd http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd" xmlns:mets="http://www.loc.gov/METS/" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:mix="http://www.loc.gov/mix/" xmlns:premis="http://www.loc.gov/standards/premis/v1" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"> <mets:metsHdr RECORDSTATUS="wrapper" LASTMODDATE="2006-11-29T17:06:54" CREATEDATE="2006-11-29T17:06:54"><mets:agent TYPE="INDIVIDUAL" ROLE="CREATOR"><mets:name>Stewart, Mary Claire</mets:name></mets:agent><mets:agent TYPE="INDIVIDUAL" ROLE="CREATOR"><mets:name>Miller, Karen</mets:name></mets:agent><mets:altRecordID>g8850_1729_a5</mets:altRecordID> </mets:metsHdr> <mets:dmdSec ID="DM1"><mets:mdRef LABEL="Catalog Record" xlink:href="http://nucat.library.northwestern.edu/cgi-bin/Pwebrecon.cgi?BBID=4333843" MDTYPE="MARC" LOCTYPE="URL"/></mets:dmdSec>encoding="marc">060103</mods:recordCreationDate> <mods:recordChangeDate encoding="iso8601">20060730210259.0</mods:recordChangeDate> <mods:recordIdentifier>4333843</mods:recordIdentifier></mods:recordInfo></mods:mods></mets:xmlData> </mets:mdWrap></mets:dmdSec> <mets:dmdSec ID="DM2"><mets:mdWrap MDTYPE="MODS"><mets:xmlData><mods:mods>
50
ประเดนลกษณะของ research data • ขอมลการวจยในนานาชาต มปรมาณเพมข นมาก และขอมลวจย
นสวนมากอยในรป Born Digital • สถาบนตางๆ ทเก ยวของ ตองหาหนทางจดเกบและจดการขอมล
เหลาน ใหอยใน a format ทสะดวกตอการคนพบ เขาถง และนากลบมาใชใหม (reuse) ได
• การจดการกบ research output ใน repositories ทผานมา อย ในลกษณะของการจดการกบ Research publications
อาท บทความวารสาร บทในหนงสอ เอกสารการประชม grey literature โดยเฉพาะ รายงานทางวชาการ ฯลฯ ท งทเปนสงพมพรฐบาล และสงพมพสถาบน รวมท ง output ของนกวจย
ทคนผาน web portal & Google indexing = Research publications
• ปจจบนมแนวโนมเปนการจดการกบ the institution’s data collections = Research data collections
ลกษณะของ research data ทรวบรวม การรวบรวม Research data collections และ datasets รวบรวม
ขอมลท งในระหวางวจยและภายในกระบวนวธตามหลกการในวทยาการของศาสตรหนงๆ
ขอมลทจาเปนตองอนรกษไว (Ephemeral data) เหลาน อาท - method of data collection; - human input /automated machine capture; - number, type, and size of data files; - software เฉพาะ /ขอมลระบวธเปดใชหรอเขาดไฟล - ขอมลทเก ยวของกบ legal or ethical restrictions; และอนๆ จากความตางน ใน repository จงตองใชมากกวา หนง metadata
schema เพอพรรณนาขอมลในลกษณะตางๆ ประเดนทตองพจารณา เพอการจดการ policy, data management, planning, scope, data interviews, metadata, storage, method of metadata input, legal & ethical restrictions, intellectual property, workflows, staff, discovery, software & advocacy
ประเดนการใช Metadata อธบายทรพยากรฯ ระดบตางๆ
การจด collection level (granularity) ของชนงาน 1. ระดบของวตถชนเดยว fragments/item (1 ภาพ) 2. ระดบของการรวมวตถชนเดยว collection of atoms เชน html document ม pictures และ ม a lesson ฝงอย 3. ระดบของกลมงานรวม เชน a web of html documents ทมสารบญหรอดรรชน โยงหนาและบท ตางๆ เขาดวยกน รวมเปน 1 unit (1 เลม/1 ชดวชา) 4. ระดบใหญทสด เชน a course (1 หลกสตร)
53
Descriptive Metadata for Collections and Items
เปนการพจารณาเพอทาใหสารสนเทศทอธบายเกยวกบทรพยากรฯ /collections หนงๆ สมบรณ มประโยชนสงสด ชวยคนและสามารถนาไปรวมใชกบระบบอนได
Descriptions of data collections VS description of individual items ภายใน data collections