55
การใช มาตรฐานเมตะดาตา ในการจัดการข้อมูลวิจัยในคลังสารสนเทศ โดย น ันทพร ธนะกูลบริภ ัณฑ์ านักบรรณสารสนเทศ มหาวิทยาลัยสุโขทัยธรรมาธิราช E-mail: [email protected] ในการส มมนาทางวิชาการ เรื่อง การอนุรักษ์ข้อมูลวิจัยในคลังสารสนเทศของมหาวิทยาลัย (Data Curation in Thai Institutional Repositories) ณ ห้องประชุม 5209 อาคารส มมนา 1 มหาวิทยาลัยสุโขทัยธรรมาธิราช ว ันพฤห ัสบดีที22 พฤษภาคม 2557 เวลา 14.15-16.30 . 1

การใชมาตรฐานเมตะดาตา้ …libarts.stou.ac.th/UploadedFile/13.MD_for_Curation_Research.pdf · Geodezja I urzadzenia roline

Embed Size (px)

Citation preview

การใชมาตรฐานเมตะดาตา ในการจดการขอมลวจยในคลงสารสนเทศ

โดย นนทพร ธนะกลบรภณฑ

สานกบรรณสารสนเทศ มหาวทยาลยสโขทยธรรมาธราช E-mail: [email protected]

ในการสมมนาทางวชาการ เร อง การอนรกษขอมลวจยในคลงสารสนเทศของมหาวทยาลย (Data Curation in Thai Institutional Repositories)

ณ หองประชม 5209 อาคารสมมนา 1 มหาวทยาลยสโขทยธรรมาธราช

วนพฤหสบดท 22 พฤษภาคม 2557 เวลา 14.15-16.30 น.

1

หวขอบรรยาย

มาตรฐาน Metadata สาหรบหองสมดดจทล - Metadata Object Description Schema-MODS - Metadata Encoding and Transmission Standard-METS ประเดนการใช Metadata สาหรบขอมลวจย ในคลงสารสนเทศ - ความแตกตางในการจดการขอมลวจย - ลกษณะของ Metadata สาหรบขอมลวจย - Collection vs Item Description

2

หองสมดดจทล • เทคโนโลยทเก ยวของกบการจดการและพฒนา

หองสมดดจทล - Hardware = Server (s) ของ digital library /

แตละdigital collection - Software ตางๆ อาท:- software ระบบปฏบตการ ระบบจดการฐานขอมล การแปลงขอมล การจดการ

ภาพการสรางและกระจายสผใช ฯลฯ

• สวนประกอบของหองสมดดจทล - วตถดจทล (Digital objects/information objects/ content objects/digital information resources) - การรวมกลมของทรพยากรฯ ดจทล (Digital collection) - ตวแทนของทรพยากรฯ ดจทล (Metadata for digital objects/collection) 3

มาตรฐานทใชในหองสมดดจทล Metadata สาหรบพรรณนาสารสนเทศลกษณะเดยวกบ AACR2R - DCMES - Dublin Core Metadata Element Set - MODS - Metadata Object Description Schema - MIX - Metadata for Images In XML Schema (ระบและจดการภาพ) - MADS - Metadata Authority Description Schema แบบแผนการใชชอ/คา ของ Access point ใน Descriptive metadata - PREMIS – Preservation Metadata Framework สาหรบจดการ objects ตางๆ ใน document (1 กลม

เอกสาร) ทเปนมาตรฐานเพอการจดการและแลกเปลยน metadata ในลกษณะเดยวกบ MARC format อาท METS, RDF

- METS - Metadata Encoding and Transmission Standard - RDF - Resource Description Framework XML (eXtensible Markup Language) สาหรบประมวลผล แสดงผล แลกเปลยน metadata/documents บนเวบ และแปลงโครงสรางเอกสาร - XML schema language กากบ documents และเปนไวยากรณ สาหรบ matadata - XSL - eXtensible Stylesheet Language แสดงผล card catalog - XSLT - eXtensible Stylesheet Language Transformation แปลงโครงสรางระหวาง schemas

4

ระดบของ Metadata (Levels of complexity) 1. Simple format - จดเปน unstructured data - พบอยในตว resource เชน search engine ทจดการเทคนค การทาดรรชนอตโนมตบนเวบ 2. Structured format - กลมขอมลเชงโครงสรางทออกแบบสาหรบผใชโดยท วไป - มกม basic template เพอการสราง metadata - ไมตองการการพรรณนาในระดบ professional level - ตวอยางเชน Dublin Core Metadata Element Set 3. Rich format -ใชใน Libraries, archives, และ museums -ใชกบระเบยนบรรณานกรมทสรางโดยใช MARC format และ หลกเกณฑการลงรายการแบบ AACR2R, RDA - รวมถงกลม archival records ทสรางโดยใชมาตรฐาน EAD (Encoded Archival Description)

5

ประเภทของ Metadata จาแนกไดหลายประเภท และอาจคาบเกยวกน ขนกบการจดการ

และการตดสนใจของแตละสถาบน ในทน จาแนกเปน 6 ประเภท 1. Descriptive Metadata 2. Structural Metadata 3. Administrative Metadata 4. Technical Metadata 5. Preservation Metadata 6. Use Metadata Descriptive Metadata เปน metadata ทบรรยายเกยวกบวตถสารสนเทศ เชน ระบชอ เร อง ชอผรบผดชอบ ลกษณะรปราง หวเร อง ฯลฯ Descriptive Metadata ทรจก:- - DCMES-Dublin Corc Metadata Element Sets, - EAD- (Encoded Archival Description), - MARCXML - MODS

6

MODS (Metadata Object Description Schema) เปนมาตรฐาน Metadata ระดบ rich format รเร มโดย Library Of Congress. Network Development and MARC

Standards Office ซงเปนผพฒนา MARC & METS (Framework ทจดการ และถายโอน document) & MADS (มาตรฐานการใชชอหรอคา)

MODS ใช XML schema เปน syntax ทาใหสะดวกตอการประมวลผล การแสดงผลบนเวบ จนถงการแลกเปลยนทางานรวมกน (interoperability) กบ site ทใช XML schema แมจะใชตางระบบ

MODS มพนฐานมาจาก MARC21 & MARCXML เกอบทก element เทยบไดกบ fields ใน MARC bibliographic format

ม MODS Stylesheets สามารถแปลงไปมาไดกบ MARC และ DC Records ทหองสมดใชอย โดยใช XSL (eXtension Stylesheets Language)

- MARCXML to MODS , MODS to MARCXML - Dublin Core to MODS, MODS to Dublin Core ม MODS Mappings เทยบระหวาง - MARC to MODS - MODS to MARC - Dublin Core (simple) to MODS - MODS to Dublin Core (simple

7

ลกษณะของ MODS ใช Language-based tags เขาใจไดงาย ไมตองพงพาการ

ถอดรหส เหมอน MARC tags ทเปนตวเลข เชน สวนชอเร องใช <titleInfo>(tag245) , สวนชอใช<name>(tag1XX, 7XX)

จดกลมขอมลเปนสวนๆ /ระดบตางๆ - ระดบเขตขอมล = main elements - ระดบเขตขอมลยอย = child elements/subelements - ระดบสวนยอยของเขตขอมลยอย = sub of subelements ทก elements/subelements ใชซาได และ เปน optional ม attributes ทใชระบคามาตรฐานขยายความหมายของ

elements/subelements Main elements บางตวทาหนาทเปน wrapper tag รวมกลม

child elements ทบนทกขอมลเร องเดยวกนไวดวยกน

8

สวนประกอบของ MODS 1. MODS elements (กลม/เขตขอมล ) ม 20 elements และอก

64 subelements 2. MODS attributes (ตวขยาย/กากบ elements/subelements

เพอระบคาของขอมลใน elements/subelements หนงๆ ใหชดเจน เฉพาะเจาะจงยงข น)

แบงไดเปน 5 กลม คอ 2.1 language attributes และ attributes ท เกยวกบภาษา ตวระบชอภาษาตามสากล รวมท ง ตวอกษรในภาษา

2.2 date attributes ตวระบขอมลวนเวลาทใชโดยเฉพาะ ป 2.3 linking attributes ตวระบขอมลการเชอมโยง 2.4 authority attributes ตวระบท มาของคา/term ตาง ๆ ทใช 2.5 อน ๆ นอกเหนอจากกลม 2.1-2.4 อาท type, DisplayLabel 9

Top-level MODS elements

เปรยบเทยบกบ Dublin Core elements)

1. titleInfo (Title) 11. note (Description) 2. name (Creator, Contributor) 12. subject (Subject, Coverage) 3. typeOfResource (Type) 13. classification (Coverage) 4. genre (Type) 14. relatedItem (Relation, Source) 5. originInfo (Publisher, Date) 15. identifier (Identifier) 6. language (Language) 16. location (Identifier) 7. physicalDescription (Format) 17. accessCondition (Rights) 8. abstract (Description) 18. part 9. tableOfContents(Description) 19. extension 10. targetAudience 20. recordInfo

10

MODS attributes

1. กลม language attributes ทเกยวของกบภาษา เชน - ชอภาษา ใช ISO639-1 (xml:lang) - เชน en ISO639-2b (lang) - เชน eng - ตวอกษรตนแบบ (script) ใช ISO15924 เชน basic Roman ตวอยาง

<titleInfo lang=“rus” script=“Latin” transliteration=“Coded to be determined”>

<title>Geodezja I urzadzenia roline</title>

</titleInfo>

11

MODS attributes

2. กลม date attributes (encoding; point (start, end); keydate (yes ระบวาเปน keydate); qualifier) - Encoding (รปแบบของ date) เชน w3cdtf รปแบบ- yyyy-mm-dd, iso8601- yyyymmdd, MARC - yymmdd - Qualifier (ประมาณคาของ date) เชน approximate

(ca.1972), inferred = ชวงเวลา (not before 1952), questionable (1972?)

ตวอยาง <dateModified encoding=“iso8601”>20031008 </dateModified >

12

MODS attributes

3. กลม linking attributes (ID, xlink) 4. กลม authority attributes (authority files, controlled lists, value lists) ระบชอแหลงของคาควบคม /คา ทนามาใช 5. อน ๆ เชน type, displayLabel

ตวอยาง <titleInfo type=“alternative” displayLabel=“Spine

title”> <title>Science and public affairs</title> </titleInfo> <name type=“personal” authority=“naf”> <namePart>Woolf, Virginia</namePart> </name>

13

<titleInfo>

บนทกชอเร องทเหมาะสม ชอเร องอน ๆ และขอมล เกยวกบชอเร อง

Attribute: “type” ประเภทของชอเร อง abbreviated, translated, alternative, uniform Subelement: <nonsort>, <title>, <subtitle>, <partNumber>, <partName> ตวอยาง: ชอเร อง Bush Cheney รจกในอกชอคอ Bush-Cheney 2000 <titleInfo><title>Bush Cheney</title></titleInfo> <titleInfo><title type=“alternative” displayLabel =“also known as:”>Bush-Cheney 2000</title> </titleInfo>

14

<name> บนทกชอผรบผดชอบสาคญในงาน ท งทเปน persons,

organizations หรอ events Attribute: ม “type” ระบประเภทของชอ personal, corporate, หรอ conference Subelements: <namePart>,<displayLabel>, <affiliation>, <role>, <description> ตวอยาง: MARC: John Paul II, Pope, 1920- <name type="personal"> <namePart type="given">John Paul</namePart> <namePart type="termsOfAddress">II</namePart> <namePart type="termsOfAddress"> Pope</namePart> <namePart type="date">1920-/namePart> </name>

15

<typeOfResource> ระบประเภทของทรพยากรทพรรณนา 11 ประเภท 1) text 2) cartographic 3) notated music 4) sound recording-musical 5) sound recording-nonmusical 6) sound recording 7) still image 8) moving image 9) three dimensional object 10) software, multimedia 11) mixed material ตวอยาง: ทรพยากรประเภทวสดบนทกเสยงทไมใชเสยงดนตร <titleInfo> <title>Camp Council meeting; speech by Dewey Rodgers</title> </titleInfo> <typeOfResource>sound recording-nonmusical </typeOfResource>

16

17

<genre> • ระบลกษณะเฉพาะหรอรปแบบการนาเสนอเนอหาของทรพยากร

ทพรรณนา เชน ระบ style, form, หรอ content ซงเจาะจงมากกวา terms ใน<typeOfResource>

Attributes: ของ <genre> authority ระบชอ authoritative list ทม genre terms อย

เชน authority="marcgt" ดชอแหลงของ genre terms ทwww.loc.gov/marc/sourcecode/genre/genresource.html

สวน genre source code list ตาม MARC 21 ดไดท : www.loc.gov/marc/sourcecode/genre/genrelist.html Subelements: ไมม ตวอยาง: <genre authority="marcgt">folktale</genre> <genre>rock music</genre>

18

<originInfo> บนทกขอมลเกยวกบการผลต การเผยแพรทรพยากรทพรรณนา

เชน ชอสถานทพมพ ชอสานกพมพ ปทผลต ปทเผยแพร ปทสราง ฯลฯ คร งทพมพ คาระบความตอเนองของการผลตเผยแพร กาหนดออก ฯลฯ

subelement ม 12 ตว ดงน 1) <place> (260 $a) (< placeTerm>) 2) < publisher>(260 $b) 3) <dateIssued>(260 $c)

4)<dateCreated>(260 $g) 5) <dateCaptured>(033) 6) <dateValid> (046 $m) 7) dateModified>(046 $j) 8) <copyrightDate>(260 $c)

9) <dateOther>(046 $d) 10) <edition> (250$a) 11) <issuance>(ldr/07=m,s) (Value: continuing, monographic) 12) <frequency>(310 $a)

19

<originInfo> ตวอยาง <originInfo> <place> <placeTerm type="code" authority="marccountry">cau</placeTerm> <placeTerm type="text">Menlo Park,CA</placeTerm> </place> <publisher>Center for Computer Assisted Research in the Humanities</publisher> <dateIssued>1988</dateIssued> <dateIssued encoding="marc"point="start“>1985</dateIssued> <dateIssued encoding="marc" point="end">1988</dateIssued> <issuance>continuing</issuance> <frequency>annual</frequency> </originInfo>

20

<language> บนทกชอ/รหสของภาษาทบนทกเนอหาของทรพยากรทพรรณนา

ม subelement คอ <languageTerm>ใชคามาตรฐานระบชอและรหสชอของภาษา authority=iso639-2b, rfc3066

ตวอยาง <language> <languageTerm type="code" authority="iso639-2b">eng <languageTerm> </language> <language> <languageTerm type="code" authority="iso639-2b">fre <languageTerm> </language> [The resource contains both English and French text]

21

<physicalDescription> บนทกขอมลระบลกษณะทางกายภาพของทรพยากรทพรรณนา

เชน รปแบบ/รปลกษณทางกายภาพ ขนาด รปราง ฯลฯ ม subelement 6 ตว คอ

1) <form>(245 $h, 008/23 BK,MU,SE,MM, 008/29 MP,VM, 008/26 CF) 2) <reformattingQuality> (value: access (007/13 CF=a), preservation (007/13 CF=p), replacement (007/13 CF=r) 3) <internetMediaType>(856 $q) 4) <extent> (300 $a, 256$a) 5) <digitalOrigin> (007/11 CF) และ 6) <note> ตวอยาง <physicalDescription> <form authority="marcform">print</form> <extent>ill., music ; 26 cm</extent> <reformattingQuality>replacement</reformattingQuality>

</physicalDescription>

22

<abstract>

บนทกสาระสงเขปหรอเนอเร องยอของทรพยากรทพรรณนา อาจกาหนดประเภทของเรองยอดวย type เชน summary, review, scope and content

ตวอยาง < abstract>A poem about numbers and their

characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</abstract>

23

<tableOfContent>

บนทกสารบญเนอหาของทรพยากรทพรรณนา ตวอยาง <tableOfContents>Who made Web sites? – What could people do? – Search the archive – Visit this site – Analysis The September 11 Web Sphere </tableOfContents>

24

<targetAudience> ระบระดบของผใชสารสนเทศทเหมาะสมกบเนอหาของ

ทรพยากรทพรรณนา ตวอยาง <targetAudience authority="marctarget">juvenile

</targetAudience> <targetAudience authority="marctarget">adolescent </targetAudience>

25

<note> บนทกขอความหมายเหตสาคญเกยวกบทรพยากรท

พรรณนา ตวอยาง <note>Based on a play which originally

appeared in France as "Un peu plus tard, un peu plus tet"</note>

26

<subject> หวเรอง บนทกหวเร องแทนเนอหาของทรพยากรทพรรณนา พรอมระบ

แหลงทมาของคาหวเร องน น Subelement: 1) <topic> 2) <geographic> 3) <temporal> 4) <titleInfo> 5) <name> 6) <geographicCode> 7) <hierarchicalGeographic> (<continent>,<country>, <province>, <region>, <state>, <territory>, <county>, <city>, <island>,<area>) 8) <cartographics> (<coordinates>, <scale>, <projection>) 9) <occupation>

27

<subject> หวเรอง (ตอ)

ตวอยาง หวเร องของ MARC 650#0 $a Real property $z Mississippi $z Tippah County $v Maps

แสดงผล Real property--Mississippi--Tippah County--Maps

บนทกแบบ MODS <subject authority="lcsh"> <topic>Real property</topic>

<geographic>Mississippi</geographic> <geographic>Tippah County</geographic <topic>Maps</topic> </subject>

28

<classification> บนทกหมายเลขหมวดหมเนอหาของทรพยากรท

พรรณนา พรอมระบชอระบบหมวดหมของหมายเลขหมวดหมน น

ตวอยาง <classification authority="lcc">TH6493 </classification> <classification authority="ddc"

edition="11">683 </classification>

<relatedItem>

ระบลกษณะความสมพนธของงานชนอนกบทรพยากรทพรรณนาโดยระบขอมลรายละเอยดทสาคญของงานชนอนน นดวย

Attribute: “type” ระบประเภทของความสมพนธ คอ 1) preceding 2) succeeding 3) original 4) host 5) constituent 6) series 7) otherVersion 8) otherFormat 9) isReferencedBy Subelements: 20 elements ของ MODS

29

<relatedItem> (ตอ) <titleInfo>

<title> Directory of computer assisted research in musicology</title>

</titleInfo>

<relatedItem type=“succeeding">

<titleInfo><title>Computing in musicology</title> </titleInfo>

<identifier type="issn">1057-9478</identifier>

<identifier type=“lccn">91656596</identifier>

</relatedItem>

30

31

<identifier> บนทกหมายเลขประจาตวของทรพยากรทพรรณนา โดยเฉพาะ

เลขมาตรฐาน เชน isbn (020 $a, $z) , doi (024 $a) , sici (024 $a, $z) , uri (856 $u, $3), lccn (010 $a, $z) ฯลฯ

ตวอยาง <identifier type="isbn" invalid="yes">0877780116

</identifier> <identifier type="lccn">##2001336783</identifier>

<location> ระบแหลงทจดเกบทรพยากรทพรรณนาอาจเปน ชอ

หนวยงาน/องคกร, url Subelements: <physicalLocation> และ<url> ตวอยาง: <location> <physicalLocation>Library of Congress

Manuscript Division</physicalLocation> </location> <location> <url dateLastAccessed=“2004-01-27”>

http://www.loc.gov/marc/</url></location> 32

33

<accessCondition> เง อนไขการเขาถง/เขาใช

บนทกขอความระบขอจากดในการเขาถง หรอเง อนไขในการใช/ทาสาเนาทรพยากรทพรรณนา

Attribute: “type”ม 2 ขอความระบขอจากด/เง อนไข คอ 1) restrictionOnAccess 2) useAndReproduction ตวอยาง <accessCondition type="restrictionOnAcces"> Restricted: cannot be viewed until 2010; Members of

donor's family </accessCondition>

34

<part>

ใชบนทกรายละเอยดเกยวกบลกษณะทางกายภาพของสวนชนงานยอยทสมพนธกบชนงานอนอยางมแบบแผน <part> อาจใชบนทกในระดบของ top level element เพอระบลกษณะทางกายภาพของชนงานสวนยอยกบงานในกลมเดยวกน หรออาจถกใชอยภายใต <relatedItem> element เพอระบตาแหนงทอยของชนงานสวนยอยหนงๆ ทเผยแพรอยภายในแหลงฯ อน

Attributes สาคญ type - <detail> ; order - <detail> ; unit - <extent> ; encoding -

<date>; point - <date> ualifier - <date> Subelements <detail>; <extent> ; <date> ; <text>

35

<part> ตวอยาง • <titleInfo> • <title>Dana</title> • <subTitle>an Irish magazine of independent • thought</subTitle> • <partNumber>Vol. 1, no.4</partNumber> • </titleInfo> • <part> • <detail> • <title>Wayfarers (Poem)</title> • </detail> • <extent unit=”pages”> • <start>97</start> • <end>98</end> • </extent> • </part>

<extension>

“extension” ใชระบขอมลเพมเตมอน ๆ ทนอกเหนอจากทกาหนดไวใน MODS เทยบไดกบ MARC21 bibliographic format fields 9XX อาจใชในกรณทตองการขยายการใช MODS

Attributes ไมม Subelements ไมม ตวอยาง <extension xmlns:dcterms="http://purl.org/dc/terms/" > <dcterms:modified>2003-03-24</dcterms:modified> </extension> [ใช extension element เพ อระบ Dublin Core element ของวนเดอนป ทปรบปรงตวทรพยากร]

36

<recordInfo>

บนทกขอมลทจาเปนในการจดการระเบยนของทรพยากรทพรรณนา subelement ม 6 ตว คอ 1) <recordContentSource> (040 $a) 2) <recordCreationDate>(008/00-05) 3) <recordChangeDate>(005 4) <recordIdentifier> (001) 5) <recordOrigin> 6) <languageOfCataloging> (040 $b) (<languageTerm>) ตวอยาง <recordInfo> <recordContentSource authority="marcorg"> DLC</recordContentSource> <recordChangeDate>June 24, 2001</recordChangeDate

</recordInfo>

37

MODS Transformation (1) <?xml version="1.0" ?>

<mods xmlns:xlink=http://www.w3.org/TR/xlink xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/" xsi:schemaLocation="http://www.loc.gov/mods/ http://www.loc.gov/standards/mods/mods.xsd"> <titleInfo> <title>Arithmetic /</title> </titleInfo> <name type="personal"> <namePart>Sandburg, Carl</namePart> <namePart type="date">1878-1967</namePart> <role> <text>creator</text> </role> </name> <name type="personal"> <namePart>Rand, Ted</namePart> <role> <text>ill.</text> </role> </name> 38

MODS Transformation (2)

<typeOfResource>text</typeOfResource> <originInfo> <place> <code authority="marc">cau</code> <text>San Diego</text> </place> <publisher>Harcourt Brace Jovanovich</publisher> <dateIssued>c1993</dateIssued> <dateIssued encoding="marc">1993</dateIssued> <edition>1st ed.</edition> <issuance>monographic</issuance> </originInfo> <language authority="iso639-2b">eng</language> <physicalDescription> <form authority="marcform">print</form> <extent>1 v. (unpaged) : ill. (some col.) ; 26 cm.</extent> </physicalDescription>

39

MODS Transformation (3) <abstract>A poem about numbers and their characteristics.

Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</abstract>

<targetAudience>juvenile</targetAudience> <note type="statement of responsibility">Carl Sandburg ; illustrated as an anamorphic adventure by Ted Rand.</note> <note>One Mylar sheet included in pocket.</note> <subject authority="lcsh"> <topic>Arithmetic</topic> <topic>Juvenile poetry</topic> </subject> <subject authority="lcsh"> <topic>Children's poetry, American</topic> </subject> <subject authority="lcshac"> <topic>Arithmetic</topic> <topic>Poetry</topic> </subject>

40

MODS Transformation (4)

<subject authority="lcshac"> <topic>American poetry</topic> </subject> <subject authority="lcshac"> <topic>Visual perception</topic> </subject> <classification authority="lcc">PS3537.A618 A88 1993</classification> <classification edition="20" authority="ddc">811/.52</classification> <identifier type="isbn">0152038655 :</identifier> <identifier type="lccn">92005291</identifier> <recordInfo> <recordContentSource>DLC</recordContentSource> <recordCreationDate encoding="marc">920219</recordCreationDate> <recordChangeDate encoding="iso8601">19930521155141.9 </recordChangeDate> <recordIdentifier source="DLC">92005291</recordIdentifier> </recordInfo> </mods>

41

ระเบยนเดยวกนตามมาตรฐานดบลนคอร Dublin Core Transformation

<?xml version="1.0" ?> <dc xmlns="http://purl.org/dc/elements/1.1/"> <title>Arithmetic /</title> <creator>Sandburg, Carl, 1878-1967.</creator> <creator>Rand, Ted, ill.</creator> <type /> <publisher>San Diego : Harcourt Brace Jovanovich,</publisher> <date>c1993.</date> <language>eng</language> <description>A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</description> <description>One Mylar sheet included in pocket.</description> <subject>Arithmetic</subject> <subject>Children's poetry, American.</subject> <subject>Arithmetic</subject> <subject>American poetry.</subject> <subject>Visual perception.</subject> </dc>

42

METS

Metadata Encoding and Transmission Standard จดทาโดย Library of Congress. Network

Development and MARC Standards Office และ Digital library Federation

ใช XML-based Standard ไมผกตดกบ software, OS, และ Plateform ใดๆ

เปน Framework เชอมโยง ระบ จดระเบยบ metadata ทกประเภท และวตถดจทลทเก ยวของกน ท งทอยภายนอกและภายใน METS document น น

ตวอยาง METS document ทม ระเบยน MODS

43

Building a METS Document: The Framework

• <METS:mets> • <METS:metsHdr/> Header • <METS:dmdSec/> Descriptive MD • <METS:amdSec/> Administrative MD • <METS:fileSec/> File list • <METS:structMap/> Structural Map • <METS:structLink/> Structural links

</METS:mets>

44

สวนประกอบของ METS document

1. METS header = <metsHdr> บนทกขอมล วนเดอนปท สราง วนเดอนปทปรบปรงลาสด สถานภาพ รวมท ง ชอและ หนาทของผรบผดชอบสราง METS document 2. Descriptive metadata = <dmdSec> บนทก metadata ทพรรณนาวตถสารสนเทศดจทล ใน METS document 3. Administrative metadata = <amdSec> ม 4 ประเภท - technical metadata = <techMD> - intellectual property rights metadata = <rightsMD> - source metadata = <sourceMD> แหลงทมาของ วตถในรป analog - digital provenance metadata = <digiprovMD> ระบความสมพนธระหวาง master file กบ derivative files

45

สวนประกอบของ METS document

4. File section = <fileSec> ใช “<fileGrp>” จดระเบยบไฟลวตถฯ ระบไฟลเวอรช นตางๆ ของวตถฯดจทลทเก ยวของกน ใช <file> ระบไฟลแตละเวอรช น ทประกอบกนรวมเปนหนงกลม

5. Structural map = <structMap> ระบโครงสรางตาม ลาดบช นของไฟลวตถฯ ดจทลทเก ยวของกน เชน โครงสรางของบทตาง ๆ ของ eBook เปนตน

6. Structural links = <structLink> บนทก hyperlinks ทเชอมโยงไฟลของวตถฯ ดจทล ดวย <smLink>

46

47

48

49

ตวอยาง METS Document: Maps & Geographic Northwestern University African Maps Collection

http://fedora.library.northwestern.edu/fedora/get/inu:inu-afrmap-4333843/source

<?xml version="1.0"?> <mets:mets xmlns:dc="http://purl.org/dc/elements/1.1/" LABEL="A map of the Gold Coast, from Issini to Alampi / by M. d'Anville ; G. Child sculpt." TYPE="map" OBJID="4333843" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-0.xsd http://www.loc.gov/mix/ http://www.loc.gov/standards/mix/mix.xsd http://www.loc.gov/standards/premis/v1 http://www.loc.gov/standards/premis/v1/PREMIS-v1-1.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/simpledc20021212.xsd http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd" xmlns:mets="http://www.loc.gov/METS/" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:mix="http://www.loc.gov/mix/" xmlns:premis="http://www.loc.gov/standards/premis/v1" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"> <mets:metsHdr RECORDSTATUS="wrapper" LASTMODDATE="2006-11-29T17:06:54" CREATEDATE="2006-11-29T17:06:54"><mets:agent TYPE="INDIVIDUAL" ROLE="CREATOR"><mets:name>Stewart, Mary Claire</mets:name></mets:agent><mets:agent TYPE="INDIVIDUAL" ROLE="CREATOR"><mets:name>Miller, Karen</mets:name></mets:agent><mets:altRecordID>g8850_1729_a5</mets:altRecordID> </mets:metsHdr> <mets:dmdSec ID="DM1"><mets:mdRef LABEL="Catalog Record" xlink:href="http://nucat.library.northwestern.edu/cgi-bin/Pwebrecon.cgi?BBID=4333843" MDTYPE="MARC" LOCTYPE="URL"/></mets:dmdSec>encoding="marc">060103</mods:recordCreationDate> <mods:recordChangeDate encoding="iso8601">20060730210259.0</mods:recordChangeDate> <mods:recordIdentifier>4333843</mods:recordIdentifier></mods:recordInfo></mods:mods></mets:xmlData> </mets:mdWrap></mets:dmdSec> <mets:dmdSec ID="DM2"><mets:mdWrap MDTYPE="MODS"><mets:xmlData><mods:mods>

50

ประเดนลกษณะของ research data • ขอมลการวจยในนานาชาต มปรมาณเพมข นมาก และขอมลวจย

นสวนมากอยในรป Born Digital • สถาบนตางๆ ทเก ยวของ ตองหาหนทางจดเกบและจดการขอมล

เหลาน ใหอยใน a format ทสะดวกตอการคนพบ เขาถง และนากลบมาใชใหม (reuse) ได

• การจดการกบ research output ใน repositories ทผานมา อย ในลกษณะของการจดการกบ Research publications

อาท บทความวารสาร บทในหนงสอ เอกสารการประชม grey literature โดยเฉพาะ รายงานทางวชาการ ฯลฯ ท งทเปนสงพมพรฐบาล และสงพมพสถาบน รวมท ง output ของนกวจย

ทคนผาน web portal & Google indexing = Research publications

• ปจจบนมแนวโนมเปนการจดการกบ the institution’s data collections = Research data collections

ลกษณะของ research data ทรวบรวม การรวบรวม Research data collections และ datasets รวบรวม

ขอมลท งในระหวางวจยและภายในกระบวนวธตามหลกการในวทยาการของศาสตรหนงๆ

ขอมลทจาเปนตองอนรกษไว (Ephemeral data) เหลาน อาท - method of data collection; - human input /automated machine capture; - number, type, and size of data files; - software เฉพาะ /ขอมลระบวธเปดใชหรอเขาดไฟล - ขอมลทเก ยวของกบ legal or ethical restrictions; และอนๆ จากความตางน ใน repository จงตองใชมากกวา หนง metadata

schema เพอพรรณนาขอมลในลกษณะตางๆ ประเดนทตองพจารณา เพอการจดการ policy, data management, planning, scope, data interviews, metadata, storage, method of metadata input, legal & ethical restrictions, intellectual property, workflows, staff, discovery, software & advocacy

ประเดนการใช Metadata อธบายทรพยากรฯ ระดบตางๆ

การจด collection level (granularity) ของชนงาน 1. ระดบของวตถชนเดยว fragments/item (1 ภาพ) 2. ระดบของการรวมวตถชนเดยว collection of atoms เชน html document ม pictures และ ม a lesson ฝงอย 3. ระดบของกลมงานรวม เชน a web of html documents ทมสารบญหรอดรรชน โยงหนาและบท ตางๆ เขาดวยกน รวมเปน 1 unit (1 เลม/1 ชดวชา) 4. ระดบใหญทสด เชน a course (1 หลกสตร)

53

Descriptive Metadata for Collections and Items

เปนการพจารณาเพอทาใหสารสนเทศทอธบายเกยวกบทรพยากรฯ /collections หนงๆ สมบรณ มประโยชนสงสด ชวยคนและสามารถนาไปรวมใชกบระบบอนได

Descriptions of data collections VS description of individual items ภายใน data collections

55