Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
INFORMATIONRETRIEVAL SYSTEMConcepts and Future Directions
ระบบคนคนสารสนเทศแนวคดและแนวทางการพฒนาในอนาคต
ผศ.ดร.ไกรศกด เกษร
ระบบคนคนสารสนเทศ:แนวคดและแนวทางการพฒนาในอนาคต
เรยบเรยงโดย : ผศ.ดร.ไกรศกด เกษร
ภาควชาวทยาการคอมพวเตอรและเทคโนโลยสารสนเทศ
คณะวทยาศาสตร มหาวทยาลยนเรศวร
99 หม 9 ต.ทาโพธ อ.เมอง จ. พษณโลก 65000
[email protected], [email protected]
ระบบคนคนสารสนเทศ : แนวคดและแนวทางการพฒนาในอนาคต
(Information Retrieval System: Concepts and Future Directions).
พษณโลก: โฟกส พรนตง, 2558, 294 หนา.
1. หลกการคนคนสารสนเทศ 2. การคนคนมลตมเดย 3. Search
Engine I. ชอเรอง
ISBN: 978-974-8230-47-4
สงวนลขสทธ © 2558 โดย ผศ.ดร.ไกรศกด เกษร
ปรบปรงครงท 1 : กนยายน 2558
จ�ำนวนพมพ : 500 เลม
พสจนอกษร : ผศ.ดร.ไกรศกด เกษร
ออกแบบปก : สญญา จนทา
พมพและออกแบบกรำฟก : ดวงหทย มนแยม
จดพมพและจดจ�ำหนำย :
ภาควชาวทยาการคอมพวเตอร คณะวทยาศาสตร
มหาวทยาลยนเรศวร อ.เมอง จ.พษณโลก 65000
คำ�นำ�
P R E F A C E
ในยคแหงระบบสารสนเทศในปจจบนขอมลตางๆไดกระจายอยทวไปบนระบบเครอ
ขายอนเทอรเนต(Internet)และมแนวโนมทจะเพมมากขนอยางรวดเรวในอนาคตเนองจากการ
เผยแพรขอมลตางๆผานทางเครอขายอนเทอรเนตสามารถท�าไดงายและสะดวกมากขน โดยใช
เครองมอตางๆทมใหบรการบนอนเทอรเนตเชนบลอก(Blog)สกายไดรฟ(SkyDrive)กเกลไดรฟ
(Google Drive) ดรอปบอกซ (Dropbox) และเครอขายสงคมตางๆ (Social network) เชน
เฟสบค(Facebook)หรอทวตเตอร(Twitter)เปนตนปจจบนนอกจากขอมลประเภทตวอกษร
แลวขอมลมลตมเดย(Multimedia)เชนรปภาพ(Image)และวดโอ(Video)ยงเปนขอมลทนยม
ทจะเผยแพรบนระบบเครอขายอนเทอรเนตอกดวยเนองจากผใชสามารถใชอปกรณอเลคทรอนค
เชน มอถอหรอแทบเลต (Tablet) เผยแพรขอมลเหลานไดโดยตรง อยางไรกตามการมขอมล
จ�านวนมหาศาลบนเครอขายอนเทอรเนตน�าปญหามาสผใชดวยเชนกน นนคอผใชไมสามารถ
คนหาขอมลทตองการไดอยางสะดวกและรวดเรว โปรแกรมคนหาขอมล (Search engine)
ไมสามารถคนหาเอกสารทผใชตองการไดอยางถกตองและแมนย�า ปญหาดงกลาวท�าใหนกวจย
คดทจะพฒนาและปรบปรงวธการทางดานวทยาการคอมพวเตอรเรยกวา“ระบบคนคนสารสนเทศ
(InformationretrievalหรอIR)”ทมประสทธภาพมากขนเพอใหสามารถคนหาขอมลทตรงกบ
สงทผใชตองการมากทสดไดอยางรวดเรวและถกตอง
ดวยความส�าคญของปญหาระบบคนคนสารสนเทศหนงสอเลมนจงถกจดท�าขนและม
จดประสงคเพอเปนแนวทางใหกบนกศกษานกวจยตลอดจนผทสนใจใชเปนแหลงขอมลพนฐาน
ในการศกษาการท�างานของระบบคนคนสารสนเทศเนอหาส�าคญของหนงสอเลมนประกอบดวย
พนฐานความรของระบบคนคนสารสนเทศการค�านวณความคลายคลงกน(Similaritymeasure)
ระหวางเอกสารและขอค�าถาม (Query) หลกการท�างานของระบบคนคนสารสนเทศมลตมเดย
(Multimediainformationretrieval)ระบบคนคนสารสนเทศเชงความหมาย(Semantic-based
information retrieval) ซงเนอหาในหนงสอเลมนมการน�าเสนอเนอหาใหมความทนสมยโดย
จะแนะน�าถงงานวจยใหมๆ ทเกดขนในวงการวชาการ เชน การคนคนรปภาพเชงความหมาย
(Semantic-basedimageretrieval)เทคนคการตอบกลบจากผใช(Relevancefeedback)เทคนค
การใชออนโทโลยเพอแปลความหมายของรปภาพ(Ontology-basedimageinterpretation)
และแนวทางการพฒนาระบบคนคนสารสนเทศในอนาคต เชน ระบบคนคนสารสนเทศเฉพาะ
บคคล (Personalized information retrieval) และระบบคนคนสารสนเทศขามภาษา
(Cross-languageinformationretrieval)ซงเปนเทคนคทนกวจยทางดานการคนคนสารสเทศ
ใหความสนใจอยางมากในปจจบน
หนงสอเลมนจะมองคประกอบในแตละบทในลกษณะเดยวกนดงตอไปน
1) เนอหาหลกหมายถงเนอหาส�าคญประจ�าบทนนตามซงสอดคลองตามชอเรองของ
แตละบท โดยจะมการแบงเปนหวขอยอยๆทมความสมพนธและเชอมโยงกนใน
แตละหวขอยอยดงกลาว
2) ตวอยางแสดงขนตอนหรอวธการท�าเพอประกอบความเขาใจของผอานโดยจะม
การอธบายตางๆ เปนขนตอนพรอมทงบางตวอยางจะมรปภาพประกอบเพอใหผ
อานเขาใจงายขน
3) ประเดนนาสนใจ เปนการน�าเสนอและสอดแทรกความคดของผเขยนเพอช
ประเดนปญหาบางจดของเทคนคหรอวธการในบทนนๆ นอกจากนผเขยนยงให
แนวคดในการแกไขปญหากลาว เพอเปนแนวทางในการพฒนาตอยอดส�าหรบนก
วจยหรอนกศกษาทก�าลงหาแนวทางการท�าวจยในหวขอดงกลาว
4) SUMMARY บทสรปประจ�าบทเปนหวขอทสรปสาระส�าคญของแตบทเพอท�าใหผอานเหน
ภาพรวมของเนอหาภายในบทและเขาใจถงประเดนส�าคญๆทไดอานมาในบทนนๆ
5) แบบฝกหด เปนแบบฝกหดทมจดประสงคเพอทดสอบความเขาใจของผอานซง
ค�าตอบอาจจะมอยในเนอหาของบทนนๆ หรออาจจะเปนแบบฝกหดประยกตทผ
อานตองคนหาค�าตอบจากแหลงขอมลอนๆเชนเครอขายอนเทอรเนตหรอหนงสอ
อนๆนอกจากนแบบฝกหดบางขอยงเปนค�าถามทตองแสดงวธการค�านวณเพอหา
ค�าตอบทตองการ
6) เอกสารแนะน�าส�าหรบอานเพมเตมเปนสวนทแนะน�าแหลงคนควาหาขอมล
เพมเตมในเนอหาทนาสนใจซงอาจจะมการแนะน�าเวบไซตหนงสอหรอบทความ
วจย (Research papers) ทนาสนใจและเปนประโยชนตอการคนควาวจยของผ
อาน
7) เอกสารอางอง ในแตละบทจะมการอางองถงบทความหรอหนงสอซงเปน
เจาของแนวคดในเรองตางๆ ผอานสามารถหาขอมลเพมเตมในเรองทสนใจจาก
เอกสารอางองในแตละบท
แหลงขอมลประกอบหนงสอส�าหรบผอาน สามารถดาวนโหลดไฟลเอกสารประกอบ
เนอหาในแตละบทเชนสไลดเพอประกอบการสอนและเฉลยแบบฝกหดในแตละบทไดจากเวบไซต
http://student.nu.ac.th/kraisakk/IR
ผเขยนหวงเปนอยางยงวานกศกษานกวจยและผทสนใจจะใชความรและความเขาใจ
ทไดจากการอานหนงสอเลมนเปนแนวทางในการพฒนาตอยอดงานวจยเพอพฒนาระบบระบบ
คนคนสารสนเทศทมประสทธภาพมากขนตอไปในอนาคต
(ผศ.ดร.ไกรศกดเกษร)
กตตกรรมประก�ศA C K N O W L E D G E M E N T
หนงสอเลมนส�าเรจลงไดตองขอขอบคณผมสวนรวมทกทานทให
ความชวยเหลอดานตางๆ ใหค�าแนะน�าตางๆ ทเปนประโยชนในการปรบปรง
แกไขเนอหาใหเปนประโยชนและตรงกบเนอหาของรายวชาใหมากทสด
ขอขอบพระคณ รองศาสตราจารย ดร.จนทรบรณ สถตวรยวงศ ทเสยสละ
เวลาในการใหค�าแนะน�าในการปรบปรงเนอหาในหนงสอเลมน
ขอขอบคณ นางสาวดวงหทย มนแยม ทชวยเหลอในการตกแตง
รปภาพภายในหนงสอท�าใหมความสวยงามและประกอบความเขาใจเนอหา
ของหนงสอไดดมากยงขน และนายสญญา จนทา ทชวยออกออกแบบ
งานไดกราฟกในการออกแบบรปภาพหนาปกใหมความสวยงามนาสนใจ
ขอขอบคณนายสชน เขยวเนตร นายคมสน เดอนแจม และนายภาสวร อองรก
ทชวยชวยเหลอในการตรวจสอบความถกตองของเนอหาใหมความผดพลาด
นอยทสด ขอบคณแหลงอางองตางๆ ทถกรวบรวมและอางถงในหนงสอ
เลมน หากมขอความใดมการอางองทผดพลาด ผเขยนขออภยมา ณ ทน
ขอขอบคณภาควชาวทยาการคอมพวเตอรและเทคโนโลยสารสนเทศ
คณะวทยาศาสตร มหาวทยาลยนเรศวร ทใหสถานทท�างานและสงอ�านวย
ความสะดวกตางๆ รวมถงแหลงทนวจยตางๆ เชน วช. สกอ. สกว. และ
มหาวทยาลยนเรศวรทสนบสนนทนในการท�าวจยในเรองตางๆ ทเกยวของ
กบการคนคนสารสนเทศ ท�าใหผเขยนรวบรวมองคความรทไดจากงานวจย
และถายทอดออกมาเปนหนงสอเลมนขนมาจนเสรจสมบรณไดอยางทเหนน