39
มหาวิทยาลัยราช ภัฏ ยะลา เรื่อง : Big Data

Big data

Embed Size (px)

Citation preview

มหาวทยาลยราชภฏยะลาเรอง : Big Data

บทน า

ปจจบนเทคโนโลยสารสนเทศไดเขามาเปนสวนหนงในชวตประจ าวนโดยการสอสารผานทางอนเทอรเนตซงถกใชกนอยางแพรหลายในการด าเนนการทางธรกจ ซงในขณะนนวตกรรมใหมทม ความส าคญและก าลงจะเตบโตอยางขน ไดแก Big Data

จงเปนผลใหการ ใช Big Data นน มประเดนปญหาเกยวกบความเปนสวนตว และความมนคงปลอดภยของขอมล เกดขนเปนจ านวนมาก

ปจจบนเทคโนโลยสารสนเทศไดเขามาเปนสวนหนงใ น ช ว ต ป ร ะ จ า ว น จ น เ ก ด เ ป น ส ง ค ม ใ ห ม เ ร ย ก ว า สงคมสารสนเทศ เรองราวเกยวกบ Big Data เรมตนจากการทเรามชดขอมล (data set) ขนาดมหมา ขอมลทเกดขนในโลกใบนทมการบนทกเกบไวในหลากหลาย

ประวตความเปนมาของ Big data

ตวอยาง สาระสนเทศ Big data

การเกบขอมลขอมลประวตขอมลต าแหนง

ผใช

Big Data หมายถง ขอมลขนาดมหาศาล เชน Google, Facebook, Twitter เปนตน เปนลกษณะของประเภทของโครงสรางพนฐานของการประมวลผลกลมเมฆมาใช จงตองมการคดคนเทคโนโลยใหมๆ ทสามารถจดการขอมลขนาดใหญ หรอ Big Data นไดตองผานการประมวลผล การวเคราะห และแสดงผลเพอใชเปนกลยทธตาง ๆ ของธรกจ

ความหมายของ Big data

1. รองรบและจดเกบขอมลมากกวา Petabyte ขนไป2. มการจดเกบขอมลชนดทมระบบทดแทน รวมทงใหบรการแบบกระจาย3. การประมวลผลขอมลเปนแบบขนาน

สภาพแวดลอมส าหรบ Big Data

1. Volume2. Velocity3. Variety

ลกษณะพเศษของ Big Data

องคกรมการวเคราะหขอมลโดยใชระบวนการ Batchหรอการประมวลผลทตอเนองตามล าดบโดยมขอมลทถกจดเตรยมไวเรยบรอยแลว

Variety

แบบประมวล Real-Time

1. ปมบนทกการใชงานเวบ (บกมารก)2. บนทกการรบโทรศพท3. เครอขายสงคม, ขอมลสงคม (social data)

ตวอยางขอมลทท าใหเกด Big Data

ปมบนทกการใชงานเวบบนทกการรบโทรศพท

เครอขายสงคมขอมลสงคม

Big Data Analytics คอ การน าขอมลจ านวนมหาศาลนน มาจดการวเคราะห เพอใหน าขอมลเหลานนมาใชไดงายขน ในแงของการวางแผนการตลาด หรอใชในการตดสนใจทางธรกจ

ประโยชนของ Big Data Analytics ตอวงการโทรคมนาคม

1. Location-based services2. Intelligent marketing campaigns3. Social media monitoring and insights4. Network intelligence5. High-velocity fraud detection

ผใหบรการระบบโทรคมนาคมจะมขดความสามารถนประกอบดวย

1. Location-based services

2. Intelligent marketing campaigns

3. Social media monitoring and insights

4. Network intelligence

5. High-velocity fraud detection

1. ความหมายของการประมวลผลแบบกลมเมฆ

การประมวลผลแบบกลมเมฆCloud Computing

2. ชนดของการประมวลผลแบบกลมเมฆ

การประมวลผลแบบกลมเมฆCloud Computing

2.1 การประมวลผลแบบกลมเมฆบคคลทวไป (Public Cloud Computing)2.2 การประมวลผลแบบกลมเมฆเฉพาะบคคล (Private Cloud Computing)2.3 การประมวลผลแบบกลมเมฆทงบคคลทวไปและเฉพาะบคคล (Hybrid Cloud Computing)

3. ประเภทบรการการประมวลผลแบบกลมเมฆ

การประมวลผลแบบกลมเมฆCloud Computing

3.1 Infrastructure-as-a-Service (IaaS)3.2 Platform-as-a-Service (PaaS)3.3 Software-as-a-Service (SaaS)

การบรหารจดการ Big Data

1. Schema-less databases, หรอ NoSQL databases

มฐานขอมลหลายชนดทเขากบการท างานแบบน เชน Key Value Store และ Document Store ซงเนนไปทการจดเกบและการดงขอมลขนาดใหญทมลกษณะแบบมโครงสราง หรอกงโครงสราง และแมกระทงไรโครงสรางได

2. NoSQL

เนนใชงานกบปรมาณขอมลทมจ านวนมากมายมหาศาล ระดบ Facebook Twitter Google NoSQL ไมมโครงสรางตายตว สามารถขยายไดในระดบแนวนอน คอเพมเครองไดงายกวา NoSQL เปนฐานขอมลแบบกระจาย มสถาปตยกรรมทรองรบระบบทดแทน หรอส ารองในกรณทระบบหลกเกดขดของ

3. Hive

จะท าให Hadoop ท างานเสมอนหนง เปน data warehouse. มนจะซอนตวมนเองเขาไปในขอมลภายใต HDFSจากนนอนญาตใหมการเขามาสอบถามขอมลโดยใช Syntax ทคลายกนกบ SQL เชนเดยวกนกบ Pig ตว Hive มแกนการท างานทสามารถขยายได

4. PIG

เปนภาษาโปรแกรมมง ทสามารถท าใหงานทท ารวมกบ hadoop มความเรยบงาย ไมวาจะเปนโหลดขอมล การแสดงการเปลยนแปลงของขอมล และจดเกบผลลพธสดทาย

ในตว PIG ม ระบบการท างานทเขาใจขอมลประเภท Semi-Structured เชน Log Files และภาษาทขยายได โดยใช Java เพอเพมการสนบสนนส าหรบขอมลทมการเปลยนแปลงแบบ Custom

5. HDFS

Hadoop Distributed File System (HDFS) เปนระบบแฟมขอมลแบบกระจาย ทถกออกแบบมาใหท างานบนเซรฟเวอร และ แพลตฟอรม ทวไป มความคลายคลงกนกบระบบแฟมขอมลแบบกระจาย โดยมขอแตกตางเพยงเลกนอย HDFS มระบบทดแทนความผดพลาดสงถกออกแบบมาเพอใหท างานบนระบบ Hardware ราคาประหยด HDFS สามารถใหประสทธภาพดานความเรวในการเขาถงขอมลของแอพพลเคชนและเหมาะส าหรบแอพพลเคชนทมชดของขอมลขนาดใหญ เดม HDFS ถกออกแบบใหเปน โครงสรางพนฐานส าหรบโครงการ Apache Nutch web search engine และปจจบนเปนโครงการยอยของ Apache Hadoop

หลกการท างานของ Map Reduce

6. Map Reduce

Map Reduce เปน framework ในการเขยนโปรแกรมแบบหนงทชวยในงานประมวลผลทมชดของขอมล จ านวนมาก เปนการท างานแบบขนาน ซงจะอาศยเครองคอมพวเตอรหลายๆเครองชวยกนท างาน โดยทผใชงานน นไมตองสนใจเบองหลงการท างาน เชนparallelization, data distribution, loads balancing และ faultto leranceในการท างานแลวผใชงาน Map Reduce จะสนใจแคสวนของ Mapและสวนของ Reduce ซง Map จะท าการจบคของ Key/Value ทเราตองการ แลวกจะสงไปให Reduce ท าการประมวลผลเพอใหไดผลลพธทตองการ

6. Map Reduce

Map Reduce เปน framework ในการเขยนโปรแกรมแบบหนงทชวยในงานประมวลผลทมชดของขอมล จ านวนมาก เปนการท างานแบบขนาน ซงจะอาศยเครองคอมพวเตอรหลายๆเครองชวยกนท างาน โดยทผใชงานน นไมตองสนใจเบองหลงการท างาน เชนparallelization, data distribution, loads balancing และ faultto leranceในการท างานแลวผใชงาน Map Reduce จะสนใจแคสวนของ Mapและสวนของ Reduce ซง Map จะท าการจบคของ Key/Value ทเราตองการ แลวกจะสงไปให Reduce ท าการประมวลผลเพอใหไดผลลพธทตองการ

เทคโนโลย Hadoop

การท “Big Data” จะเชอมโยงไปสระบบการประมวลผลส าหรบขอมลปรมาณมาก สามารถจดแบงเทคโนโลยออกเปน 4 กลม ดงน

กลมทหนง “Hadoop” เปนซอฟทแวรเฟรมเวรค (Framework) ถกออกแบบมาเพอท างานบนระบบคอมพวเตอรแบบกระจาย Hadoop ถอเปนเทคโนโลยหลกทอยเบองหลง “Big Data” เปนซอฟตแวรแบบโอเพนซอรส ของ Apache ซงรวมระบบการจดการเครองแมขายในลกษณะคลสเตอร เขาถงและดงขอมลอยางรวดเรวดวยวธ Map Reduce ระบบคอมพวเตอรทจะรองรบการท างานของ Hadoop จะเปนกลมเครองแมขายขนาดเลกหลายๆ เครองทมหนวยจดเกบขอมลขนาดใหญ ตอเชอมกนผานระบบเครอขาย (Local Area Network) หรอเครอขายระยะไกล

กลมทสองคอ ระบบฐานขอมลทไมใชภาษา “SQL” (NoSQL Database) เนองจากความสามารถทรวดเรว สามารถรองรบขอมลแบบ Semi-Structured และ Unstructured ได รองรบการขยายตวในแนวราบ (Horizontal Scaling) ซงสอดคลองกบสถาปตยกรรมของ Hadoop

เทคโนโลย Hadoop (ตอ)

กลมทสามคอ “Data Visualization Tools” ซงเปนเครองมอทจะชวยแปลงขอมล “Big Data” ทไดรบการกลนกรองแลวมาแสดงในรปของแผนภาพ งายตอการเขาใจ และน าไปสการตดสนใจในขนถดไป บทบาทของเครองมอกลมนจะอยในระดบปฏบตการ ใหตดตามสถานะของระบบและการแกปญหาไดงาย

กลมสดทายคอ “Analytic Database” ผลตภณฑในกลมนอาจจะน าไปใชกบระบบคลงขอมลไดดวย และเปนกลมทผผลตซอฟตแวรยกษใหญในตลาดตางใหความส าคญมากโดยใชเทคนคในการท างานแบบตางๆ เพอตอบโจทยดานความเรว ไมวาจะเปนการประมวลผลใน หนวยความจ า (In-memory Computing) การประมวลในระบบฐานขอมล (In-database Computing) ซงไมเหมอนกนเลย แตมสงหนงททกผผลตมเหมอนกนคอ สนบสนนการตอเชอมกบHadoop เพอใหสามารถน าขอมลจาก Hadoop เขามาประมวลในขนตอไปในผลตภณฑฐานขอมลของตนเองได

Big Data กบการใชงานในองคกร

1. งานทเกยวของกบคาปลก/ผบรโภค

1. การวางตลาดของผลตภณฑและการวเคราะหทางการตลาด 2. การบรหารจดการสงเสรม การขาย และโปรแกรมการสรางความภกดตอ Brand ของลกคา 3. การวเคราะหและบรหารจดการหวงโซอปทาน4. การส ารวจขอมลพฤตกรรมของผบรโภคผานทาง Web5. การแบงสวนตลาดของผบรโภค

Big Data กบการใชงานในองคกร (ตอ)

2. การใชงานดานบรการทางการเงน

1. การปฏบตตามกฎระเบยบและการรายงาน2. การวเคราะหและบรหารจดการความเสยง3. การตรวจสอบทจรตและวเคราะหและการวเคราะหการรกษาความปลอดภย4. CRM กบโปรแกรมสรางความภกดของลกคา5. ความเสยงเกยวกบการปลอยเครดต การใหคะแนนและการวเคราะห 6. การวเคราะหแบบแผนทางการคาขายทผดปกต7. การเฝาระวงการคา (Trade Surveillance)

Big Data กบการใชงานในองคกร (ตอ)

3. การใชงานดานบรการ Web และ Digital Media

1. วเคราะหปรมาณของ click stream ขนาดใหญ 2. การก าหนดเปาหมายการโฆษณา การว เคราะห และพยากรณแนวโนม 3. การปองกนการใชงานผดวธ และการฉอโกงทาง Web 4. การวเคราะหกราฟการใชงานบนสงคมออนไลน และการแบงสวนประเภทลกคาและการจดท า Profile5. การจดท าและบรหารจดการแคมเปญ ทางการตลาดและโปรแกรมสรางความภกดตอผลตภณฑ

Big Data กบการใชงานในองคกร (ตอ)

4. การใชงานดานสขภาพและสาธารณสข

1. ขอมลประกอบการรกษา2. ผผลตยาและเวชภณฑใชขอมลมากและหลากหลายเพอหาสาเหตของการเจบปวยทแทจรง3. การวเคราะหลกษณะรปแบบการแพรเชอ เพอใชในงานวจยทางการแพทย4. การวเคราะหคณภาพในการดแลรกษาผปวย5. การบรหารจดการเกยวกบอปทานของเครองมอแพทยและยา6. ขอมลการแพทยและสาธารณสข 7. ผรบผดชอบคารกษาพยาบาล

ความจ าเปนของ “Big Data” ตอธรกจ

1. สรางมลคาทางธรกจ โดยน าขอมลไปวเคราะหเพอหาความตองการสนคา หรอการบรการ ในรปแบบใหมๆ ใหตรงกบความตองการของผใช 2. น าขอมลมาชวยสนบสนนการตดสนใจ เปนการสรางขอไดเปรยบทางการแขงขนในตลาด3. น าขอมลมาชวยประเมนระยะเวลา ประเมนงบประมาณคาใชจายของการท าโครงการใหมๆ ใหใกลเคยงกบการปฏบตงานจรง รวมทงชวยแกปญหาหรอปองกนปญหาทจะเกดขน 4. ชวยในการวเคราะหเพอน าไปวางแผนการตลาด แผนการสงเสรมการจดจ าหนาย การวาง แผนเชงรกของการทางานในอนาคต

ความจ าเปนของ “Big Data” ตอธรกจ (ตอ)

5. ชวยท าใหผบรโภคสามารถรและเขาใจขอมลสนคาและการบรการ ท าใหผบรโภคมทางเลอก ทดทสด และทนตอเหตการณ

จะเหนวาขอมลมหาศาลขององคกรทมอยสามารถน าไปใชประโยชนอยางมากมายตามลกษณะของประเภทธรกจ การเชอมตอออนไลน และระบบการจดเกบขอมลบนเทคโนโลยคราวน คอมพวเตอร จะเปนสวนสนบสนนในการเกบขอมลของธรกจไดอยางปลอดภยเพอการน าไปใชในอนาคตได

สรป Big data

จะเหนไดวาในยคปจจบน มการใชอปกรณประเภทสมารทโฟนและแทบเลทกนอยางแพรหลาย ม Application ทถกพฒนามาเพอสนบสนน Platform ดงกลาวมากมาย รวมถงความนยมในการใช Social Network และการท าธรกจหรอธรกรรมออนไลนตางๆ ท าใหมขอมลเกดขนในระบบออนไลนเหลานเปนจ านวนมาก และอยในรปแบบ Unstructured การจดการกบขอมลจ านวนมากและเกดขนตลอดเวลาประเภทน ไมสามารถท าไดดวยวธการจดเกบไวใน Database รปแบบเดมๆ ไดด หรอถาท าไดกไมสะดวกสบายนก และการจะน ามาใชใหเกดประโยชนกยาก ดงนนองคกรท าใหเกดมมมองใหมๆ สามารถมองเหนในสงทคแขงยงมองไมเหนหรอไมไดใสใจทจะน ามาใช ท าใหองคกรของเราไดเปรยบหรอมความเหนอชนกวาในการด าเนนธรกจ และมโอกาสประสบความส าเรจมากกวา ยกตวอยางบรษททน า Big Data เขามาใชงานและสรางความเตบโตใหองคกรจนประสบความส าเรจจนสามารถอยในกลมผน าของธรกจ อาทเชน Google , Facebook ,Twitter ,Yahoo เปนตน

สมาชกในกลม

นางสาวสตรา เอยดตรง รหส 405759003นางสาวยารน สะน รหส 405759010นางสาวอานตา บอโต รหส 405759012นายนรดง สาเมาะ รหส 405759001นายซาฮาบดน บาฮา รหส 405759014นายอยด อาแว รหส 405759017

สาขาวชาวทยาการคอมพวเตอรมหาวทยาลยราชภฎยะลา