Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
การใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุน
การตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง
Utilizing of Data Mining Techniques to Analyze the
Data Sets and Decision Support for the Position of Exhibition Booth
มงคล ณ ลําพูน*1 จิตรลดา เพลดิพริ้ง2 อังสนา ผอนสุข3 ฉัตรชัย เกศวรกิตติ4 ชลธิชา วงษไสว5
Mongkol Na Lampoon1, Chitlada Plirdpring2 , Angsana Phonsuk 3 , Chatchai Kiatvorakitti 4, Chonticha
Wongsawai 5
1,2,3สาขาวิชาระบบสารสนเทศและคอมพิวเตอรธรุกิจ คณะบรหิารธรุกิจและเทคโนโลยสีารสนเทศ
4,5สาขาเทคโนโลยสีารสนเทศธุรกจิ คณะบริหารธรุกิจและเทคโนโลยีสารสนเทศ
มหาวิทยาลยัเทคโนโลยรีาชมงคลสุวรรณภมู ิ
Email: *[email protected]
บทคัดยอ
งานวิจัยฉบับนี้กลาวถึงขั้นตอนการใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจ
สําหรับตําแหนงการวางบูธจัดแสดง โดยมีวัตถุประสงคเพื่อ 1) สรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธ
จัดแสดงดวยเทคนิค Linear Discriminant Analysis 2) ใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนง
การวางบูธจัดแสดง ดวยใชเทคนิคโมเดลการวิเคราะหจําแนก Linear Discriminant Analysis โดยใชตัวแบบขอมูล
ที่ผานกระบวนการวิเคราะห ซึ่งคณะผูจัดทําไดวิเคราะหชุดขอมูลดวยซอฟตแวร RapidMiner Studio 9
ในการเก็บรวบรวมขอมูลจากการลงทะเบียนเขารวมงานโดยกรอกขอมูลและตอบแบบสอบถามวาทําไมถึง
สนใจงานนี้และเมื่อทางผูลงทะเบียนสมัครเสร็จจะไดรับ QR Code และนํามาในงาน และในแตบูธจัดแสดงจะมีตัว
อาน QR Code อยูจะบันทึกตําแหนงของผูเขารวมงานและชุดขอมูลที่นํามา ไดแก ขอมูล User ID,ขอมูล Booth,
ขอมูล SEX ,ขอมูล Status,ขอมูล Reason จากนั้นจะทําการนําชุดขอมูลที่ไดมาทําการสรางตัวแบบสําหรับการ
ตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis และนําชุดขอมูลอีกหนึ่งชุดที่เปน
ขอมูลของผูที่ลงทะเบียนใหมมาเขาตัวแบบและทํานายผลออกมาวาบูธจัดแสดงไหนที่จะมีคนเขาไปสนใจจํานวนมาก
ผลจากการใชตัวแบบในสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดงจากจํานวนบูธจัดแสดงทั้งหมด
174 บูธจัดแสดง ไดทํานายผลวาผูคนที่ลงทะเบียนเขามาใหมจํานวน 1,988 คน จะสนใจบูธจัดแสดงใดเปนสวนใหญ
โดยมีบูธจัดแสดงจํานวนทั้งหมด 4 บูธจัดแสดง ที่โดดเดนและมีผูเขาชมจํานวนมาก ไดแก 1) บูธจัดแสดง H04 โดย
คิดเปนจํานวนคนที่สนใจจํานวน 1,088 คน คิดเปนอัตราสวน 0.547 2) บูธจัดแสดง D10 โดยคิดเปนจํานวนคนที่
สนใจจํานวน 875 คน คิดเปนอัตราสวน 0.440 3) บูธจัดแสดง I10 โดยคิดเปนจํานวนคนที่สนใจจํานวน 23 คน
คิดเปนอัตราสวน 0.011 4) บูธจัดแสดง G06 โดยคิดเปนจํานวนคนที่สนใจจํานวน 2 คน คิดเปนอัตราสวน 0.001
ซึ่งจากผลการทํานายพบวา บูธจัดแสดง H04 เปนบูธจัดแสดงที่มีคนเขามาชมมาก รองลงมาเปน D10 และ
I10,G06 ตามลําดับ พบวามีบูธจัดแสดง 3 ใน 4 มีความสัมพันธที่เหมือนกันอยู ไดแก ตําแหนงท่ี 1.บูธจัดแสดง Thai
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
IoT Association (H04) ตําแหนงที่ 2.บูธจัดแสดง Internet Alliance Silver sponsor (D10) ตําแหนงที่ 3.บูธจัด
แสดง Bangladesh (I10) เปนบูธจัดแสดงที่ตั้ งอยู ในโซน Communications Network Infrastructure and
Security เดียวกัน และตําแหนงที่ 4.บูธจัดแสดง Busan industry (G06) ที่ตั้งอยู ในโซน Data and Cloud;
Business Solutions ซึ่งแสดงใหเห็นวาในงาน CEBIT ASEAN 2018 ผูเขาชมงานสวนใหญใหความสนใจเทคโนโลยี
ด า น Communications Network Infrastructure and Security ถั ด ม า เ ป น Data and Cloud; Business
Solutions.
คําสําคัญ: เทคนิคเหมืองขอมูล Linear Discriminant Analysis สนับสนุนการตัดสินใจตําแหนงการวางบูธ
จัดแสดง
ABSTRACT
This research discusses Utilizing of Data Mining Techniques to Analyze the Data Sets and
Decision Support for the Position of Exhibition Booth. The purpose is to: 1) create models for
decision-making, displaying the booth exhibited by the Linear Discriminant Analysis technique; 2)
use a model to support decision-making for the exhibition booth position. Using the Linear
Discriminant Analysis technique, using analytical data model The team analyzed the data set with
RapidMiner Studio 9 software.
To gather information from the registration, simply fill in the form and answer the
questionnaire as to why you are interested in this job and when the sign up candidate will receive
a QR Code and bring it to the event and in the exhibition booth will come. QR Code readers will
record the location of the exhibitor and the data set that includes User ID, Booth data, SEX data,
Status data, Reason data and then the resulting data sets are created. The decision was made by
Linear Discriminant Analysis and a new set of data was collected from the new registrants and
predicted that the booth would be displayed. Much As a result of the use of models in decision
support for booth positions exhibiting from a total of 174 booths, exhibitors have predicted that
the 1988 entrants will be interested in exhibit booths. There are 4 booths exhibiting the most
prominent and visitors are: 1) Booth exhibit H04, the number of people interested is 1,088 people,
equivalent to 0.547. Dong D10 with the number of interested people is 875, the ratio is 0.440. 3)
Booth displaying I10, the number of interested people is 23, the ratio is 0.011. 4) Booth exhibits
G06, the number of people interested. 2 people, the ratio is 0.001. According to the results, the
booth exhibited H04 as a booth displaying the most visited people, followed by D10 and I10, G06,
respectively. The exhibition booth H04 is a booth exhibiting the most popular people, followed by
the D10 and I10, G06, respectively. There are 3 booths exhibiting the same relationship, namely
position 1. Booth Display the Thai IoT Association (H04). 2nd Place. Internet Alliance Silver Sponsor
(D10). 3rd Place. Bangladesh Display Booth (I10) is an exhibition booth located in the zone.
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
Communications Network Infrastructure and Security and location 4. Busan industry exhibit booth
(G06) located in Data and Cloud Zone; Business Solutions, which shows that at CEBIT ASEAN 2018,
most visitors paid attention to technology. side Communications Network Infrastructure and
Security Next came Data and Cloud; Business Solutions Keywords: Data mining techniques Linear Discriminant Analysis Decision support for exhibit booth
design
1. บทนํา
1.1*การวิเคราะหชุดขอมูลเพื่อสนับสนุนการตัดสินใจโดยใชเทคนิคเหมืองขอมูล จัดทําขึ้นเพื่อเปนทางเลือกหนึ่งที่
ใหบริการเปนตัวชวยในการตัดสินใจ โดยนําขอมูลที่มีมาผานกระบวนการวิเคราะหซึ่งขอมูลนั้นเปนสิ่งสําคัญเปนอยาง
มาก ธุรกิจจําเปนตองมีกลยุทธหรือยุทธวิธี (Business Strategies) ที่เช่ือมั่นไดวาจะลดความเสี่ยงขององคกรใหนอยลง
ไดกลยุทธทางธุรกิจจําเปนตองมีเทคโนโลยีสารสนเทศท่ีสามารถวิเคราะห กลั่นกรอง ขอมูลจํานวนมากไดเพื่อใหได
ขอมูลที่มีประโยชนชวยในการตัดสินใจ และที่ไดรับความนิยมคือการทําเหมืองขอมูล (Data Mining) เขามาใช
ผูจัดทําจึงเล็งเห็นความสําคัญในการนําขอมูลสารสนเทศที่มีในองคกรธุรกิจเขามาใชในงานเพื่อเปนชองทางหนึ่งที่
เปนชองทางทางเลือกที่ทํานายผลเพื่อชวยสนับสนุนการตัดสินใจ โดยทางคณะผูจัดทําไดใชเทคนิคเหมืองขอมูล
(Data Mining) เพื่อทําการวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง โดยใช
ตัวแบบโมเดลวิเคราะหจําแนก (Linear Discriminant Analysis) ใหกับหนวยงานซึ่งในการวิเคราะหชุดขอมูลจะชวย
เพิ่มทางเลือกในการตัดสินใจที่สะดวกรวดเร็ว สามารถจัดเก็บชุดขอมูลและแสดงผลลัพธออกมาในรูปแบบของตาง ๆ
ทั้งรูปแบบของแผนภูมิแทง แผนภูมิวงกลม และอีกหลายรูปแบบเปนจํานวนมาก ออกมาไดชัดเจนเพื่อมองเห็นภาพ
การทํานายผลลัพธท่ีออกมาจากกระบวนการวิเคราะหไดอยางมีประสิทธิภาพ
วัตถุประสงคของงานวิจัย
1. สรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis
2. ใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ดวย ใชเทคนิคโมเดล
การวิเคราะหจําแนก Linear Discriminant Analysis
2. เอกสารและงานวจิัยท่ีเกี่ยวของ
เอกสาร
จากการทบทวนเอกสาร ตํารา และทฤษฎีตางๆ ที่เกี่ยวของในการทําเหมืองขอมูล ดังนี้
1.ความหมายของขอมูล
ขอมูล (Data) หมายถึง ขอเท็จจริงหรือเรื่องราวท่ีเกี่ยวของกับสิ่งตาง ๆ เชน คน สัตว สิ่งของ สถานที่
ฯลฯ โดยอยูในรูปแบบท่ีเหมาะสมตอการสื่อสารการแปลความหมายและการประมวลผลซึ่งขอมูลอาจจะไดมาจาก
การสังเกต การรวบรวม การวัดขอมูลเปนไดทั้งขอมูลตัวเลขหรือสัญลักษณใด ๆ ที่สําคัญจะตองมีความเปนจริงและ
ตอเนื่องตัวอยางของขอมูล เชน ช่ือ เพศ อายุ เปนตน [1]
สารสนเทศ (Information) หมายถึง ขอมูลที่ไดผานกระบวนการประมวลผลแลวอาจใชวิธีงาย ๆ
เชน หาคาเฉลี่ยหรือใชเทคนิคขั้นสูงการวิจัยดําเนินงาน เปนตน เพื่อเปลี่ยนแปลงสภาพขอมูลทั่วไปใหอยูในรูปแบบ
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
ที่มีความสัมพันธหรือมีความเกี่ยวของกัน เพื่อนําไปใชประโยชนในการตัดสินใจใหคําตอบปญหาตาง ๆ ไดสารสนเทศ
ประกอบดวยขอมูลเอกสาร เสียง หรือรูปภาพ แตจัดเนื้อเรื่องใหอยูในรูปท่ีมีความหมายสารสนเทศไมใชจํากัดเฉพาะ
เพียงตัวเลขเพียงอยางเดียว [2]
การทําเหมืองขอมูล (Data Mining) คือ การสืบคนความรูที่เปนประโยชนและนาสนใจบนฐานขอมูล
ขนาดใหญ (Knowledge Discovery from very large databases : KDD) หรือเรียกวาการทําเหมืองขอมูลเปน
เทคนิคที่ใชจัดการกับขอมูลขนาดใหญโดยจะนําขอมูลที่มีมาวิเคราะหแลวดึงความรูหรือสิ่งสําคัญออกมาเพื่อใชใน
การวิเคราะหหรือทํานายสิ่งตาง ๆ ที่จะเกิดขึ้นซึ่งการคนหาความรูและความจริงที่แฝงอยูในขอมูล (Knowledge
Discovery) เปนกระบวนการขุดคนสิ่งที่นาสนใจในกองขอมูลที่มีอยูซึ่งตางจากระบบฐานขอมูล (Database
System) ตรงที่การทําเหมืองขอมูลไมตองกําหนดคําสั่งภาษาสอบถามเชิงโครงสราง ( Structured Query
Language) ซึ่งเปนภาษาสอบถามที่นิยมมากที่สุดของการจัดการฐานขอมูล [3]
2.ความสําคัญของขอมูล
ขอมูล หมายถึง ขอเท็จจริงหรือสิ่งที่ถือหรือยอมรับวาเปนขอเท็จจริง สําหรับใชเปนหลักอนุมาน
หาความจริงหรือการคํานวณ [4]
การทําความสะอาดขอมูล (Data Cleaning) Data cleansing หรือ Data cleaning หรือ Data
scrubbing หมายถึง การทําความสะอาดขอมูลเปนกระบวนการตรวจสอบและการแกไข (หรือลบ) รายการขอมูลที่
ไมถูกตองออกไปจากชุดขอมูลตารางหรือฐานขอมูล ซึ่งเปนหลักสําคัญของฐานขอมูล เพราะหมายถึงความ
ไมสมบูรณความไมถูกตองความไมสัมพันธกับขอมูลอื่น ๆ เปนตน จึงตองมีการแทนท่ีการปรับปรุงหรือการลบขอมูล
ที่ไมถูกตองเหลานี้ออกไป เพ่ือใหขอมูลมีคุณภาพ [5]
3.ความสําคัญของสารสนเทศ
สารสนเทศ (Information) ขอมูลตาง ๆ ที่ไดผานการเปลี่ยนแปลงหรือมีการประมวลหรือวิเคราะหผลสรุป
ดวยวิธีการตาง ๆ ใหอยูในรูปแบบท่ีมีความสัมพันธกัน มีความหมายมีคุณคาเพิ่มขึ้นและมีวัตถุประสงคในการใชงาน
[6]
4. ความสําคัญของการทําเหมืองขอมูล
เนื่องดวยปจจุบันเปนยุคที่ขอมูลและสารสนเทศมีความสําคัญ การเผยแพรและสื่อสารขอมูล ขาวสาร
ที่ตรงกับความตองการของผูใชจึงเปนสิ่งจําเปนการประยุกตเทคโนโลยีสารสนเทศเพื่อชวยในการสื่อสารขอมูล
จํานวนมากใหแกผูใช เชน การใหบริการเว็บไซตเพื่อเผยแพรขอมูลขาวสารและแลกเปลี่ยนความรูจึงเปน เครื่องมือ
ที่สําคัญในการสื่อสารขอมูลถึงผูใชจํานวนมาก ดังนั้นการศึกษาเกี่ยวกับพฤติกรรมของผูใชบริการเว็บไซตจะชวยให
องคกรสามารถนําขอมูลมาใชในการวางแผนพัฒนาเว็บไซต ใหตรงกับความตองการใชงานหรือใชในการวางแผน
กลยุทธเพื่อสรางความไดเปรียบทางการแขงขัน [7]
5.ประเภทของเหมืองขอมูล
การทําเหมืองขอมูลนํามาใชแกปญหานับรอยทางธุรกิจไมวาจะเปนการวิเคราะหกลุมลูกคาการเสนอ
หรือการใหคําแนะนําเพิ่มเติมแกลูกคาการคนหาความผิดปกติของชุดขอมูลโดยเฉพาะที่เกี่ยวกับการเงินการจัดทํา
ระดับความเสี่ยงในการจัดการความเสี่ยง การพยากรณหรือคาดคะเนแนวโนมที่จะเกิดขึ้นเราสามารถแบงประเภท
งานในการทําเหมืองขอมูลไดหลายแบบโดยขึ้นกับธรรมชาติของปญหาเหลานี้ [8]
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
6.เทคนิคท่ีเลือกมาใช
การจําแนกกลุมดวยเทคนิค (Linear Discriminant Analysis) นี้ทําการวิเคราะหเชิงเสน (LDA) วิธีนี้
จะพยายามคนหาชุดคาผสมเชิงเสนของคุณลักษณะที่ดีที่สุดในการแยกตัวอยางช้ันเรียนตั้งแตสองตัวขึ้นไป ชุดคา
ผสมที่เปนผลลัพธจะถูกใชเปนตัวแบงประเภทเชิงเสน LDA เกี่ยวของกับ ANOVA (การวิเคราะหความแปรปรวน)
และการวิเคราะหถดถอยพหุคูณซึ่งยังพยายามที่จะแสดงตัวแปรที่ขึ้นอยูกับตัวแปรอื่น ๆ ในอีกสองวิธีอยางไรก็ตาม
ตัวแปรขึ้นอยูกับปริมาณที่เปนตัวเลขในขณะที่ LDA เปนตัวแปรที่แบงประเภท (เชนปายช่ือช้ัน) LDA มีสวน
เกี่ยวของกับการวิเคราะหองคประกอบหลัก (PCA) และการวิเคราะหปจจัยดวยเชนกันซึ่งทั้งสองมองหาการ
ผสมผสานของตัวแปรเชิงเสนซึ่งจะอธิบายขอมูลไดดีที่สุด LDA อยางชัดเจนพยายามสรางแบบจําลองความแตกตาง
ระหวางช้ันของขอมูล PCA ในเครื่องมืออ่ืน ๆ ไมไดคํานึงถึงความแตกตางในช้ันใด ๆ [9]
ภาพที่ 1 แสดงตัวอยางการใชการวิเคราะหแนกประเภทเชิงเสน
ขอดีและขอดอยของเทคนิค Linear Discriminant Analysis [9] [10]
ขอดี
1. การวิเคราะหดวยวิธีนี้นอกจากจะสามารถจําแนกความแตกตางระหวางกลุมสองไดแลวยังสามารถอธิบาย
หรือคาดการณไดดวย
2. Multivariate Normal ตัวแปรอิสระตองเปนอิสระและสุมมาจากประชากรที่มีการแจกแจงแบบปกติ
หลายตัวแปร
3. มีอํานาจการทดสอบที่มากถาขอมูลเปนไปตามขอกําหนด
ขอดอย
1. จะแปลงขอมูลทั้งหมดยกเวนขอมูลที่จะทํานายใหอยูในรูปแบบตัวเลขกอน
2. ตองการกลุมตัวอยางสําหรับการประมาณคาและกลุมตัวอยางที่ใชในการตรวจสอบความถูกตองของ
การพยากรณ
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
งานวิจัยท่ีเกี่ยวของ
กฤษดา เชียรวัฒนสุข และสุรพร ออนพทุธา (2560) งานวิจัยเรื่อง การจําแนกกลุมลูกคาที่คํานึงถึงคุณภาพกอน
ตัดสินใจซื้อโดยใชปจจัยสวนประสมการตลาดบริการ (7Ps) จากการศึกษาพบวา ปจจัยสวนประสมการตลาดบริการ
ทั้ง 7 ดาน ประกอบดวย ดานผลิตภัณฑ ดานราคา ดานสถานท่ี ดานสงเสริมการขาย ดานกระบวนการ ดานบุคคล
และดานลักษณะทางกายภาพมีเพียง 4 ดานเทานั้นที่สามารถนํามาวิเคราะหเพื่อจําแนกกลุม คือ ดานบุคคล
ดานผลิตภัณฑ ดานราคาและ ดานกระบวนการ โดยการศึกษายังพบวา สวนประสมการตลาดบริการดานบุคคล
เปนตัวแปรที่สําคัญมาก ที่สุดในการแบงกลุมลูกคาระหวางกลุมลูกคาที่คํานึงถึงราคากอนตัดสินใจซื้อและกลุมลูกคา
ที่คํานึงถึงคุณภาพกอนตัดสินใจซื้อ ดังบทคัดยอดังนี้ งานวิจัยนี้มีวัตถุประสงค เพื่อศึกษาปจจัยสวนประสมทาง
การตลาดบริการ (7Ps) ที่มีอิทธิพลตอการจําแนกกลุมลูกคาที่คํานึงถึงราคาและคุณภาพกอนตัดสินใจซื้อ โดยใช
แบบสอบถามกลุมประชากร 9 ตัวอยางจํานวน 402 คน คือ ผูใชบริการเครือขายโทรศัพทเคลื่อนที่ดีแทค (DTAC)
ทั้งในระบบรายเดือน และระบบเติมเงินโดยทําการเก็บตัวอยางจากกลุมประชากรที่อาศัยอยูในยานการคาในเขต
อําเภอเมือง อําเภอธัญบุรี อําเภอลําลูกกา สถิติที่ใชในการวิเคราะหประกอบดวยการหาคาความถี่คารอยละคาเฉลี่ย
และสวนเบี่ยงเบนมาตรฐานสถิติทดสอบ Wilks' Lambda และการวิ เคราะหจําแนกกลุมโดยใช เทคนิค
Discriminant Analysis เพื่อหาฟงกชัน เพื่อจําแนกกลุมของ Fisher (Fisher's linear discriminant functions)
ผลการวิจัย พบวาสวนประสมทางการตลาดบริการดานบุคคล (Coefficients = .781) เปนปจจัยที่มีอิทธิพลมาก
ที่สุดในการที่จําแนกวาจะเปนลูกคาที่คํานึงถึงราคาและคํานึงถึงคุณภาพกอนตัดสินใจซื้อรองลงมาคือดานผลิตภัณฑ
(Coefficients = .650) ดานราคา (Coefficients = -.525) และดานกระบวนการ (Coefficients = -.212)
ตามลําดับ
Claes Andersson (2013) ง า น วิ จั ย เ รื่ อ ง Multivariate signal approaches for object detection using
microwave sensing จากการศึกษาพบวา การวิเคราะหขอมูลแสดงใหเห็นวาในกรณีที่ไมมีเสียงรบกวนชวงต่ําสุด
ของชวงความถี่จะทําใหเกิดการแบงแยกระหวางสัญญาณจากวัตถุและการวัดพื้นหลังที่ใหญที่สุดเมื่อเทียบกับ
คาเบี่ยงเบนมาตรฐานที่เกี่ยวของ ดังบทคัดยอดังนี้การตรวจจับไมโครเวฟสามารถใชเพื่อตรวจจับวัตถุในวัสดุที่ไหล
ผานทอโดยการตรวจจับการเปลี่ยนแปลงของสัญญาณ ในงานนี้การจําลองแบบจําลองขอมูลจํา ลองนี้ใชเพื่อ
ตรวจสอบความเปนไปไดที่จะแยกการเปลี่ยนแปลงที่เกิดจากฟองอากาศออกจากการเปลี่ยนแปลงที่เกิดจากวัตถุ
พลาสติกหรือโลหะ ขอมูลที่ใชจะไดรับจากการสมการเชิงตัวเลขของสมการ Maxwell โดย FEM สําหรับจุดตัดกัน
ของโพรงทรงกระบอกที่มีทอนําคลื่นสี่ตัว โซลูช่ันประกอบดวยคาของพารามิเตอรกระจายที่ 400 ความถี่ในชวง
ไมโครเวฟ ขอมูลการสรางแบบจําลองวัสดุพื้นหลังที่เปนเนื้อเดียวกันที่มีและไมมีวัตถุชนิดดังกลาวมีการวิเคราะหและ
ใชในการประเมินประเภทของผูจัดจําแนกประเภท: K เพื่อนบานที่ใกลที่สุด (KNN), การวิเคราะหจําแนกเชิงเสน
(LDA), การวิเคราะหแบบจําแนกกําลังสอง (QAD), เครื่องเวกเตอรสนับสนุน (SVM) และ libSVM - อัลกอริทึมของ
เวคเตอรเวกเตอรสนับสนุนสําหรับการจัดกลุมขอมูลหลายชั้น นอกจากนี้ยังมีการตรวจสอบวาสวนใดของชวงความถี่
และสิ่งที่องคประกอบเมทริกซีนกระจายเปนประโยชนมากที่สุดสําหรับการจําแนกประเภท การตรวจสอบจะมีการ
ตรวจสอบความดังของเสียงในการวัดดวยสัญญาณรบกวนสีขาว พบวาในกรณีที่ไมมีเสียงรบกวนชวงต่ําสุดของชวง
ความถี่จะมีประโยชนมากท่ีสุดสําหรับการตรวจจับวัตถุ แตยังรวมถึงการเพิ่มเสียงรบกวนมากที่สุดในความถี่เหลานี้
สําหรับผูจัดจําแนกประเภทเครื่องวัดคุณภาพ LDA, QDA และ libSVM ทั้งหมดจะทํางานไดดีเมื่อไมมีเสียงดัง
ในขณะที่การเพิ่มเสียงรบกวนจะชวยลดความถูกตองของตัวจําแนกประเภทการจําแนกแยกแยะผูจัดจําแนกประเภท
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
libSVM แสดงใหเห็นถึงผลลัพธ ที่คาดหวังที่ระดับ SNR เกินกวา 30 dB ที่ระดับ SNR จาก 20 เดซิเบลและ
ดานลางที่ไมใชของผูจัดจําแนกประเภทจะใหความแมนยําที่จะตอบสนองความตองการของเครื่องตรวจจับที่เปน
ประโยชนในทางปฏิบัติ สุดทายจะมีการตรวจสอบการสรางแบบจําลองขอมูลแบบไมตอเนื่อง ในการวิเคราะห
เบื้องตนพบวาไมพบความสัมพันธเชิงเสนซึ่งนําไปสูการประเมินผลของการแปลงขอมูลเพื่อขจัดความเกี่ยวของ
เชิงเสนตรงหรือสมการเชิงเสน วิธีการประเมินคืออัลกอริธึมการตรวจจับสัญญาณที่งายและผลการทดสอบช้ีใหเห็น
ถึงการปรับปรุงบางสวนแมวาจะมีขนาดเล็กมากก็ตาม
3. วิธีการวิจัย
การจัดทําการใชเทคนิคเหมืองขอมูลเพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนง
การวางบูธจัดแสดงผูจัดทําไดดําเนินการโดยแบงได 2 ระยะดังนี้
ระยะที่ 1 สรางตัวแบบสําหรับการตัดสนิใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant Analysis
1.1 ศึกษาการใชเทคนิคดาตาไมนนิงในการสรางชุดขอมูลสนับสนุนการตัดสินใจสําหรับตําแหนงการวาง
บูธจัดแสดง ผูจัดทําไดมีการศึกษาคนควาหาขอมูลและศึกษาเทคนิคโมเดลการวิเคราะหจําแนก ( Linear
Discriminant Analysis)
1.2 ทําการเก็บขอมูลจากผูเขารวมงานจํานวน 1,988 คนจากชองทางการลงทะเบียนและความสนใจของผู
เขารามงานในการเดินเขาตามบูธจัดแสดงจํานวน 174 บูท
1.3 ทําความสะอาดขอมูลที่เก็บรวบรวมมาเพื่อใหขอมูลที่นํามาสรางตัวแบบมีความสมบูรณมากท่ีสุดโดยจะ
แบงไดเปน 3 ขั้นตอน
1.3.1 แจกแจงขอมูลโดยจะทําการตั้งช่ือหัวคอลัมนของชุดขอมูลใหมเพื่อใหสามารถแยกแยะไดชัดเจน
1.3.2 แกไขขอมูลที่ผิดพลาด โดยเราจะทําการตรวจสอบวาชุดขอมูลนั้นไดมีการกรอกขอมูลครบทุกชอง
หรือไมถาหากมีชองที่วางจะทําการตัดแถวนั้นออกไมนํามาใชในการประมวลผล
1.3.3 ทําการปรับขอมูลใหเปนรูปแบบตัวเลขจํานวนเต็มโดยจะมีเพียงขอมูลบูธจดัแสดง(Booth) เทานั้น
ที่จะตองยังเปนขอความเชนเดิม
1.4 นําชุดขอมูลที่ใชในการสรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear
Discriminant Analysis ไดแก ขอมูล User ID,ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason
1.5 ไดตัวแบบโมเดล Linear Discriminant Analysis สําหรับการตัดสินใจสําหรับตําแหนงการวางบูธ
จัดแสดง
ระยะที่ 2 การใชตัวแบบการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง
2.1 ทําการเก็บขอมูลจากผูที่ลงทะเบียนเขารวมงานใหมโดยขอมูลชุดนี้จะไมมีขอมูลบูธจัดแสดง(Booth)
2.2 ทําความสะอาดขอมูลที่เก็บรวบรวมเพื่อใหผลการทํานายออกมีความสมบูรณมากที่สุดโดยจะแบงไดเปน
3 ขั้นตอน
2.2.1 แจกแจงขอมูลโดยจะทําการตั้งช่ือหัวคอลัมนของชุดขอมูลใหมเพื่อใหสามารถแยกแยะไดชัดเจน
2.2.2 แกไขขอมูลที่ผิดพลาด โดยเราจะทําการตรวจสอบวาชุดขอมูลนั้นไดมีการกรอกขอมูลครบทุกชอง
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
หรือไมถาหากมีชองที่วางเราจะตัดแถวน้ันออกไมนํามาใชในการประมวลผล
2.2.3 ทําการปรับขอมูลใหเปนรูปแบบตัวเลขจํานวนเต็ม
2.3 นําชุดขอมูลอีกหนึ่งชุดที่เปนขอมูลของผูที่ลงทะเบียนใหมมาเขาตัวแบบโมเดล Linear Discriminant
Analysis สําหรับการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง
2.4 ทํานายผลวาบูธจัดแสดงไหนที่จะมีคนเขาไปสนใจจํานวนมาก
4. ผลการวิจัย
4.1 ผลการสรางตัวแบบ
จากการเก็บรวบรวมขอมูลและนําขอมูลมาทําการสรางตัวแบบโมเดล Linear Discriminant Analysis ที่สราง
ขึ้นพบวาสามารถใชในการทํานายขอมูลออกมาไดโดยการหาความนาจะเปนเบื้องตนเพื่อที่จะใชการทําตัวแบบและ
ขอมูลที่ใช ไดแก ขอมูล User ID,ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason เปนหลักในการสราง
ตัวแบบ
ตารางที่ 2 แสดงผลการวิเคราะหหาประสิทธิภาพของชุดขอมูล
หัวขอประเมนิ X ..DS ระดับประสิทธิภาพ
1. จํานวนของขอมูลมีมากเพียงพอในการนํามาวิเคราะห 5.00 0.00 มากที่สุด
2. ขอมูลมีความถูกตองครบถวน 5.00 0.00 มากที่สุด
3. ขอมูลมีความทันสมัย 5.00 0.00 มากที่สุด
4. ขอมูลมีความเหมาะสมในการนาํมาวิเคราะห 5.00 0.00 มากที่สุด
รวม 5.00 0.00 มากที่สุด
จากตารางที่ 2*ผลการวิเคราะหหาประสิทธิภาพของชุดขอมูล พบวา ในภาพรวมมีประสิทธิภาพของชุดขอมูลอยูใน
ระดับมากที่สุด (�̅�=5.00) จํานวนของขอมูลมีมากเพียงพอในการนํามาวิเคราะหอยูในระดับมากที่สุด (�̅�=5.00)
โดยขอมูลมีความถูกตองครบถวน อยูในระดับมากที่สุด (�̅�= 5.00) ขอมูลมีความทันสมัย อยูในระดับมากที่สุด
(�̅�=5.00) ขอมูลมีความเหมาะสมในการนํามาวิเคราะห อยูในระดับมากท่ีสุด (�̅�=5.00)
ตารางที่ 3 แสดงผลการวิเคราะหหาความพึงพอใจของโมเดลการวิเคราะหจําแนก (Linear Discriminant Analysis)
รายการ X ..DS ระดับประสิทธิภาพ
1. โมเดลมีความเหมาะสมในการนํามาวิเคราะห 4.70 0.60 มาก
2. โมเดลสามารถจําแนกกลุมขอมลูไดตามที่กําหนด 4.70 0.60 มาก
3. โมเดลสามารถพยากรณขอมลูออกมาในรูปแบบที่ตองการได 4.70 0.60 มาก
4. โมเดลสามารถรบัคาตัวแปรอิสระ 4.00 0.00 มาก
5. โมเดลสามารถจําแนกกลุมการวิเคราะหไดอยางชัดเจน 5.00 0.00 มากที่สุด
6. โมเดลสามารถสื่อกับขอมูลไดสอดคลองตรงกับความตองการ 5.00 0.00 มากที่สุด
รวม 4.70 0.40 มาก
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
จากตารางที ่3 แสดงผลการวิเคราะหหาความพึงพอใจของโมเดลการวิเคราะหจําแนก (Linear Discriminant
Analysis) ในภาพรวมมีความพึงพอใจอยูในระดับมาก (�̅�=4.70) โดยโมเดลมีความเหมาะสมในการนํามาวิเคราะห
อยูในระดับมาก (�̅�=4.70) โมเดลสามารถจําแนกกลุมขอมูลไดตามที่กําหนดอยูในระดับมาก (�̅�=4.70) โมเดล
สามารถพยากรณขอมูลออกมาในรูปแบบท่ีตองการได อยูในระดับมากท่ีสุด (�̅�=4.70) โมเดลสามารถรับคาตัวแปร
อิสระอยูในระดับมาก (�̅�=4.00) โมเดลสามารถจําแนกกลุมการวิเคราะหไดอยางชัดเจน อยูในระดับมากที่สุด
(�̅�=5.00) โมเดลสามารถสื่อกับขอมูลไดสอดคลองตรงกับความตองการ (�̅�=5.00)
4.2 ผลการวิเคราะหชุดขอมูล
ผลจากกระบวนการวิเคราะหชุดขอมูลเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบู ธจัดแสดง ดวย
เทคนิคโมเดลการวิเคราะหจําแนก Linear Discriminant Analysis โดยจากจํานวน บูธจัดแสดงทั้งหมด 174 บูธ
จัดแสดง ซึ่งไดทํานายผลโดยการนําขอมูลของผูรวมงานจากงาน ที่เคยจัดมาแลวมา Training เพื่อทํานายวาผูคน
ที่ลงทะเบียนเขามาใหมจะสนใจบูธจัดแสดงไหนเปนสวนใหญ โดยมีบูธจัดแสดงทั้งหมด 4 บูธจัดแสดง ที่โดดเดนและ
มีคนเขาชมจํานวนมาก ไดแก 1) บูธจัดแสดง H04 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 1,088 คน คิดเปนอัตราสวน
0.547 2) บูธจัดแสดง D10 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 875 คน คิดเปนอัตราสวน 0.440 3) บูธจัดแสดง
I10 โดยคิดเปนจํานวนคนท่ีสนใจจํานวน 23 คน คิดเปนอัตราสวน 0.011 4) บูธจัดแสดง G06 โดยคิดเปนจํานวน
คนท่ีสนใจจํานวน 2 คน คิดเปนอัตราสวน 0.001 ซึ่งจาก ผลการทํานายพบวาบูธจัดแสดง H04 เปนบูธจัดแสดงที่มี
คนเขามาชมมาก รองลงมาเปน D10 และ I10,G06 ตามลําดับ (ดังตาราง ตารางที่ 4 )
ตารางที่ 4 แสดงผลการวิเคราะหชุดขอมูล
ลําดับ
(Index)
บูธจัดแสดงที่ทํานาย
(Nominal value)
จํานวนคน
(Absolute count)
สัดสวน
(Fraction)
1 H04 1088 0.547283702
2 D10 875 0.440140845
3 I10 23 0.011569416
4 G06 2 0.001006036
โดยสามารถจะแสดงออกมาในรูปแบบ Chart ใหเกิดความเขาใจไดงายโดยจะแบงออกเปน 2 แบบ
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
ภาพที่ 2 รูปแบบ Chart แบบ Pie และ แบบ Bars
ภาพที ่3 ตําแหนงของบูธจัดแสดงท่ีผานกระบวนการทํานาย
5. อภิปรายผลและขอเสนอแนะการวิจัย
จากการสรางตัวแบบสําหรับการตัดสินใจตําแหนงการวางบูธจัดแสดงดวยเทคนิค Linear Discriminant
Analysis ประกอบไปดวยขอมูลที่เก็บรวบรวมจากผูเขารวมงานและใชในการสรางตัวแบบ ไดแก ขอมูล User ID,
ขอมูล Booth, ขอมูล SEX ,ขอมูล Status ,ขอมูล Reason เปนหลักในการสราง
การใชตัวแบบเพื่อสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ดวยใชเทคนิคโมเดลการ
วิเคราะหจําแนก Linear Discriminant Analysis จากผลการวิจัยพบวา ทั้ง 4 บูธจัดแสดงที่ทํานายออกมา พบวา
มีบูธจัดแสดง 3 ใน 4 มีความสัมพันธท่ีเหมือนกันอยู ไดแก ตําแหนงที่ 1.บูธจัดแสดง Thai IoT Association (H04)
ตําแหนงที่ 2.บูธจัดแสดง Internet Alliance Silver sponsor (D10) ตําแหนงที่ 3.บูธจัดแสดง Bangladesh (I10)
เปนบูธจัดแสดงท่ีตั้งอยูในโซน Communications Network Infrastructure and Security เดียวกัน และตําแหนง
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
ที่ 4.บูธจัดแสดง Busan industry (G06) ที่ตั้งอยูในโซน Data and Cloud; Business Solutions ซึ่งแสดงใหเห็น
วาในงาน CEBIT ASEAN 2018 ผูเขาชมงานสวนใหญใหความสนใจเทคโนโลยีดาน Communications Network
Infrastructure and Security ถัดมาเปน Data and Cloud; Business Solutions.
ขอเสนอแนะการวิจัย ผูวิจัยไดดําเนินการภายใตขอจํากัดทางดานเวลาขอมูลซึ่ง สงผลตองานวิจัยทําใหงานวิจัยมีขอบกพรองอยูบาง
ดังนั้นผูวิจัยจึงไดเสนอแนะแนวทางการปรับปรุงงานวิจัยในอนาคตตอไป
1.การทําเหมืองขอมูลนั้นมีหลายขั้นตอนวิธี ซึ่งแตละขั้นตอนวิธีมีความเหมาะสมกับความตองการดังนั้นจึงตอง
ทําความเขาใจและเลือกขั้นตอนวิธีท่ีตรงกับความตองการใหมากที่สุด
2.การศึกษาวิจัยในครั้งนี้เปนการนําขอมูลของผูเขารวมงานจากในงาน CEBIT ASEAN 2018 มาเพียงบางสวน
เทานั้นดังนั้นหากตองการทําใหงานวิจัยนี้มีความแมนยํามากที่สุดควรที่จะนําขอมูลทั้งหมดมาวิเคราะห
3.เครื่องคอมพิวเตอรที่ใชในการทําเหมืองขอมูลนั้นควรเปนเครื่องที่มีประสิทธิภาพเหมาะสมเนื่องจากข้ันตอน
การทํางานตองใชขอมูลจํานวนมากจึงใชเวลาในการประมวลผลคอนขางนาน ถาเครื่องคอมพิวเตอรที่นํามาใชงาน
ไมมีประสิทธิภาพที่เหมาะสมอาจจะทําใหเครื่องคางและเสียเวลาในการดําเนินการที่นานขึ้น
คําขอบคุณ
ขอขอบคุณ บริษัท โซเซียลคลาวด จํากัด ที่ใหความอนุเคราะหขอมูลในการจัดทําพัฒนาการใชเทคนิคเหมือง
ขอมูล เพื่อวิเคราะหชุดขอมูลและสนับสนุนการตัดสินใจสําหรับตําแหนงการวางบูธจัดแสดง ในครั้งนี ้
6. เอกสารอางอิง
[1] อินทัศน ศรีนิบูลย. (2558). ขอมูล (Data) สืบคนจาก http://oknation.nationtv.tv/blog/Inthat
/2015/01/13/entry-1/comment
[2] อินทัศน ศรีนิบูลย. (2558). สารสนเทศ(Information) สืบคนจาก http://oknation.nationtv.tv/blog
/Inthat/2015/01/13/entry-1/comment
[3] สายชล สินสมบูรณทอง. (2560). หนงัสือการทําเหมืองขอมูล(Data Mining)เลม1. จามจุรีโปรดักส กรุงเทพฯ :
ผูแตง.
[4] พจนานุกรมฉบับราชบัณฑิตยสถาน. (2554). ขอมูล สืบคนจาก http://www.royin.go.th/dictionary/
[5] Rahm, Erhard and Do, (2012). Hong-Hai. Data Cleaning : Problems and Current Approaches.
สืบคนจาก https://www.betterevaluation.org/sites/default/files/data_cleaning.pdf
[6] ไพโรจน คชชา. (2542). ความรูคอมพิวเตอรและเทคโนโลยีสารสนเทศ.เซ็นเตอรดสิคัฟเวอร ีกรุงเทพฯ : ผูแตง.
[7] Bartolini, G. (2001). Web usage mining and discovery of association rules from http servers’logs.
Melbourne: Monash University.
[8] Tang, Z. and J. MacLennan. (2005). Data Mining with SQL Server, Wiley Publishing,
Inc.10475 Crosspoint Boulevard Indianapolis, IN 46256
��
วารสารวิทยาศาสตรและเทคโนโลยี มทร.สุวรรณภูมิ ISSN: 2586-8101
ปท่ี 2 ฉบับท่ี 2 (เมษายน – กันยายน 2561)
[9] ขอดีและขอดอยของเทคนิคLinear Discriminant Analysis. (ออนไลน). สืบคนจาก
https://docs.rapidminer.com/latest/studio/operators/modeling/predictive/discrimina
nt_analysis/linear_discriminant_analysis.html
[10] แสงหลา ชัยมงคล. (2554). การเลือกใชระหวาง Logistic Regression กับ Discriminant Analysis.
, สืบคนจาก http://rlc.nrct.go.th/ewt_dl.php?nid=889
��