การใชโปรแกรม SPSS version 11.5 เบื้องตน เพื่อการวิเคราะหขอมูล
สารบัญ
ชัยเทพ พูลเขตต ภาควิชาสัตวแพทยสาธารณสุขศาสตรและการบริการวินิจฉัย
คณะสัตวแพทยศาสตร มหาวิทยาลัยเกษตรศาสตร
สารบัญ..................................................................................................................................................1 1. ขอมูลและตัวแปร.........................................................................................................................2 2. การติดต้ังโปรแกรม .....................................................................................................................4 3. เมนูและคําสั่งที่สําคัญ ..................................................................................................................9 4. การจัดการขอมูลเบื้องตน...........................................................................................................13 5. การตรวจสอบการแจกแจงของขอมูลเชิงปรมิาณ.........................................................................16 6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา......................................................................................24 7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA ........30 8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation .....................38 9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ .......................................................41
1. ขอมูลและตัวแปร
ขอมูล (Data) a. ขอเท็จจริงที่เกิดขึ้น b. ขอความหรือตัวเลข c. อาจเกี่ยวของกับคน พืช สัตว ส่ิงของ d. จํานวนสุกรทั้งหมดของประเทศไทยในเดือนมกราคม พ.ศ. 2550 เปนขอมูลเชิงตัวเลข e. ระดับความชอบของนิสิตป 5 ตอวิชาชีวสถิติ
ตัวแปร (Variable) ขอมูลท่ีไดจากการสังเกต วัด นับ สอบถาม หนวยที่ศึกษาอาจเปนคน สัตว พืช และส่ิงของ หนวยศึกษาที่แตกตางกันทําใหไดขอมูลท่ีแตกตางกัน จึงเรียกขอมูลนั้นวา “ตัวแปร” จํานวนโคนมในเขตอําเภอกําแพงแสน หนวยศึกษา = โคนมในเขตอําเภอกําแพงแสน ตัวแปร = จํานวนโคนม
คาของตัวแปรคือขอมูล
สาเหตุท่ีทําใหคาของตัวแปรหรือขอมูลมีคาแตกตางกัน คุณลักษณะที่แตกตางกัน เชน อายุโคที่แตกตางกัน น้ําหนักโค ปริมาณน้ํานมที่ได ฯลฯ หรืออาจกลาวไดวาหนวยที่ศึกษา
มีลักษณะที่แตกตางกัน เวลาที่แตกตางกัน เชน ปริมาณน้ํานมของแตละชวงเวลา (day in milk)
สถานที่แตกตางกัน ฟารมที่เล้ียง
ประเภทของขอมูล แบงตามแหลงที่มาของขอมูล Primary data
เปนขอมูลท่ีผูใชเก็บเอง มีความละเอียดสูง สัมภาษณ ทดลอง สังเกตการณ Raw data (ยังไมมีการวิเคราะห) เสียเวลาในการเก็บ คาใชจายสูง
Secondary data ผูใชไมไดเก็บรวบรวมเอง แตมีหนวยงานหรือผูอื่นเก็บรวบรวมไวแลว ประหยัดเวลาและคาใชจายกวาการเก็บ Primary data
2
ขอมูลบางสวนอาจไมตรงกับความตองการของผูใชหรือรายละเอียดไมเพียงพอ มีการวิเคราะหเบ้ืองตนมาบางแลว (Information) ผูใชสามารถนําไปใชไดเลย แตอาจมีความผิดพลาดได
แบงตาม Scale ของการวัด Nominal Scale Color
Ordinal Scale Ranking topics
Interval Scale Temperature
Ratio Scale Salary
แบงตามลักษณะของขอมูล Quantitative Data Ratio and Interval Scale Discrete Data and Continuous Data
Qualitative Data (Categorical Data) Nominal and Ordinal Scale
Quantitative Data <--> Qualitative Data
การวิเคราะหขอมูลประเภทตางๆ Quantitative Data >> สามารถใชเทคนิคการวิเคราะหไดทุกเทคนิค Qualitative Data >> ใชเทคนิคการวิเคราะหไดบางเทคนิค ไมสามารถหาคาเฉล่ีย คาเบ่ียงเบนมาตรฐานได
Data Calculation Methods Nominal Scale Frequency, percentage, mode, crosstab, chi-square test, binomial test Ordinal Scale Median, mode, percentile, rank-order correlation, sign test, crosstab, chi-square test,
nonmetric multidimensional scaling Interval Scale Mean, standard deviation, average, correlation analysis, discriminant analysis,
regression analysis, ANOVA, metric multidimensional scaling Ratio Scale All of mean, standard deviation, coefficient of variance, correlation analysis, regression
analysis, ANOVA, average, discriminant analysis, factor analysis, cluster analysis, metric multidimensional scaling
3
2. การติดตั้งโปรแกรม
2.1. การติดตั้งโปรแกรม SPSS version 11.5 สามารถทําไดดังนี้ a. นําแผนซีดีของโปรแกรม SPSS for windows version 11.5 ใสในซีดีรอม b. คอมพิวเตอรจะตรวจสอบไดรฟอัตโนมัติ (Autorun) จากนั้นใหทําการติดตั้งตามขั้นตอน d เปนตน
ไป แตถาคอมพิวเตอรไมสามารถตรวจสอบไดรฟอัตโนมัติใหติดตั้งโปรแกรมตั้งแตขั้นตอนที่ c c. ดับเบิลคลิกที่ My Computer d. ดับเบิลคลิกที่โฟลเดอร SPSS version 11.5 e. ดับเบิลคลิกที่ไอคอน setup (ดูภาพขางลางประกอบ)
f. คลิกปุม Next และ Yes (ดูภาพขางลางประกอบ)
4
g. คลิกปุม Next เพ่ือติดตั้งโปรแกรม (ดูภาพขางลางประกอบ)
h. ใส Serial number เปนหมายเลข xxxxx และคลิก Next (ดูภาพขางลางประกอบ)
i. คลิกเลือกการติดงตั้งแบบ Personal installation (ดูภาพขางลางประกอบ)
5
j. ใส License code หมายเลข xxxxxxxxxxx แลวคลิก Update จากนั่นใหใส Update code หมายเลข xxxxxxxxxxx ในชองเดิมและคลิก Update อีกครั้ง เมื่อเสร็จแลวใหคลิก Next 2 ครั้ง และรอจนกระทั่งการติดตั้งในขั้นตอนแรกแลวเสร็จ (ดูภาพขางลางประกอบ)
6
k. คลิก Next 2 ครั้ง และรอโปรแกรมติดตั้งใหแลวเสร็จ (ดูภาพขางลางประกอบ)
l. เมื่อโปรแกรมติดตั้งใหเสร็จแลว จะปรากฏหนาจอเพ่ือถามการลงทะเบียนผูใช ใหเลือก Register later แลวคลิก Next (ดูภาพขางลางประกอบ)
7
m. เมื่อโปรแกรม SPSS version 11.5 แลวเสร็จสมบูรณแลวจะปรากฏหนาจอเหมือนภาพดานลาง ใหทําการคลิกเลือก Finish เปนอันส้ินสุดขบวนการติดตั้งโปรแกรม ทั้งนี้หากผูใชคลิกเลือก Launch tutorial now? และ/หรือ Display the ReadMe file now โปรแกรม SPSS จะแนะนําการใชโปรแกรมและขอควรทราบเกี่ยวกับการใชโปรแกรม SPSS version 11.5 (ดูภาพขางลางประกอบ)
2.2 การเรียกใชโปรแกรม SPSS version 11.5
a. คลิก Start > All programs > SPSS for Windows > SPSS 11.5 for Windows
8
3. เมนูและคําสั่งที่สําคัญ
ผูใชโปรแกรม SPSS จําเปนตองทราบถึงเมนูและคําสั่งพ้ืนฐานเพื่อการใชโปรแกรมที่ถูกตอง ซึ่งจําเปนอาศัยความคุนเคยกับตัวโปรแกรม เพ่ือใหไดประสิทธิภาพในการใชประโยชนจากโปรแกรม SPSS สูงสุด ผูใชจําเปนตองมีการฝกปฏิบัติเปนประจําและสม่ําเสมอในการใชโปรแกรม
a. สวนประกอบของหนาจอ เมื่อเปดโปรแกรม SPSS version 11.5 จะปรากฏหนาจอคลายภาพดานลาง
Run the tutorial หมายถึง การเปดบทเรียนการใช SPSS ในโปรแกรม Type in data หมายถึง การเริ่มตนใชโปรแกรมโดยการปอนตัวแปรและคาของตัวแปร Run an existing query หมายถึง การทํางาน SPSS รวมกับระบบฐานขอมูล Create new query using Database Wizard หมายถึง การสรางสวนทํางานรวมกับระบบฐานขอมูล
Open an existing data source หมายถึง การนําเปดขอมูลจากโปรแกรม SPSS มาทําการแกไข เชน เพ่ิมตัวแปร ใหคาตัวแปรและวิเคราะหผล เปนตน
Open another type of file หมายถึง การนําขอมูลโปรแกรมอื่นๆ มาทํางานรวมกับโปรแกรม SPSS
9
b. สวนประกอบของหนาจอหลักที่สําคัญ
Menu bar
พ้ืนที่สําหรับการกําหนดคาตัวแปร Variables
Variable View
Data View
Data View เปนสวนที่กําหนดคาของตัวแปรในแตละชุด หรือเปนสวน Data entry ในลักษณะ spreadsheet คลายกับการทํางานของ Microsoft Excel (ดูภาพดานลางประกอบ)
10
Variable View เปนสวนกําหนดคุณสมบัติของตัวแปร (ดูภาพดานลางประกอบ)
Name หมายถึง กําหนดชื่อตัวแปรซึ่งตองมีความยาวไมเกิน 8 ตัวอักษร
Type หมายถึง ชนิดของตัวแปร เมื่อคลิกที่เซลลนี้จะปรากฏชนิดของตัวแปรทั้งหมด 8 ชนิด ซึ่งตัวแปรหนึ่งๆ จะตองเปนชนิดใดชนิดหนึ่งเทานั่น โดยทั่วไปแลวมักจะเลือกใหเปน Numeric (ตัวเลข) หรือ String (ตัวอักษร)
Width หมายถึง จํานวนความกวางของคาตัวแปรหรือจํานวนของคาตัวแปร Decimals หมายถึง จํานวนหลักหลังจุดทศนิยม Label หมายถึง ความหมายของตัวแปร Value หมายถึง กําหนดความหมายของคาของตัวแปร เชน 1 หมายถึง male
11
Missing หมายถึง การกําหนดเมื่อไมพบคาตัวแปร มี 3 ทางเลือกคือ No missing values กรณีที่ไมมีการพิมพขอมูล โปรแกรมจะใหคาเปนจุด (.) Discrete missing values ผูใชเปนผูกําหนดรหัสของ missing value เอง Range plus one optimal discrete missing value เปนการกําหนดรหัสของขมูลที่
ตองขามไปอีกรหัสหนึ่ง มักใชในกรณีที่ผูวิจัยออกแบบสอบถามแลวผูตอบไมจําเปนตองตอบในขอนี้ และใหถามไปตอบขอถัดไป
Align หมายถึง การจัดคาของชุดตัวแปรใหชิดซาย กลางหรือขวา Measure หมายถึง Scale ของการวัด มี 3 ชนิดคือ Scale หมายถึง Interval หรือ Ration Scale Ordinal หมายถึง Ordinal Scale Nominal หมายถึง Nominal Scale
12
4. การจัดการขอมูลเบื้องตน
4.1 การ Import ขอมูลจาก Microsoft Excel a. คลิกเลือกเพ่ือเปดโฟลเดอรใหม
b. คลิกเลือกไฟลเปาหมายและเลือก Files of type ใหเปนสกุล Excel
c. คลิก Open และเลือก Worksheet จากนั่นคลิก OK
13
4.2 การเปล่ียนแปลงขอมูลดวยคําสั่ง Transform ในบางครั้งการเก็บขอมูลไมสามารถทําใหเกิดการกระจายตัวขอมูลแบบปกติได จึงจําเปนตองมีการเปล่ียนแปลงขอมูลโดยอาจทําการ take log หรือยกกําลังสองเปนตน ตัวอยางของขอมูลท่ีจําเปนตองมีการ Transform เชน คา Titer, คา Somatic cell count ฯลฯ
a. เปดไฟลหรือปอนคาของตัวแปร
b. คลิกเลือกที่ Transform คลิกเลือก Compute
c. คลิกเลือก Function, Variable รวมทั้งตั้งชื่อ Variable ที่ทําการ Transform เสร็จแลว
14
d. คลิก OK
15
5. การตรวจสอบการแจกแจงของขอมูลเชิงปริมาณ
เปนการตรวจสอบวาขอมูลท่ีไดมีการแจกแจงเปนแบบ Normal Distribution หรือไม จะทําในตัวแปรเชิงปริมาณ โดยการตรวจสอบสามารถทําได 2 วิธีคือ
การตรวจสอบดวยกราฟ เชน Histogram, Boxplot, Stem and Leaf และ Normal Probability Plot เปนตน
การตรวจสอบโดยการใชสถิติทดสอบ เชน Kolmogorov-Smirnov, Shapiro-Wilk และ Lilliefor’s test หรือแมกระทั่งการทดสอบความแปรปรวนของประชากรในแตละกลุมดวยวิธี Levene’s test ก็สามารถทําได
โปรแกรม SPSS มีคําสั่งที่สามารถตรวจสอบการแจกแจงดวยกราฟ โดยเขาไปที่ Menu > Descriptive Statistics > Frequency แตในที่นี้จะใชคําส่ังที่สามารถแสดงผลออกมาทั้งคาทางสถิติและกราฟเพื่อดูการกระจายตัวของขอมูล
5.1 การตรวจสอบการกระจายตัวของขอมูล a. โดยปกติแลวหากมีการติดตั้งโปรแกรม SPSS ทั้งหมดและสมบูรณ ในโฟลเดอรของ
SPSS ใน Drive: C > Program Files > SPSS จะมีขอมูลท่ีมาพรอมกับโปรแกรม ซึ่งในที่นี้จะนําขอมูลดังกลาวมาเพื่อมาใชในการเรียนรู ใหนิสิตทําการเปดโฟลเดอรดังกลาวและเลือกไฟล 1991 U.S. General Social Survey แลวคลิก Open
b. จะพบขอมูลตามภาพดานลาง
16
c. เลือก Analyze > Descriptive Statistics > Explore
d. เลือก column ที่ตองการทดสอบการกระจายตัวของขอมูลตัวแปรตาม ซึ่งในที่นี้เลือก Age of Respondent (age) ซึ่งเปนตัวแปรเชิงปริมาณใสในชอง Dependent List สวนชอง Factor List เปนตัวแปรที่ใชในการแบงกลุมของขอมูล ไมจําเปนตองใส (ยกเวนในกรณีที่ตองการแบงกลุม) และชอง Label Cases by เปนชองที่ใชเพ่ือระบุ Outlier ของ Boxplot ในที่นี้ก็ไมใสเชนกัน
e. ตรวจสอบลักษณะการแสดงของ output ในชอง Display ใหเปน Both เพ่ือใหผลการวิเคราะหแสดงทั้งกราฟและคาสถิติ
17
f. คลิกเลือก Statistics เพ่ือตรวจสอบสิ่งที่ตองการแสดงใน Output
g. คลิกเลือก Descriptives เพ่ือแสดงคาสถิติเชิงพรรณา เชน คาเฉล่ีย คามัธยฐาน คาเบ่ียงเบนมาตรฐาน ความโดงของกราฟ ความเบของกราฟ เปนตน สวนคา M-estimators เปนคา Robust maximum-likelihood estimator ซึ่งในที่นี้จะไมเลือก แลวคลิกเลือก Outlier และ Percentiles เพ่ือแสดงคาที่หลุดออกจากขอมูลรวมทั้งคา Percentiles ที่ 5, 10, 25, 50, 75, 90 และ 95 โดยตั้งคา Confidence Interval for Mean ใหเปน 95% แลวคลิกเลือก Continue
h. ตรวจสอบลักษณะของ Plot โดยคลิกเลือก Plot แลวคลิกเลือก Factor levels together หมายถึงการสั่งใหโปรแกรมแสดงคาแยกตามตัวแปรใน Dependent แตละตัว (ซึ่งตองมีการระบุใน factor variable แตถาไมระบุโปรแกรมจะแสดงเปนภาพรวม) สวน Stem-and-Leaf และ Histogram เปนกราฟที่แสดงที่สามารถดูการกระจายตัวได และ Normality plots with tests จะแสดงกราฟและคาทางสถิติของ Shapiro-Wilks และ Komogorov-Smirnov เพ่ือทดสอบวาขอมูลมีการแจกแจงเปยแบบปกติหรือไม ในกรณีที่ตัวอยางมากกวา 50 โปรแกรมจะไมคํานวณ Shapiro-Wilks’s statistic ให จากนั้นคลิก Continue สําหรับ Spread vs. Level with Levene Test เปนการตรวจสอบการกระจายของขอมูลโดยใช Levene Test โดยคาของสถิติ Levene
18
จะคํานวณจากคาจริง หรือคาของขอมูลท่ีมีการเปล่ียนแปลงรูปแบบ (Transformed data) ก็ได ผูวิเคราะหจะตองเลือกทางเลือกใดทางเลือกหนึ่งดังนี้
None เมื่อไมตองการคํานวณคา Levene Test Power estimation สําหรับแตละกลุม จะพล็อตคา log ของมัธยฐานกับ log ของ
พิสัยควอไทล (IQR) จะใชเมื่อตองการหาการเปลี่ยแปลงรูปแบบที่เหมาะสมของขอมูล Transformed ผูวิเคราะหสามารถเลือกรูปแบบของขอมูล ถาเลือกทางเลือกนี้แล
วจะทําใหคําวา Power มีสีเขม จากนั้นคลิกเลือกทางเลือกที่ตองการหลังคําวา Power Untransformed ใชเมื่อตองการใชคาของขอมูลจริง โดยไมมีการเปล่ียนแปลงขอมูล
i. คลิกเลือก Options เพ่ือจัดการ Missing values ในที่นี้ใหเลือก Exclude cases listwise ซึ่งจะทําใหโปรแกรมคํานวณโดยตัด Case ที่มี Missing value แลงคลิก Continue
19
j. คลิกเลือก OK ได output ตามภาพดานลาง
k. การแปลผลขอมูลในตารางแรกจะเปนนับจํานวนขอมูลหรือ Cases ทั้งหมด พบวามีจํานวนขอมูลท้ังหมด 1517 ขอมูล โดยมี 3 ขอมูลเปน missing cases
Case Processing Summary
Cases Valid Missing Total
N Percent N Percent N Percent Age of Respondent 1514 99.8% 3 .2% 1517 100.0%
20
l. ตารางถัดเปนเปนตารางที่แสดงถึงคาของ Descriptive statistics ซึ่งสามารถดูลักษณะการกระจายตัวของขอมูลไดแบบคราวๆ โดยเปรียบเทียบจากคา Mean กับ Median ในกรณีที่เปนการกระจายตัวแบบ Normal distribution คาทั้งสองควรมีคาใกลเคียงกันมากที่สุดหรือเทากัน นอกจากนี้ส่ิงที่จําเปนตองพิจารณาคือคา Skewness โดยขอมูลใดที่มีคาใกลเคียงศูนยแสดงวาขอมูลนั้นมีแนวโนมเปน Normal distribution ทั้งนี้หากคาที่ไดมากกวาศูนยแสดงวาขอมูลมีลักษณะเบขวา และขอมูลใดมีคา Skewness ติดลบแสดงวาขอมูลเบซาย และคา Kurtosis ปกติแลวในขอมูลท่ีมีลักษณะ Normal distribution แบบมาตรฐานจะมีคาประมาณ 3
Descriptives
Statistic Std. Error Mean 45.63 .458
Lower Bound 44.73 95% Confidence Interval for Mean Upper Bound
46.52
5% Trimmed Mean 44.97 Median 41.00 Variance 317.140 Std. Deviation 17.808 Minimum 18 Maximum 89 Range 71 Interquartile Range 28.00 Skewness .524 .063
Age of Respondent
Kurtosis -.786 .126
m. ตารางถัดไปเปนคาแสดง Percentiles ตางๆ
Percentiles
Percentiles
5 10 25 50 75 90 95 Weighted Average (Definition 1)
Age of Respondent 22.00 24.00 32.00 41.00 60.00 73.00 78.00
Tukey's Hinges
Age of Respondent 32.00 41.00 60.00
21
n. ตารางถัดไปเปนการแสดงคาที่สูงสุดและต่ําสุด (Extreme value) จํานวน 5 คา และในแตละคาอยูในชุดขอมูล (cases) ลําดับที่เทาไร
Extreme Values
Case Number Value 1 295 89 2 312 89 3 346 89 4 569 89
Highest
5 620 89(a) 1 1120 18 2 679 18 3 188 18 4 1053 19
Age of Respondent
Lowest
5 1029 19(b) a Only a partial list of cases with the value 89 are shown in the table of upper extremes. b Only a partial list of cases with the value 19 are shown in the table of lower extremes.
o. ตารางถัดไปเปนการแสดงคาวาชุดของขอมูลมีการกระจายตัวแบบใด โดยในที่นี้การทดสอบลักษณะการกระจายตัวจะมีสมมติฐานในการทดสอบกลาวคือ
Ho: ขอมูลมีการกระจายตัวแบบปกติ Ha: ขอมูลมีการกระจายตัวแบบไมปกติ
การพิจารณาวาจะใชสถิติตัวใดใหพิจารณาจากจํานวนขอมูลหรือขนาดของตัวอยาง โดยที่ Shapiro-Wilk จะใชเมื่อตัวอยางมีขาดไมเกิน 50 ตัวอยางเทานั้น ซึ่งปกติแลวเราจะพิจารณาจาก Kolmogorov-Smirnov ในที่นี้พบวา p-value เปน .000 ซึ่งมีคานอยกวา 0.01 ที่ระดับความเชื่อมั่น 99% แสดงวาปฏิเสธ Null hypothesis ดังนั้นขอมูลชุดน้ีจึงมีการแจกแจงแบบไมปกติ และหากพิจารณาจากกราฟดานลางทั้งหมดจะพบวากราฟมีลักษณะเบขวาเล็กนอย ดังนั้นการวิเคราะหสถิติสําหรับขอมูลชุดนี้ควรเลือกแบบ Non-parametric statistics
Tests of Normality
Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic df Sig. Statistic df Sig. Age of Respondent .105 1514 .000 .944 1514 .000
a Lilliefors Significance Correction
22
Age of Respondent
90.085.0
80.075.0
70.065.0
60.055.0
50.045.0
40.035.0
30.025.0
20.0
Histogram
Freq
uenc
y
300
200
100
0
Std. Dev = 17.81
Mean = 45.6
N = 1514.00
Age of Respondent Stem-and-Leaf Plot Frequency Stem & Leaf 12.00 1 . 899 143.00 2 . 000011111111222222233333344444 150.00 2 . 5555556666666777777888888899999 187.00 3 . 00000001111111222222222333333334444444 195.00 3 . 555555555556666666777777788888889999999 167.00 4 . 0000000111111112222223333333444444 113.00 4 . 5555667777778888889999 87.00 5 . 000011122223334444 78.00 5 . 555667778888999 87.00 6 . 00011112223333444 84.00 6 . 555566677778888999 95.00 7 . 0001111222233333444 53.00 7 . 5566677889 43.00 8 . 001122234 20.00 8 . 5799& Stem width: 10 Each leaf: 5 case(s) & denotes fractional leaves
Normal Q-Q Plot of Age of Respondent
Observed Value
100806040200-20
Expe
cted
Nor
mal
3
2
1
0
-1
-2
-3
-4
Detrended Normal Q-Q Plot of Age of Re
Observed Value
100806040200
Dev
fro
m N
orm
al
1.5
1.0
.5
0.0
-.5
1514N =
Age of Respondent
100
80
60
40
20
0
23
6. การวิเคราะหขอมูลดวยสถิติเชิงพรรณา
สถิติเชิงพรรณาเปนการคํานวณคาสถิติพ้ืนฐาน เชน การวัดคากลาง การวัดการกระจายตัวของขอมูล และการนําเสนอขอมูลในรูปกราฟหรือตาราง ความถี่ รอยละ เปนตน เพ่ืออธิบายลักษณะของขอมูล ทั้งในเชิงปริมาณและเชิงคุณภาพ
6.1 การหาจํานวนหรือความถี่ดวยการสรางตารางแจกแจงความถี่ (Frequencies) ใชคําส่ัง Analyze > Descriptive Statistics > Frequencies เพ่ือแสดงความถี่ เปอรเซ็นต
คาสถิติเชิงพรรณาตางๆ กราฟ และอ่ืนๆ ขึ้นอยูกับการเลือกของผูวิเคราะห โดยสามารถวิเคราะหไดทั้งขอมูลเชิงคุณภาพและเชิงปริมาณ โดยการเลือกวาจะวิเคราะหขอมูลแบบใด นิสิตตองเลือกชนิดของตัวแปรและ Output ใหสอดคลองกัน ซึ่งในที่นี้ใหเปดไฟท 1991 U.S. General Social Survey เพ่ือทําการวิเคราะหขอมูลเชิงปริมาณโดยการเลือกตัวแปรที่เกี่ยวของกับอายุ จากนั้นทําการเลือกในชอง Statistics, Charts และ Format ใหเหมาะสมแลวคลิกเลือก OK
24
จะได Output ออกมาดังตารางและภาพดานลาง โดยที่การแปลผลจะคลายกับที่ไดกลาวมาแลวในหัวขอท่ี 5
Statistics
Age of Respondent Valid 1514 N Missing 3
Mean 45.63 Std. Error of Mean .458 Median 41.44(a) Mode 35 Std. Deviation 17.808 Variance 317.140 Skewness .524 Std. Error of Skewness .063 Kurtosis -.786 Std. Error of Kurtosis .126 Range 71 Minimum 18 Maximum 89 Sum 69078
10 24.32(b) 20 29.36 25 31.53 30 33.44 40 37.20 50 41.44 60 47.22 70 54.87 75 59.71 80 63.98
Percentiles
90 72.70 a Calculated from grouped data. b Percentiles are calculated from grouped data.
25
Age of Respondent
Frequency Percent Valid Percent Cumulative
Percent 18 3 .2 .2 .2 19 9 .6 .6 .8 20 18 1.2 1.2 2.0 21 38 2.5 2.5 4.5 22 35 2.3 2.3 6.8 23 28 1.8 1.8 8.7 24 24 1.6 1.6 10.2 25 28 1.8 1.8 12.1 26 33 2.2 2.2 14.3 27 29 1.9 1.9 16.2 28 33 2.2 2.2 18.4 29 27 1.8 1.8 20.1 30 35 2.3 2.3 22.5 31 35 2.3 2.3 24.8 32 44 2.9 2.9 27.7 33 38 2.5 2.5 30.2 34 35 2.3 2.3 32.5 35 55 3.6 3.6 36.1 36 35 2.3 2.3 38.4 37 33 2.2 2.2 40.6 38 37 2.4 2.4 43.1 39 35 2.3 2.3 45.4 40 36 2.4 2.4 47.8 41 38 2.5 2.5 50.3 42 30 2.0 2.0 52.2 43 33 2.2 2.2 54.4 44 30 2.0 2.0 56.4 45 22 1.5 1.5 57.9 46 12 .8 .8 58.7 47 28 1.8 1.8 60.5 48 29 1.9 1.9 62.4 49 22 1.5 1.5 63.9 50 20 1.3 1.3 65.2 51 15 1.0 1.0 66.2 52 20 1.3 1.3 67.5 53 14 .9 .9 68.4 54 18 1.2 1.2 69.6 55 16 1.1 1.1 70.7 56 12 .8 .8 71.5 57 17 1.1 1.1 72.6 58 18 1.2 1.2 73.8 59 15 1.0 1.0 74.8
Valid
60 16 1.1 1.1 75.8
26
61 20 1.3 1.3 77.1 62 17 1.1 1.1 78.3 63 19 1.3 1.3 79.5 64 15 1.0 1.0 80.5 65 18 1.2 1.2 81.7 66 13 .9 .9 82.6 67 18 1.2 1.2 83.8 68 18 1.2 1.2 84.9 69 17 1.1 1.1 86.1 70 15 1.0 1.0 87.1 71 20 1.3 1.3 88.4 72 19 1.3 1.3 89.6 73 24 1.6 1.6 91.2 74 17 1.1 1.1 92.3 75 10 .7 .7 93.0 76 13 .9 .9 93.9 77 12 .8 .8 94.6 78 11 .7 .7 95.4 79 7 .5 .5 95.8 80 11 .7 .7 96.6 81 9 .6 .6 97.2 82 13 .9 .9 98.0 83 5 .3 .3 98.3 84 5 .3 .3 98.7 85 6 .4 .4 99.1 87 4 .3 .3 99.3 88 2 .1 .1 99.5 89 8 .5 .5 100.0
Total 1514 99.8 100.0 Missing NA 3 .2 Total 1517 100.0
Age of Respondent
90.085.0
80.075.0
70.065.0
60.055.0
50.045.0
40.035.0
30.025.0
20.0
Age of Respondent
Freq
uenc
y
300
200
100
0
Std. Dev = 17.81
Mean = 45.6
N = 1514.00
27
6.2 การสรางตารางแจกแจงความถี่แบบ 2 ทาง (Crosstabs) ในโปรแกรม SPSS สามารถสรางตารางแจกแจงตั้งแต 2 ทางขึ้นไปได แตในที่นี้จะขอกลาว
เฉพาะการสรางตารางแจกแจง 2 ทาง (ตัวแปรที่ใสในตารางอาจมีมากกวา 2 ตัวแปร) ซึ่งจะใชคําส่ัง Analyze > Descriptive Statistics > Crosstabs โดยขอมูลท่ีใสในตารางแจกแจงควรเปนขอมูลท่ีไดจากการนับหรือขอมูลเชิงคุณภาพ ในที่นี้เลือกตัวแปร Respondent’s sex ลงใน Row(s) และเลือกตัวแปร Region of the United States ลงใน Column(s) (การตั้งคาใน Statistics นั้นโดยมากเปนคํานวณคาทางสถิติ เชน Chi-square ซึ่งจะไดกลาวถึงในบทถดัไป) แลวคลิก OK (หากตองการแสดงผลเปน Percentage ใหคลิกเลือก Cell แลวกําหนดโดยเลือก Percentage)
28
ไดลักษณะของขอมูลตามตารางดานลาง
Case Processing Summary
Cases
Valid Missing Total N Percent N Percent N Percent Respondent's Sex * Region of the United States * R's Federal Income Tax
932 61.4% 585 38.6% 1517 100.0%
Respondent's Sex * Region of the United States * R's Federal Income Tax Crosstabulation
Count
R's Federal Income Tax Region of the United States North East South East West Total
Respondent's Sex
Male 99 66 68 233
Female 140 76 92 308
Too High
Total 239 142 160 541Male 84 45 48 177Respondent's
Sex Female 92 54 57 203
About Right
Total 176 99 105 380Male 3 1 2 6Respondent's
Sex Female 1 2 2 5
Too Low
Total 4 3 4 11
ในหนาจอของ Crosstabs คําส่ัง Display clustered bar chart เมื่อเลือกจะแสดง clustered bar chart ซึ่งชวยในการสรุปขอมูลได สวน Suppress tables จะใชเมื่อไมตองการแสดงตาราง Crosstabs ที่แสดงความถี่ของขอมูล แตตองการแสดงเฉพาะคาทางสถิตินั้น
29
7. การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test และ One-way ANOVA
7.1 การวิเคราะหขอมูลเชิงปริมาณแบบ Independent-Sample T Test เปนการวิเคราะหขอมูลเชิงปริมาณที่เปนอิสระตอกันจํานวน 2 กลุม วามีความแตกตางกันหรือไม โดยเลือกคําสั่ง Analyze > Compare Means > Independent-Sample T Test โดยสมมติวาขอมูลท่ีจะวิเคราะหมีการกระจายตัวแบบปกติ
เมื่อปรากฏหนาจอตามรูปดานบนแลวใหใสตัวแปรตามเชิงปริมาณที่ตองการวิเคราะหในชอง Test Variable(s) แลวตัวแปรตนในชอง Grouping Variable เมื่อใสตัวแปรตนในชองนี้แลว Define Group จะ active ใหทําการคลิกเพ่ือกําหนดคาของตัวแปรตามคุณลักษณะของตัวแปรนั้นๆ ในกรณีที่นิสิตลืมคุณลักษณะของตัวแปรสามารถดูไดจาก Utilities > File Info ตามรูปดานลาง
30
คลิกเลือก Options แลวกําหนดระดับความเชื่อมั่นไวที่ 95% สําหรับคา Missing Values ใหเลือก Exclude cases analysis by analysis ซึ่งหมายถึงไมรวมเอาขอมูลของ Case ที่มี missing values ในการวิเคราะห จากนั้นคลิกเลือก Continue แลวตามดวย OK
ไดผลการทดสอบออกมาตามตารางดานลาง โดยตารางแรกจะแสดงลักษณะขอมูล
แบบสถิติเชิงพรรณา โดยแบงตาม
Group Statistics
Respondent's Sex N Mean Std. Deviation Std. Error
Mean Male 636 44.18 17.033 .675Age of Respondent Female 878 46.67 18.288 .617
31
Independent Samples Test
Levene's Test for Equality of Variances t-test for Equality of Means
95% Confidence Interval of the Difference
F Sig. t df Sig. (2-tailed) Mean
Difference Std. Error Difference Lower Upper
Equal variances assumed 9.697 .002 -2.693 1512 .007 -2.49 .925 -4.307 -.677 Age of Respondent
Equal variances not assumed -2.724 1420.931 .007 -2.49 .915 -4.287 -.698
การวิเคราะหขอมูลจําเปนตองตรวจสอบความแปรปรวนของประชากรที่นํามาทดสอบกอนวาเทากันหรือไม โดยพิจารณาจาก Levene’s Test for Equality of Variances ซึ่งในกรณีนี้จะมีสมมติฐานเพื่อการวิเคราะหความแปรปรวนโดย o Ho: ความแปรปรวนของขอมูลทั้ง 2 ชุดเทากัน o Ha: ความแปรปรวนของขอมูลทั้ง 2 ชุดไมเทากัน ในกรณีนี้พบวาคา Probability Value (p-value) ของ Levene’s Test เทากับ 0.002 ซึ่งนอยกวา 0.05 ดังนั้นจึงปฏิเสธ Null hypothesis แลวสรุปวาความแปรปรวนของขอมุลทั้ง 2 ชุดไมเทากัน ดังนั้นการทดสอบ Independent Samples Test จึงพิจารณาจากคา Equal variance not assumed ไดคา P-value เปน 0.007 ซึ่งนอยกวา 0.05 แสดงวาขอมูลทั้ง 2 ชุด แตกตางกันอยางมีนัยสําคัญทางสถิติ (p<0.05) สําหรับในกรณีที่ขอมูลมีความแปรปรวนเทากันใหพิจารณาคา p-value ของ Independent Samples Test จาก Equal variances assumed
7.2 การวิเคราะหขอมูลเชิงปริมาณแบบ One-Way ANOVA เปนการวิเคราะหขอมูลเชิงปริมาณตัวแปรเดียวที่เปนอิสระตอกันจํานวน 3 กลุม (ขึ้นไป) วามีความแตกตางกันหรือไม โดยเลือกคําส่ัง Analyze > Compare Means > One-Way ANOVA ในที่นี้สมมติตัวแปรโดยเลือกจากไฟท 1991 U.S. General Social Survey โดย assumed ขอมูลมีการกระจายตัวแบบปกติ
จากนั้นคลิกเลือกตัวแปรตามเชิงปริมาณในชอง Dependent List และตัวแปรตนใน Factor จากนั้นส่ิงจําเปนที่ตองพิจารณาคือ Post Hoc Multiple Comparison Test ซึ่งเปนการใชสถิติเพ่ือทดสอบวาถาคาสถิติแบบ One-way ANOVA ใหผลมีนัยสําคัญทางสถิติแลวคูใดที่มีความแตกตางกันโดยสมมติฐานของ One-way ANOVA โดยทั่วไปคือ
• Ho: คา mean ของทุกกลุมไมแตกตางกัน
• Ha: คา mean ของกลุมที่ทดสอบอยางนอยหนึ่งคูที่แตกตางกัน โดย Post Hoc จะบอกไดวาคูใดที่ตางกันในกรณีที่ปฏิเสธ Null hypothesis ในที่นี้คลิกเลือก LSD, Bonferroni, Tukey, Duncan, Tamhane’s T2 และ Dunnett’s T3 แลตั้ง Significant level ไวที่ .05 (โดยปกติแลว Post Hoc จะมี 2 กลุมคือกลุม Equal Variances Assumed และ Equal Variances Not Assumed ซึ่งควรจะเลือกทั้ง 2 กลุม) แลวคลิก Continue
คลิก Options เพ่ือเลือก Descriptive, Homogeneity-of-Variance (เพ่ือทดสอบความแปรปรวน), Brown-Forsythe หรือ Welch (เพ่ือทดสอบความแตกตางของคาเฉล่ียกลุมตางๆ เมื่อคาความแปรปรวนในแตละกลุมไมเทากัน จากนั้นเลือก Continue แลว OK
ไดผลการวิเคราะหตามตารางดานลาง
34
Descriptives Age of Respondent
95% Confidence Interval for Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum White 1262 46.20 18.032 .508 45.20 47.20 18 89Black 203 43.27 16.794 1.179 40.95 45.60 19 88Other 49 40.59 14.467 2.067 36.44 44.75 19 77Total 1514 45.63 17.808 .458 44.73 46.52 18 89
สิ่งที่ตองพิจารณานอกจากสถิติเชิงพรรณาคือคาความแปรปรวนวาเปนอยางไร จากตารางพบวา Levene Statistic มีคา p-value< 0.05 แสดงวาคาความแปรปรวนของขอมูลแตละชุดตางกัน ดังนั้นสถิติของ One-way ANOVA ที่ตองพิจารณาคือ Brown-Forsythe หรือ Welch แตในกรณีที่ความแปรปรวนเทากัน (p>0.05) ใหพิจารณาคาสถิติแบบ F Test ในตาราง ANOVA แทน
Test of Homogeneity of Variances Age of Respondent
Levene Statistic df1 df2 Sig.
5.478 2 1511 .004
ANOVA Age of Respondent
Sum of Squares df Mean Square F Sig.
Between Groups 2784.189 2 1392.095 4.409 .012Within Groups 477048.21
5 1511 315.717
Total 479832.404 1513
Robust Tests of Equality of Means
Age of Respondent
Statistic(a) df1 df2 Sig. Welch 5.529 2 118.615 .005Brown-Forsythe 5.559 2 217.762 .004a Asymptotically F distributed.
ในกรณีนี้พิจารณาจากคา Welch พบวาคา p=0.005 ซึ่งนอยกวา 0.05 แสดงวาพบนัยสําคัญทางสถิติกลาวคือมีอยางนอยหนึ่งคูที่มีคา mean แตกตางกันอยางมีนัยสําคัญทางสถิติ ซึ่งคูใดบางเราจะพิจารณาจาก Post Hoc Multiple Comparison Test ตอไป
Multiple Comparisons
Dependent Variable: Age of Respondent
95% Confidence Interval
(I) Race of Respondent
(J) Race of Respondent
Mean Difference (I-
J) Std. Error Sig. Lower Bound Upper Bound Black 2.93 1.344 .075 -.22 6.08White Other 5.61 2.587 .077 -.46 11.68
Black White -2.93 1.344 .075 -6.08 .22 Other 2.68 2.828 .610 -3.96 9.31Other White -5.61 2.587 .077 -11.68 .46
Tukey HSD
Black -2.68 2.828 .610 -9.31 3.96LSD White Black 2.93(*) 1.344 .029 .29 5.57
Other 5.61(*) 2.587 .030 .53 10.68Black White -2.93(*) 1.344 .029 -5.57 -.29 Other 2.68 2.828 .344 -2.87 8.23Other White -5.61(*) 2.587 .030 -10.68 -.53
Black -2.68 2.828 .344 -8.23 2.87Bonferroni White Black 2.93 1.344 .088 -.29 6.15
Other 5.61 2.587 .091 -.59 11.81 Black White -2.93 1.344 .088 -6.15 .29
36
Other 2.68 2.828 1.000 -4.10 9.46Other White -5.61 2.587 .091 -11.81 .59
Black -2.68 2.828 1.000 -9.46 4.10Tamhane White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .36 10.85Black White -2.93 1.283 .068 -6.01 .15 Other 2.68 2.379 .600 -3.12 8.48Other White -5.61(*) 2.128 .032 -10.85 -.36
Black -2.68 2.379 .600 -8.48 3.12Dunnett T3 White Black 2.93 1.283 .068 -.15 6.01
Other 5.61(*) 2.128 .032 .37 10.85Black White -2.93 1.283 .068 -6.01 .15 Other 2.68 2.379 .597 -3.12 8.47Other White -5.61(*) 2.128 .032 -10.85 -.37
Black -2.68 2.379 .597 -8.47 3.12* The mean difference is significant at the .05 level.
ในกรณีนี้พบวาความแปรปรวนไมเทากันดังนั้น Post Hoc จึงพิจารณาจาก Tamhane’s Ts หรือ Dunnett’s T3 ที่ไดเลือกไวพบวา Tamhane ใหคา p<0.05 คู White กับ Other สวนคูอื่นๆ ใหคามากกวา 0.05 แสดงวาคูนี้มีคา mean แตกตางกันอยางมีนัยสําคัญทางสถิติที่ p<0.05
37
8. การวิเคราะหขอมูลความสัมพันธของตัวแปรเชิงปริมาณ 2 ตัวแปรดวย correlation
8.1 การวิเคราะหสัมประสิทธิ์สหสัมพันธ (Correlation Coefficient) เปนการวิเคราะหหาความสัมพันธของตัวแปร X และ Y เชิงปริมาณ วามีความสัมพันธในเชิงเสนหรือไม โดยที่ไมทราบวาตัวแปรใดเปนตัวแปรตนหรือตัวแปรตาม ในที่นี้สมมติเลือกตัวแปร age กับ educ วามีความสัมพันธกันหรือไม ซึ่งสามารถใชคําส่ัง Analyze > Correlate > Bivariate แลวเลือกตัวแปรที่ตองการหาความสัมพันธลงในชอง Variables จากนั้นคลิกเลือก Pearson ในกรณีที่ขอมูลชุดนี้มีการกระจายตัวแบบปกติ และเลือก Kendall’s tau-n หรือ Spearman กรณีที่การกระจายไมเปนปกติ และควรคลิกเลือกการทดสอบแบบ Two-tailed สําหรับ Flag significant correlations เปนกําหนดใหโปรแกรมทําเครื่องหมาย * และ ** เพ่ือดูระดับนัยสําคัญที่ 0.05 และ 0.01 ที่ขอมูล นอกจากนี้ตรวจสอบ Options โดยคลิกเลือก Mean and standard deviations (เปนการหาจํานวน case คาเฉล่ียและ คาเบ่ียงเบนมาตรฐานของขอมูลแตละตัว จะใชเมื่อคลิกเลือกการทดสอบแบบ Pearson correlation สวน Cross-product deviation and covariance จะไมกลาวถึง) และ Exclude cases pairwise (เปนการคํานวณคา r เปนคูๆ ในกรณีที่ตัวแปรมากกวา 2 ตัวขึ้นไป และถามีคา missing โปรแกรมจะตัดออกเฉพาะเปนคูๆ ไป แตถาเลือก Exclude cases listwise โปรแกรมจะตัด missing ออกในทุกๆ ตัวแปรเพื่อใหเหลือคูที่เทากันทุกตัวแปร)
ไดผลการคํานวณออกมาตามตารางดานลาง
Descriptive Statistics
Mean Std. Deviation N Age of Respondent 45.63 17.808 1514 Highest Year of School Completed 12.88 2.984 1510
ตารางลางดานลางนี้พิจารณาคา p-value ของแตละคูในกรณีที่ขอมูลมีการกระจายตัวแบบปกติ จากตารางแสดงวา Age of Respondent มีความสัมพันธเชิงเสนแบบตรงกันขาม โดยมีคา r = -.254 อยางมีนัยสําคัญทางสถิติที่ p<0.01 จากตัวอยางทั้งหมด 1508 ตัวอยาง สําหรับในกรณีที่การกระจายตัวของขอมูลเปนแบบไมปกติใหใชตาราง Nonparametric correlation โดยอาจเลือกใชไดทั้งสถิติแบบ Kendall’s หรือ Spearman’s และการแปลผลก็คลายๆ กัน
Correlations
Age of
Respondent
Highest Year of School
Completed Pearson Correlation 1 -.254(**) Sig. (2-tailed) . .000
Age of Respondent
N 1514 1508 Pearson Correlation -.254(**) 1 Sig. (2-tailed) .000 .
Highest Year of School Completed
N 1508 1510 ** Correlation is significant at the 0.01 level (2-tailed).
39
Nonparametric Correlations
Age of
Respondent
Highest Year of School
Completed Correlation Coefficient 1.000 -.146(**)
Sig. (2-tailed) . .000
Age of Respondent
N 1514 1508Correlation Coefficient -.146(**) 1.000
Sig. (2-tailed) .000 .
Kendall's tau_b
Highest Year of School Completed
N 1508 1510Correlation Coefficient 1.000 -.209(**)
Sig. (2-tailed) . .000
Age of Respondent
N 1514 1508Correlation Coefficient -.209(**) 1.000
Sig. (2-tailed) .000 .
Spearman's rho
Highest Year of School Completed
N 1508 1510** Correlation is significant at the 0.01 level (2-tailed).
40
9. การวิเคราะหขอมูลแบบ non-parametric statistics ที่สําคัญ
10.1 การวิเคราะหสถิติแบบ Chi-square ในประชากร 2 กลุมขึ้นไป เปนการทดสอบลักษณะตางๆ ของสัดสวนในประชากร 2 กลุมวามีความสัมพันธกันหรือไม โดยใชคําส่ัง Analyze > Descriptive Statistics > Crosstabs เหมือนขอท่ี 6.2 แตกตางกันคือนิสิตตองใสคาทางสถิติในตัวเลือก Statistics เพ่ือส่ังใหโปรแกรมคํานวณคา Chi-square ดวย ขณะที่ตัวเลือก Cell ใหคลิกเลือกทั้ง Observed และ Expected โดยเลือกตัวอยางจากไฟท AML survival
ในการเลือกตัวแปรใหอยูในแนว Row(s) หรือ Column(s) ตามที่ตองการ แลวคลิกเลือก Display clustered bar charts เพ่ือให output แสดงกราฟแทงเปรียบเทียบ นอกจากนี้ในสวนของ Statistics ใหเลือก Chi-square และใน Cells ใหเลือกทั้ง Observed และ Expected เพ่ือให output แสดงคาทั้งคู
41
ไดขอมูลตามตารางดานลาง
Case Processing Summary
Cases
Valid Missing Total N Percent N Percent N Percent Chemotherapy * Status 23 100.0% 0 .0% 23 100.0%
ตารางดานลางเปนการแสดงคา Observed หรือ Count กับ Expected Value ในแตละ cell
Chemotherapy * Status Crosstabulation
Status Censored Relapsed Total
Count 1 11 12 No Expected Count 2.6 9.4 12.0
Count 4 7 11
Chemotherapy
Yes Expected Count 2.4 8.6 11.0
Count 5 18 23 Total Expected Count 5.0 18.0 23.0
42
ตารางดานลางเปนการแสดงคา Chi-square พบวา p=.104 ซึ่งมากกวา 0.05 แสดงวาไมสามารถปฏิเสธ Null hypothesis ได ดังนั้นปจจัยทั้ง 2 ตัวไมมีความสัมพันธกัน หรือปจจัยทั้งคูที่นํามาทดสอบเปนอิสระตอกัน
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square 2.650(b) 1 .104 Continuity Correction(a) 1.259 1 .262
Likelihood Ratio 2.780 1 .095 Fisher's Exact Test .155 .131Linear-by-Linear Association 2.535 1 .111
N of Valid Cases 23 a Computed only for a 2x2 table b 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.39.
Chemotherapy
YesNo
Coun
t
12
10
8
6
4
2
0
Status
Censored
Relapsed
43
10.2 การเปรียบเทียบขอมูล 2 ชุดที่เปนอิสระตอกัน จะใชเมื่อขอมูลมีการแจกแจงไมเปนปกติ เปนการทดสอบวาขอมูล 2 ชุดมีคากลางอยูที่ตําแหนงเดียวกันหรือไม ตางกันอยางไร ซึ่งในกรณีนี้จะทดสอบเฉพาะ Mann-Whitney U Test โดยใชคําส่ัง Analyze > Nonparametric Test > 2 Independent Sample และเลือกใชตัวอยางจากไฟท 1991 U.S. General Social Survey โดยสมมติใหขอมูลท่ีจะใชมีการแจกแจงแบบไมปกติ (การใชโปรแกรมจะคลายกับกรณีของ Parametric แตตางกันที่นิสิตตองคลิกเลือกสถิติแบบ Mann-Whitney U Test ซึ่งการวิเคราะหจะคลายๆ กับ T-test
Descriptive Statistics
Percentiles N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00Respondent's Sex 1517 1.58 .494 1 2 1.00 2.00 2.00
Mann-Whitney Test
Ranks
Respondent's Sex N Mean Rank Sum of Ranks Male 636 726.92 462319.50 Female 878 779.65 684535.50
Age of Respondent
Total 1514
44
Test Statistics(a)
Age of
Respondent Mann-Whitney U 259753.500Wilcoxon W 462319.500Z -2.317Asymp. Sig. (2-tailed) .021
a Grouping Variable: Respondent's Sex
จากตารางดานบนพบวาสถิติของ Mann-Whitney U ไดคา p=0.021 แสดงวาปฏิเสธ Null hypothesis เน่ืองจากคา p<0.05 ดังนั้นจึงสรุปไดวาคากลางของขอมูลสองชุดที่นํามาวิเคราะหมีความแตกตางกันอยางมีนัยสําคัญทางสถิติ (p<0.05)
10.3 การเปรียบเทียบขอมูลมากกวา 2 ชุดที่เปนอิสระตอกัน เปนกรณีเดียวกับการทดสอบแบบ
One-Way ANOVA แตกตางกันเพียงในหัวขอนี้ขอมูลจะสมมติใหมีการกระจายตัวไมเปนปกติ และสถิติที่จะกลาวถึงคือ Kruskal-Wallis H ที่ขยายมาจาก Mann-Whitney U Test แตจะมีจํานวนกลุมของตัวแปรตนมากกวา 2 กลุม คําส่ังที่เลือกใชคือ Analyze > Nonparametric Tests > K Independent Sample ซึ่งการวิเคราะหจะคลายๆ กับ One-way ANOVA
45
Descriptive Statistics
Percentiles N Mean Std. Deviation Minimum Maximum 25th 50th (Median) 75th Age of Respondent 1514 45.63 17.808 18 89 32.00 41.00 60.00Race of Respondent 1517 1.20 .473 1 3 1.00 1.00 1.00
Kruskal-Wallis Test
Ranks
Race of Respondent N Mean Rank White 1262 770.78 Black 203 700.81 Other 49 650.27
Age of Respondent
Total 1514
Test Statistics(a,b)
Age of
Respondent Chi-Square 7.529df 2Asymp. Sig. .023
a Kruskal Wallis Test b Grouping Variable: Race of Respondent
จากตารางดานบนพบวาสถิติของ Kruskal Waliis ไดคา p=0.023 แสดงวาปฏิเสธ Null hypothesis เน่ืองจากคา p<0.05 ซึ่งในกรณีนี้สมมติฐานคือ
• Ho: median ของขอมูลท้ังสามชุดไมแตกตางกัน
• Ha: median ของขอมูลอยางนอยหนึ่งคูที่แตกตางกัน ในกรณีนี้พบวา median อยางนอยหนึ่งคูที่แตกตางกันอยางมีนัยสําคัญทางสถิติ โดยหากตองการทราบวาคูใดที่แตกตางกันตองไปวิเคราะหหา Post Hoc Multiple Comparison Test โดยควรที่จะตองพิจารณาวิธีที่ใช median ในการคํานวณ
******************************************************************************************************
46