Bai giang SPSS 1, 2, 4

Embed Size (px)

Citation preview

Ni dung :

L thuyt : 30 tit Thc hnh : 45 tit

Gii thiu tng quan v phn mm SPSS. Cc loi d liu v thang o. Phng php phn tch d liu. M ha v nhp liu. Thng k m t. Kim nh gi thuyt trung bnh ca 2 tng th. Kim nh phi tham s. Phn tch phng sai. Tng quan v hi quy tuyn tnh.

Vai tr ca thng tin trong NCKHVn NC Gi thuyt NC R ro

Lun chng

Lun c

Lun im

Chng I: Gii thiu v SPSS1. Gii thiu v thu thp x l thng tin trongnghin cu khoa hc- Nghin cu KH cn thu thp v x l thng tin, qua trnh thng qua 3 G/on: - Giai on thit k; - Giai on thu thp thng tin; - Giai on x l v phn tch thng tin.

2 Giai on thit k:

Nhim v ca giai on thit k cng trnh nghin cu thc nghim l xc nh ni dung thng tin cn thu nhn; Kt qu nghin cu trong giai on thit k phi vch ra mi ng i, nc bc;(Xc nh chng trnh nghin cu, phng n thu thp v x l thng tin ).

3.Giai on tin hnh

y l bc thu nhn thng tin ring bit v kim tra cht lng thu nhn thng tin ngay ti ch. c im c bn ca bc tin hnh l thc hin nghim chnh nhng yu cu, nhng iu hng dn vch ra bc thit k

4. Nhim v ch yu ca giai on x l thng tin l chuyn thng tin ring bit sang thng tin tng hp, thc hin tng kim tra, nh gi cht lng v nh gi trin vng ca thng tin tng hp, phn tch v kt lun. Giai on x l thng tin cng c ba bc k tip nhau l: - Chun b cho vic x l thng tin, - X l thng tin v kt thc. - S dng kt qu x l thng tin

5 Quy trnh nghin cu x l thng tin

-SPSS thc hin trong bc 5 chia ra cc giai on:

Mt s thao tc c bn trn SPSSKhi ng SPSS Mn hnh giao tip ca SPSS

Cc thao tc v tp tin Cch 1: Click chut vo biu tng Open trn thanh cng c Data Editor.4123 Cch 2: File/Open/Data, hp thoi sau hin ra. Hp File of type cho php chng ta chn cc loi tp tin cn m: SPSS (*.sav): tp tin d liu c to/lu tr trong SPSS (Windows).

ng mt tp tin d liu SPSS ch m mt tp tin d liu ti mi thi im nn n s t ng ng tp tin d liu c trc khi m tp tin d liu mi. Lu tr mt tp tin d liu Lu tr tp tin d liu trong SPSS3124

Chn Data Editor, File/Save hoc File/Save As (lu vi tn mi).

Thng tin v tp tin d liu Mt tp tin d liu SPSS, ngoi d liu th, cn cha cc thng tin nh ngha v cc bin gm c: tn, loi, cc nhn bin v nhn gi tr. hin th ton b thng tin v bin trong tp tin d liu ang m, chn Utilities/File Info (tp tin cha m, chn File/Display File Info). c tnh ny gip ta nm vng cu trc tp tin d liu.

In tp tin Ta c th in ton b tp tin hay ch mt phn ca tp tin kt qu.In ton b d liu In theo trang ch nh In d liu chn Chn File/Print

In toan bo d lieu In theo trang ch nh In d lieu a chon

Chng 2 CAC LOAI D LIEU VA THANG O D lieu: La so lieu, tai lieu, t lieu, thong tin a co e giai quyet van e nghien cu. Bien: La ai lng co the nhan gia tr nay hay gia tr khac, trong trng hp nay hay trng hp khac.

goc o mon hoc SPSS th bien chnh la nhng d lieu can thu thap qua phong van, ieu tra, quan sat va da vao o e phan tch, x ly nham giai quyet van e nghien cu.

-

I- Phan loai d lieu D lieu nghien cu co the bieu th di ba dang chnh: D lieu nh lng D lieu nh tnh D lieu nh tnh khong th bac D lieu nh tnh co th bac D lieu ban nh lng

D lieu nh tnhPhan anh tnh chat, s hn kem, khong tnh c tr trung bnh. Co nhieu cach the hien cac d lieu nh tnh, v du: gii tnh nam hay n, benh nang hay nhe, ket qua ieu tr tot hay xau, loai thuoc ieu tr la ampicilin hay streptomycin, o bong 1 hoac 2 hoac 3 V vay ngi ta con phan ra d lieu th t (ordered data), d lieu nh danh (norminal data).

D lieu nh lngCac d lieu the hien bang nhng con so (numeric), bien thien lien tuc (continuous) hoac ri rac (discrete). V du: o chieu cao cua thanh nien ta se co nhng con so: 16.5; 1.70; 1.72,, o la mot bien so lien tuc (continuous variable); tiem chung cho tre em mot a phng, co em c tiem mot lan, co em hai lan hoac ba lan (khong the co 1 lan ri), o la bien so ri rac.

D lieu ban nh lngTrong tuy tng lnh vc co nhng ch tieu kho anh gia chnh xac, v vay phai dung en nhng cach the hien ban nh lng. V du ky sinh trung sot ret trong mau +, ++, +++; trng giun trong phan +, ++, +++. Mac du xu hng dung ban nh lng ngay cang t i, nhng cung co luc can en. X ly thong ke vi cac d lieu ban nh lng tng oi n gian, nhng cach anh gia van giup cho ta biet c ang tin cay hay khong va tin cay mc o nao.

II- Cac loai thang o

Ngay t giai oan thiet ke a phai xay dng thang o. Thang o la mot trong nhng phng tien e o moi lien quan gia cac hien tng xa hoi. Thang o la cach sap xep thong tin, la he thong nhng con so va nhng moi quan he gia chung. No la phng tien e o moi lien quan theo tng noi dung nghien cu cua khach the cu the. ac trng cua moi thang o vi t cach mot phng tien e o eu cha ba yeu to: o dai, so o va ch so.

o dai cua thang o thng co cc ai va cc tieu, v du: khoang cach ve mc lng (t mc lng thap nhat en mc lng cao nhat), ve trnh o hoc van (t trnh o thap nhat en trnh o cao nhat), So o cua thang o la nhng ai lng tng oi hay nhng n v phan chia o dai cua thang e xac nh v tr cua moi khach the co ac tnh xa hoi can nghien cu. Nhng ai lng tng oi hay cac n v o co the la nh nhau hoac khong nh nhau, co the la con so tuyet oi nhng cung co nhng so o ch co tnh chat tng oi : nhieu hn, t hn, yeu hn, manh hn, Ch so la mot ch tieu so lng nao o xac nh v tr cua oi tng ieu tra hay tap hp cua cac oi tng ieu tra theo mot dau hieu nao o tren thang. No co the la con so tuyet oi nh mc thu nhap bnh quan/thang: 500.000 ong/thang,

Cac loai thang o1-Thang nh danh (nominal Scale) Thang nh danh la loai thang o n gian. No the hien

s phan nh nhng bien dang cua mot dau hieu nao o.

2- Thang th t (ordinal Scale) thang o th t cac bien the cua mot dau hieu (ch bao) nao o c xep bac theo mc o tang dan hoac giam dan the hien s hn kem cua cac thang bac o,

3- Thang khoang cach(interval Scale) Thang khoang cach Thang khoang cach la mot dang ac biet cua thang th t. Cac bien the cua mot hien tng xa hoi nao o cung c xep theo th t va no con cho biet khoang cach eu nhau gia cac bien the o. V du: Thang o nhiet o dung n v o cokhoang cach giong nhau tai bat ky iem nao tren thang o, nen khoang cach gia 5 va 6 o bang vi khoang cach gia 9 va 10 o.

4-Thang ty le (ratio Scale)

Thang ty le co tat ca ac tnh khoang cach va th t cua thang khoang cach. Ngoai ra, v co iem 0 c xac nh mot cach co y ngha, nen phep toan chia (ty so) co the thc hien c Thc te tren may Thang (khoang cach(interval measurement) va Thang ( ty le (ratio measurement) dung chung (Scale) dung cho bien nh lng,

Moi lien he D lieu va thang oD liu

nh tnh

nh lng

Thang nh danh

Thanh Th bc

Thng khong cch

Thang t l

Chng 3: MA HOA VA NHAP D LIEU I. Chuan b d lieu Trong viec chuan b d lieu, viec tien oan trc nhng d lieu nao la can thiet a vao x ly va phan tch la mot bc quan trong. Neu d lieu b cat xen mot cach tuy tien th co the dan en tnh trang la khi x ly mi thay d lieu o la can thiet. Khi ay viec bo sung d lieu se rat phc tap, ong thi co the hao ton thi gian va tien bac, viec chuan b d lieu thc hien cac van e:

Giai oan nay gom 2 bc: Bc 1: Tien hanh xem xet mot cach ky lng cac phng phap va bien phap kiem tra chat lng c s dung e thu nhan cac d lieu. Bc 2: Tien hanh ky cac bang cau hoi a c tra li va nhng ch dan ve thu tuc phong van e phat hien ra nhng nguyen nhan dan en nhng sai sot.

1.1 Kiem tra tnh hp le d lieu (Validate data)

2 Hieu chnh d lieu

Hieu chnh d lieu gom 2 phan

Hieu chnh d lieu tai cho khi thu nhan d lieuCac nguyen nhan gay nham lan trong nghien cu thc a la: Sai lam do chon oi tng. Sai lam do khong thc hien ay u. Sai lech do khong tra li. Sai sot do giao tiep gia ngi phong van va ngi c phong van. Nhng sai sot luc ghi nhan. S gia mao.

Hieu chnh d lieu khi cac bang d lieu c tap hp lai

Nhng cuoc phong van gia tao. Nhng cau tra li khong ay u. Nhng cau tra li thieu nhat quan. Nhng cau tra li khong thch hp. Nhng cau tra li khong oc c

Co 3 cach c s dung khi x ly cac sai lam neu tren la:

Gap oi tng tra li bang cau hoi e lam sang to van e. Suy luan t cac cau tra li khac. Loai bo toan bo ban cau hoi.

3- Ma hoa d lieu Ma hoa d lieu la qua trnh lien quan en viec nhan dien phan loai moi cau tra li tren mot ky hieu ch nh. ay la mot bc quan trong v viec ma hoa d lieu ung an, hp ly se giup cho may tnh de dang oc c d lieu va x ly chung theo yeu cau cua chung ta

3.1 Cau truc d lieu

Moi ban cau hoi c ma hoa thanh mot mau tin (record hoac case)tng ng vi mot dong. Moi cau tra li cho mot cau hoi c goi la trng tin (field) hoac bien so (variable). Mot cau hoi co the tao ra mot trng tin hay nhieu trng tin tuy theo o la cau hoi mot ap ng (single response) hay co nhieu ap ng (multi response). Trng tin la mot tap hp cac ky t (ky t so, ky t ch) tng trng mot thong tin c tra li.

3.2 Thu tuc ma hoa d lieu

Quyet nh moi cau hoi se tao ra bao nhieu trng tin. Quyet nh cac gia tr (so, ky t, chieu dai) ma cac trng tin co the nhan e bieu dien thong tin tng ng vi cac tra li cua tng cau hoi. Cach x ly vi cac cau hoi co nhieu trng tin

Ma hoa trc la viec quyet nh thu tuc ma hoa ngay khi thiet ke bang cau hoi, do o ta co the in cac ma so (code) ngay trong bang cau hoi. Hnh thc ma hoa nay thch hp vi nhng cau hoi thuoc ve dang luan ly (ch chon 1 trong 2 cach tra li) hoac dang chon mot trong cac cau tra li san (dang cau hoi ong).

3.3

Nguyen tac ma hoa d lieu

So gia tr ma hoa thch hp: So gia tr ma hoa phai u ln e co the bieu dien het cac iem khac biet trong d lieu.: c xep trong cung gia tr ma hoa phai tng t nhau ve ac trng nghien cu, va ngc lai, nhng thong tin tra li c xep cac gia tr ma hoa khac nhau phai co s khac biet ve ac trng ang nghien cu en mc u e co the phan loai. Nguyen tac loai tr gia cac gia tr ma hoa: Cac gia tr ma hoa khong c chong cheo len nhau, va chung ta phai xac nh nh the nao e bat c tnh huong tra li nao cung ch c xep vao mot gia tr ma hoa ma thoi. Nguyen tac toan dien: Cau truc cua cac gia tr ma hoa phai c bao quat tat ca cac tnh huong tra li nham bao am chung c ma hoa. Nguyen tac ong kn: Nhng khoang cach, va cac khoang cach lp nay nen co o rong tng ng th tot hn la khac nhau. Nguyen tac nh iem gia cua nhng khoang cach lp: Neu oi vi nhng cau hoi ma khi tra li ngi ta hay lam tron so th nhng khoang cach lp can c thiet ke sao cho nhng con so can c lam tron (ln hn) ri vao iem gia cua khoang cach lp

3.4 Lap danh ba ma hoa

Chc nang cua danh ba ma hoa la: Giup ngi lam cong viec ma hoa thc hien viec bien oi t mot cau tra li ra mot ma hieu thch hp ma may tnh oc va hieu c. Giup nha nghien cu nhan dien c cac bien so ma ho muon s dung trong qua trnh phan tch thong ke. Bang phan tch ma may tnh in ra sau o se giup nha nghien cu nhan dien c cac loai bien so. Cac cot cua danh ba ma hoa thong thng gom co: So th t cua cau hoi. Van e cua cau hoi (thng la tom tat noi dung cau hoi). Ten cua trng tin (bien so) phat sinh t cau hoi. V tr cua bien so trong mau tin (theo so byte) cho biet o dai cua gia tr ma hoa. Nhan cua bien so (variable label) thng c dung e lam ro y nghia cua ten bien so do ten bien so thng b han che ve chieu dai (Cot nay khong bat buoc). Cac gia tr ma hoa: la cac gia tr ma bien so co the nhan c e bieu dien thong tin c tra li. Nhan gia tr ma hoa (value label) thng dung e mieu ta y ngha cua cac gia tr ma hoa

4- Tao tap d lieu mi Ca so Data Editor co dang nh bang tnh (Excel ,Quattro... ), giup ta tao mi/sa oi mot tap tin d lieu dang SPSS chung mot cach de dang. Mot so iem can lu y sau ay: Moi dong tng ng vi 1 quan sat hay vi mot bang phong van. Moi cot la mot bien so ac trng cho mot tnh chat c o lng. Thong thng moi cau hoi tng ng mot cot, nhng cung co nhieu cau hoi lam phat sinh nhieu bien se c cha trong nhieu cot. Moi o (giao iem cua dong va cot ) cha mot ga tr duy nhat cua mot bien oi vi mot quan sat (hoac mot bang phong van). O ch cha gia tr d lieu ch khong the cha c cong thc nh trong cac chng trnh bang tnh. Tap tin d lieu co dang hnh ch nhat. Kch thc tap tin d lieu c xac nh bi so quan sat va so bien. Vi SPSS khong co o trong trong pham vi cua tap tin d lieu. Vi cac bien kieu so, cac o trong c xem la gia tr system-missing va se co nhieu cach x ly chung ma chung ta cha e cap.

4.1 nh ngha bien ( to bin) a/ Ten bien Ten mac nh cua mot bien mi la varxxxxx vi xxxxx la mot so gom 5 ch so tnh t 00001. e thay oi ten bien, ta go ten mi vao hop Variable Name theo cac quy c sau ay: Ten phai bat au bang mot ch cai va khong c ket thuc bang mot dau cham (period). Khong nen dung dau gach di (underscore) e ket thuc ten bien. Ten khong c qua 8 ky t. Ten khong c cha khoang trang va cac ky t ac biet nh !,?,*. Ten bien khong c trung nhau. Ten bien khong phan biet ch thng va ch hoa. Cac t khoa sau ay khong c dung lam ten bien

b/ Loai bien

SPSS mac nh loai bien mi la kieu so (numeric)

e thay oi loai bien, an vao t m hop thoai Variable Type. Chung ta co the dung cac loai bien sau ay: Numeric: go vao o Width o rong cua so ln nhat ke ca dau thap phan, go vao o Decimal Places so ch so thap phan muon hien th. o rong toi a cua bien kieu so la 40 va toi a la 16 ch so thap phan. Comma: tng t loai Numeric nhng ke them cac dau phay phan cach hang nghn, va dau thap phan c dung lam dau cham (so thap phan dang My). Dot: Tng t loai Numeric nhng ke them cac dau cham phan cach hang nghn, va dau thap phan c dung la dau phay (so thap phan dang Phap). Scientific notation: hien th so dang khoa hoc. Date: kieu ngay hay gi, chon dang thch hp t danh sach co san. Dollar: dang tien te cua My, co dau $ pha trc so hien th. Custom currency: dang tien te do ngi dung xac nh. String: bien kieu chuoi, neu khong qua 8 ky t goi la sort Strings va c dung trong nhieu thu tuc cua SPSS, ngc lai goi la long Strings va ch c dung gii han trong mot so thu tuc SPSS ma thoi

c/ Nhan cua bien va cua gia tr d lieu Nhan cua bien dai toi a 120 ky t, dung e mo ta gi nh them y ngha cua bien. Nhan cua cac gia tr d lieu dai toi a 60 ky t, dung e mo ta them y ngha cua cac gia tr d lieu. ieu nay ac biet hu ch khi ta dung cac ma so e ai dien cac lp d lieu. Ta an Labels....tren ca so Variable View e a ten nhan va an vao Values m hop thoai Value Labels.

d/ Gan mot nhan: Nhap gia tr vao hop Value ( co the kieu so hay chuoi ). Nhap mot nhan vao hop Value Label. An Add. Sa oi mot nhan: e vet sang tai nhan can sa trong danh sach nhan. Nhap vao gia tr mi hay ten mi. An Change. Xoa mot nhan: e vet sang tai nhan can xoa trong danh sach nhan. An Remove.

e/ Ma hoa lai bien (recoding) Tren thc te, trong nhieu chung ta can ma hoa lai bien: Chung ta khong thch cach ma hoa co san cho mot bien, v du gii tnh c ma hoa la 0 cho nam va 1 cho n. Ban co the thch ma hoa gii tnh la 1 cho n va 2 cho nam. Chung ta co the muon giam so loai khac nhau cua mot bien nh tnh ch con 2 hay 3 loai.

Nhap vao ten bien miNhap vao nhan miXac nhan ten bien mi1234Ma hoa khoang thanh mot gia trGia tr khuyet a c ma hoaMo ta cach ma hoa lai biene ma hoa gia tr khuyet, chon System or User missing va Systemmissing trong hop New Value. Sau o chon Add e ghi lai thay oi nay. Luc o trong ca so Old -> New xuat hien MISSING ->SYSMIS. Khi ma hoa lai bien nh lng thanh bien nh tnh, qua trnh thc hien cung tng t. V du, chung ta hay ma hoa lai bien nh lng age thanh bien nh tnh mi goi la agecat (age in categories). Gia s chung ta muon co nhng nhom tuoi nh sau:

di 25 t 25 en 35 = 2 tren 35

=1

=3

f/ Chon mau d lieu trong SPSS Khi phan tch tap d lieu ban co the ch muon tap trung vao mot tap d lieu con cua toan bo d lieu thu thap c. V du, co the ban ch chu y nhng cau tra li cua nhng oi tng tre hn, hay ch chu y nhng cau tra li cua nhng sinh vien ban thi gian (tai chc). Hoac ban co the muon dung tap con bang cach lay mau d lieu ngau nhien co le do tap d lieu qua ln ma qua trnh x ly lai qua cham, trong moi trng hp SPSS cho phep chung ta chon cac tap d lieu con e phan tch.

Chon mau ngau nhien Chon tat ca cac mau d

lieuChon mau ngau nhienChon phan tram cac trng hpChon so trng hp can trch

Neu tap d lieu cua ban qua ln, thng nen thc hien phan tch tren mot mau d lieu ngau nhien. Phan tch tap d lieu con se nhanh hn, nhat la khi ban muon in nhanh cac ket qua au tien. Cung vay, oi vi mot vai ket xuat, nhng bieu o rac roi ang ke, bao gom hang ngan trng hp se dan en tnh trang hon on lan lon, nhng ban lai muon mot o th ro

Chon tat ca cac mau d lieu

Chon mau ngau nhien

Chon phan tram cac trng hp

Chon so trng hp can trch

Chon theo khoangLoc / xoa mau Cac mau khong c chon (b gach cheo)Bat ky ky thuat phan tch nao thc hien tiep theo se khong ap dung tren cac trng hp b gach cheo (cac trng hp khong chon). e tr ve tap d lieu ay u: Data/Select Cases, chon All cases va OK.

Loc / xoa mau

Chon theo khoang

Cac mau khong c chon (b gach cheo)

Chon mau theo ch nh

Khi phan tch tap d lieu ban co the quan tam en mot tap d lieu con trong toan bo tap d lieu. Tham ch co the ban muon thc hien phan tch cho nhieu tap con va so sanh cac ket qua. Trong SPSS cung cap cho chung ta cong cu chon mau theo ch nh nh sau

Tch 1 Data thnh 2 Data

Vo data -> Spit File

Ni 2 data d liu

Vic ni Data trong SPSS thc hin trng hp: Ni cc bin c cha d liu t 1 Data vo trong data khc Ni d liu ca 2 data cng 1 bng cu hi to 2 phin bn 2 ngi nhp liu

Ni cc bin c cha d liu t 1 Data vo trong data khcT Data -> Merge files -> Add Variables Sau chn Data cha bin cn ni -> chuyn bin cn ni vo khung Excluded Variables -> OK Ta c cc bin mi gm c d liu, cc bin mi to c phn di bng cu hi

Ni d liu ca 2 data cng 1 bng cu hi toT Data -> Merge files -> Add Casses Sau chn Data cha d liu cn ni -> -> OK my t ng ni d liu nhp 2 data li

Mau c chon Mau khong c chon

Kt ni d liu t phn mm khcSPSS c th kt ni ly d liu t cc phm mm khc nh excel, Access, Oracla Trc khi kt ni phi thc hin: 1- Convert font file d liu v b font Vni2- Chnh d liu v ng kiu d liu ca SPSS ( t bit ch d liu dng ngy thng). 3- SPSS c kt ni vi ODBC ( C s d liu m) hoc kt ni thng vi Excel

Kt ni trc tip vi ExcelSPSS c th c d liu trc tip t Excel theo thao tac sau: 1- T SPSS chn File/Open/Data. 2- Chn ni cha File Excel ti mc kiu File chn excel[*.xls]. 3- Chn File Excel cn m -> Open. 4- Chn Read varieble name from the fist now of data ( ly dng tiu u ca Excel lm tn bin trong SPSS) ->Ok

Thao tc kt ni qua ODBC

Bc 1: To mt kt ni ODBC Bc 2: Kt ni c s d liu t SPSS

To mt kt ni ODBC

1- Vo Start/Setting/Control Panel/Admin..Tools/ODBC DataSource 32 bit. Chn Add -> chn Excel, Access, Oracla sau chn Finihs t tn Data Source -> chn Workboot -> chn tp tin lm data Source ->0K

Kt ni c s d liu c t SPSS

T SPSS ->File/Open Database ->New Query -> Chn tp tin to lm Database ->Next. Click v + hin th cc trng tin ca bng. Ko bng hoc tng trng tin qua Retrieve Fields in this order -> Finihs