46
VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC QUN LÝ SLIU Nguyễn Trương Nam Nguyễn Th Linh

QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

  • Upload
    doanh

  • View
    228

  • Download
    0

Embed Size (px)

Citation preview

Page 1: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC

QUẢN LÝ SỐ LIỆU

Nguyễn Trương Nam

Nguyễn Thi Linh

Page 2: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

2

Các bước quản lý số liệu

Thiết kế bộ câu hỏi thu thập số liệu

Thử nghiệm bộ câu hỏi trước khi nhập số liệu

Tạo form nhập liệu (qes, rec, chk)

Nhập số liệu (nhập hai lần)

Kiểm tra số liệu

Kiểm tra lôgíc và tính nhất quán của bộ số liệu

Làm sạch số liệu

+ Frequency (tần số)

+ Cross-tabs

+ Bảng phân bố (các giá tri bất thường)

Lưu trữ

Page 3: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

3

Thiết kế (layout) bộ câu hỏi

Page 4: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Layout bộ câu hỏi

Page 5: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Codebook

Page 6: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Codebook.

Trước khi nhập số liệu cần xây dưng codebook. Mọi quyết đinh vê mã hóa đêu cần đươc ghi lại trên codebook trước khi nhập số liệu; nếu không nguy cơ sai số nhập liệu se tăng lên và có thể xảy ra trường hơp các quyết đinh mã hóa phát sinh trong quá trình nhập số liệu se không đươc ghi lại.

Kiểm tra sư nhất quán của bộ câu hỏi trước khi nhập số liệu. Ví dụ, cách mã hóa số liệu “chữ” phải đươc quyết đinh trước khi nhập số liệu và ghi trên bộ câu hỏi - chứ không phải trong quá trình nhập liệu.

Page 7: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

QUẢN LÝ SỐ LIỆU

BẰNG PHẦN MỀM EPIDATA

Page 8: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Phần mêm Epidata: http://www.epidata.dk/

Chương trình nhỏ, dễ cài đặt, đơn giản và miễn phí, thân thiện với người sử dụng.

Có thể nhập số liệu từ file dạng text (.txt), Stata, dBase.

Có thể xuất số liệu sang các dạng text (.txt), dBase, Excel, Stata, SPSS và SAS.

Phổ biến, và đươc cập nhật thường xuyên.

File qes bộ câu hỏi không đươc vươt quá 999 dòng (nhưng vẫn có cách khắc phục )

Biến chữ không đươc vươt quá 80 ký tư.

Page 9: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Tạo form nhập liệu và check file

Xây dưng qes file dưa trên bộ câu hỏi

Tạo form nhập liệu từ qes file (tạo rec file).

Viết Check file.

Page 10: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Tạo .QES file

Trên thanh công cụ: Chọn 1. Define Data

→ New .QES file.

Trên thanh menu/ chọn File/New.

Sự dụng File có sẵn

◦ Chắc chắn răng file có săn ơ đinh dạng plain text

(.txt)

◦ Mơ file trong epidata và lưu ơ dạng đuôi .qes

Page 11: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Qes file.

Page 12: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Các loại trường phổ biến

Page 13: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Thưc hành:Tạo QES file-Khanhhoa.qes

-------------------------------------------------------------------

Nhap lieu Nha Trang Phu Nu Mai Dam

-------------------------------------------------------------------

{MS} Ma so bo cau hoi........................ ###

{Dis} Huyen ....................................... #

{Date} Ngay phong van....................... <dd/mm/2010>

{TS1} Thoi gian bat dau-gio............... ##

{TS2} Thoi gian bat dau-phut............. ##

{TE1} Thoi gian ket thuc-gio.............. ##

{TE2} Thoi gian ket thuc-phut............ ##

{In} Ten phong van vien...................... <A >

Page 14: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Khanhhoa.qes

------------------------------------------------------------------

PHAN 1: DAC DIEM CHUNG

------------------------------------------------------------------

{C1} Tuoi......................................... ##

{C2} Hoc van................................... #

{C3} Noi sinh................................... <A >

(C4) Thoi gian song tai KH.............. ##

{C5} Dan toc..................................... #

{C5A} Khac.................................. <A >

{C6} Ton giao.................................... #

{C6A} Khac................................... <A >

{C7} Tinh trang hon nhan.................. #

{C7A} Khac.................................... <A >

Page 15: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Khanhhoa.qes ---------------------------------------------------------------------

PHAN 2: DOI SONG TINH DUC

---------------------------------------------------------------------

{C11} Xu huong tinh duc.............................................#

{C11A} Khac............................................................ #

{C12} QHTD lan dau.................................................... ##

{C13} QHTD lan dau voi ai.......................................... #

{C13A} Khac........................................................... <A >

{C14} Co QHTD trong 3 thang................................... ##

{C15} So nguoi QHTD trong 3 thang............................ ###

{C16} Khach hang khong thuong xuyen trong 3 thang. ###

{C17} Su dung BCS voi khach hang k thuong xuyen. . ##

{C18} So khach hang thuong xuyen trong 6 thang……. ###

{C19} Su dung BCS voi khach hang thuong xuyen…..... ##

{C20} Nhan gi khi QHTD voi khach hang....................... #

{C201} Khac................................................................ <A >

Page 16: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Khanhhoa.qes

{C21} Phai tra tien cho ban tinh nam khi QHTD.... #

{C22} O Trung tam 06............................. #

{C23} Noi bat khach.............................. ## Next 00

{C231} Ngoai duong.......................... #

{C232} Nha nghi, khach san.............. #

{C233} Quan Karaoke, cafe............... #

{C234} Hieu massage........................ #

{C235} Bar, vu truong....................... #

{C236} Bia hoi, quan nhau................ #

{C237} Nha chua............................... #

{C238} Tai nha minh.......................... #

{C239} Qua internet........................... #

{C2310} Qua dien thoai..................... ##

{C2311} Khac..................................... <A >

Page 17: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Qes file trên epidata

Page 18: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Tạo file nhập số liệu (rec file)

Trên thanh công cụ, chọn Data in/out- New Data File.

Một hộp thoại se xuất hiện. Trên dòng đầu tiên, bên cạnh “Enter name of .QES file”, nhập tên của file bộ câu hỏi.

Dòng thứ hai trên hộp thoại, bên cạnh “Enter name of data file”, se tư động chứa tên của file nhâp số liệu (với đuôi .rec) mà tương ứng với file bộ câu hỏi .

Page 19: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Ví dụ:Tạo rec file từ ques file (khanhhoa.qes)

Page 20: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Check file giúp hạn chế lỗi khi nhập

liệu Check file chứa các lệnh để kiểm tra hiệu lưc dữ

liệu đươc nhập.

Check file giúp hạn chế các lỗi trong quá trình nhập

liệu.

Check file đươc lưu với đuôi .chk, và phần đầu tên

giống với ques và rec file tương ứng.

Page 21: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Các lệnh kiểm tra thường dùng

Page 22: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Tạo check file – khanhhoa.chk

Sử dụng chế độ interactive

◦ Menu bar – Check – Add/Revised, open

khanhhoa.rec

◦ Sử dụng hộp thoại interactive- khanhhoa.chk

Viết trưc tiếp

◦ File – new – editor – save – khanhhoa.chk

Page 23: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

23

Check file.

Page 24: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Check file.

Page 25: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Viết file check

Sử dụng cả 2 cách interactive (sử dụng hộp

thoại) và viết check file trưc tiếp.

Page 26: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Thưc hành: Viết check file– khanhhoa.chk

Page 27: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Thưc hành: Viết check file– khanhhoa.chk

Page 28: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Nhập số liệu– so sánh số liệu giữa 2 lần nhập

Nhập số liệu hai lần – nên đươc thưc hiện bơi hai

hay hai nhóm các nhập liệu viên

So sánh hai file nhập để tìm ra sư không nhất quán

Kiểm tra bộ câu hỏi gốc và xác đinh file nhập nào

sai

Sửa lỗi ơ cả hai file

So sánh một lần nữa để thấy không còn lỗi.

Page 29: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Documents –/validate duplicate files

Epidata đưa ra báo cáo gồm các lỗi

Page 30: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Page 31: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Page 32: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Page 33: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Page 34: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

So sánh giữa 2 lần nhập liệu

Page 35: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Báo cáo lỗi

Page 36: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Thưc hành

So sánh 2 lần nhập liệu

Khanhhoa files 1 và 2

Page 37: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Kiểm tra tính nhất quán

Kiểm tra tính nhất quán tương tác (interactive) se

đươc thưc hiện trong quá trình nhập liệu băng

check file trong EpiData.

Viết lệnh consistency check

CONSISTENCYBLOCK

REPORT ID

……………….

Page 38: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Kiểm tra tính nhất quán

(Consistency check) CONSISTENCYBLOCK

REPORT ID

MODULE 1

NO MISSING DATA

CODE

Check "Missing HH code" (a101 <>.)

Check "Missing Commune code" (a1061 <>.)

Check "Missing province code" (a1081 <>.)

CHECK "missing ID MEMBER" (M1 <> .)

CHECK "missing ID MEMBER" (M2 <> .) MODULE 2

Check "Main job and kind of job logical" (M203=12) AND (M204=.) OR (M203=1) OR (M203=2) OR (M203=3) OR (M203=4) OR

(M203=5) OR (M203=6) OR (M203=7) OR (M203=8) OR (M203=9)OR (M203=10) OR (M203=11)

Check "Remunerated for main job and decision maker logical" (m207=4) and (m208=.) and (m210=.) or (m207=1) or

(m207=2) or (m207=3)

Page 39: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Consistency check

Chạy consistency check

Menu bar - Documents – consistency check

Xác đinh file số liệu và consistency check

file

Epidata đưa ra lỗi không nhất quán

Page 40: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Consistency check

Page 41: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Consistency report

Consistency checks for D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU

4 TINH SAU VALIDATE_14 SEP\FINAL_4 TINH_4036\P1_4036_FINAL.rec

Based on D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU 4 TINH SAU

VALIDATE_14 SEP\CHECK FILE_Update_Sep 19\Part 1_OK_Linh_Sep 19.chk

18 Sep 2010 13:50

Records identified by field id

Records where id = missing indicated as (## record number)

Missing HH code

(a101 <>.)

No failures.

missing ID MEMBER

(M5 <> .)

Consistency checks failed for id = 41077, 42057

Main job and kind of job logical

(M203=12) AND (M204=.) OR (m203=.) or (M203=1) OR (M203=2) OR (M203=3) OR

(M203=4) OR (M203=5) OR (M203=6) OR (M203=7) OR (M203=8) OR (M203=9)OR

(M203=10) OR (M203=11)

Consistency checks failed for id = 31046, 33115, 28020,

13077

Page 42: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Gộp/nối các file số liệu

Menu bar

Data in/out – append/merge

Page 43: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Gộp/nối các files số liệu

Page 44: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Xuất số liệu từ epidata

Menu bar

Export – SPSS or Stata or SAS

Page 45: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Xuất số liệu

Page 46: QUẢN LÝ SỐ LIỆ U - thongke.info.vnthongke.info.vn/.../1/ISMS_Quanly_Solieu_Epidata_Viet.pdf · 2 Các bước quản lý số liệu Thiết kế bộ câu hỏi thu thập

Kiểm tra và làm sạch số liệu

Chạy tần số và kiểm tra các giá tri missing

Kiểm tra tính nhất quán giữa các biến

Kiểm tra các giá tri bất thường