88
Data Management 連連連 連連連連

Data Management 連賢明 政大財政. 2 統計軟體 一般通用 STATA SAS 個體計量 LIMDEP 高階軟體 MATLAB GAUSS

Embed Size (px)

Citation preview

Page 1: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Data Management

連賢明政大財政

Page 2: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

2

統計軟體

一般通用 STATA SAS

個體計量 LIMDEP

高階軟體 MATLAB GAUSS

Page 3: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

3

STATA 優點

容易上手執行速度快軟體可永久性使用網站建構相當完整

http://www.stata.com/ http://www.ats.ucla.edu/stat/stata/

電腦記憶體要多

Page 4: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Stat/Transfer

將其他檔案格式轉為 STATA 資料檔 Stat/Transfer 可支援的檔案類型

Excel Limdep SAS SPSS Many others

Page 5: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Stat/Transfer

Input File Type : 選取原始資料的檔案類型 File Specification :輸入原始資料檔的路徑 Output File Type :選取欲轉換之檔案類型 File Specification :輸入轉換後資料檔欲儲存

之路徑

Page 6: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Stat/Transfer

Variables 標籤下勾選需要的變數

Page 7: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

STATA 介面

The command window :撰寫程式 The result window :執行程式後之結果 The review window :顯示執行過的程式 The variable window :列出所有變數

Page 8: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

1.1 Read the data

Read the ASCII file infile must provide the variable name, width, and

format Read the excel file

insheet variable names need to be specified

Read the Stata file use c:\regstata\elemapi from the internet

Page 9: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

cd dir use save

Page 10: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 11: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 12: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 13: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 14: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

1.2 Describe the data

Describe the data Data size Observations Variable name Variable type (string, byte, float, etc)

Page 15: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 16: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

直接按 ok

Page 17: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 18: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Variables api00/academic performance of the school acs_k3/the average class size in kindergarten

through 3rd grade meals/the percentage of students receiving

free meals full/the percentage of teachers who have full

teaching credentials

Page 19: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

List All observations Some observations Some variables

Page 20: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 21: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 22: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 23: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 24: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

選取變數

Page 25: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 26: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 27: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Notice the missing values of meals. 

Page 28: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Codebook Number of values Missing values Distribution of values

Page 29: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 30: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

選取變數後按 ok

Page 31: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 32: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

summarize Provide concise information about variables Observations Basic statistics (mean, s.d., min, max) Option: details

Page 33: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 34: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

選取變數後按 ok

Page 35: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 36: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 37: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 38: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 39: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

1.3 Tab the data

Tabulate Tabulate the size of class size

Page 40: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 41: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 42: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 43: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Look at the school and district number to check if they are from the same district

Page 44: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 45: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 46: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 47: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 48: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 49: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 50: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 51: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 52: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

1.4 Graph the data

Use graphs to examine the data Histogram Stem and leaf plot

Page 53: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 54: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 55: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 56: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 57: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 58: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 59: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 60: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

A stem-and-leaf plot would also have helped to identify these observations.  

This plot shows the exact values of the observations, indicating that there were three -21s, two -20s, and one -19.

Page 61: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Quiz 1: do a histogram on full

Page 62: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 63: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 64: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Let's look at the frequency distribution of full to see if we can understand this better. 

The values go from 0.42 to 1.0, then jump to 37 and go up from there. It appears as though some of the percentages are actually entered as proportions, e.g., 0.42 was entered instead of 42 or 0.96 which really should have been 96.

Page 65: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 66: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 67: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 68: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Again, let's see which districts these data came from.

Page 69: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 70: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 71: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 72: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

We note that all 104 observations in which full was less than or equal to one came from district 401. 

Let's count how many observations there are in district 104 using the count command.

Page 73: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 74: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 75: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 76: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Two ways graphs Scatterplot: show the joint distribution of

two variables Let's look at the scatterplot matrix for the

variables:

Page 77: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 78: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 79: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 80: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

api2000

avgclasssizek-3

pctfree

meals

pct fullcredential

400 600 800 1000

-20

0

20

-20 0 20

0

50

100

0 50 100

0.00

50.00

100.00

Page 81: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

Correct the variable mistakes

acs_k3 Replace the negative values into the positive

ones replace acs_k3=-acs_k3 if acs_k3<0

Full Change from the percentage to the proportion replace full=full*100 if full<=1

Page 82: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 83: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 84: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 85: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 86: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 87: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS
Page 88: Data Management 連賢明 政大財政. 2 統計軟體  一般通用 STATA SAS  個體計量 LIMDEP  高階軟體 MATLAB GAUSS

save elemapi2, replace