Upload
others
View
62
Download
4
Embed Size (px)
Citation preview
MateriPengertian Korelasi dan Regresi
Analisis Korelasi
Analisis Regresi Linier
Korelasi dalam Regresi Linier Berganda
Pengujian Model Regresi Berganda
Asumsi dan Pelanggaran Asumsi Klasik
Analisis Regresi Logistik
Pengertian Korelasi dan Regresi
VS
Ada hubungan gaji dan pendidikan ???
Ada hubungan gaji dan jenis kelamin ???
hubungan gaji dan pendidikan = korelasi Y dan X1
hubungan gaji dan jenis kelamin = korelasi Y dan X2
Variabel
Variabel
Variabel
Korelasi = hubungan antar 2 variabel
Aktifitas kehidupan manusia
SEBABJIKA
• MENDUNG
• PACEKLIK
• MISKIN
• TIDAK BER-KB
• KEKERINGAN
• TIKET PESAWAT MURAH
AKIBATMAKA
• HUJAN
• HARGA NAIK
• PENYAKIT
• BANYAK ANAK
• PRODUKSI TURUN
• ORANG NAIK PESAWAT
Pendidikan memengaruhi gaji ???, berapa besar pengaruhnya???
Jenis kelamin memengaruhi gaji???, berapa besar pengaruhnya???
X 1 lebih besar Y lebih besar
X2 laki-laki Y lebih besar
Y = β0 + 1X1 + 2X2 +
Yi = β0 + 1X1i + 2X2i + i i = 1, 2, …, n
OLSYi = b0 + b1X1i + b2X2i i = 1, 2, …, n
Analisis Korelasi
. . ..
..
... .
.
..
..
.. ..
.
Positif (r > 0) Negatif (r < 0)
Tidak ada korelasi (r
= 0)Tidak ada korelasi (r
= 0)
Positif kuat (r = 0.8)
Positif lemah (r = 0.4)
Koefisien Korelasi
i X Y X2 Y2 XY
1 X1 Y1 X12 Y1
2 X1Y1
2 X2 Y2 X22 Y2
2 X2Y2
3 X3 Y3 X32 Y3
2 X3Y3
… … … … … …
n Xn Yn Xn2 Yn
2 XnYn
X Y X2 Y2 XY
i X =Harga
(Juta Rp)
Y = Demand
(ton)X2 Y2 XY
1 8 3 64 9 24
2 7 4 49 16 28
3 7 5 49 25 35
4 7 6 49 36 42
5 6 6 36 36 36
6 6 7 36 49 42
7 6 8 36 64 48
8 6 9 36 81 54
9 5 10 25 100 50
10 5 10 25 100 50
X Y X2 Y2 XY
63 68 405 516 409
= -0.93106
Interpretasi… ?
i X1 X2 Y
1 X11 X21 Y1
2 X12 X22 Y2
3 X13 X23 Y3
… … … …
n X1n X2n Yn
X1 X2 Y
i X1 =Harga
(Juta Rp)
X2 = Income
(Juta Rp)
Y = Demand
(ton)
1 8 10 3
2 7 10 4
3 7 8 5
4 7 5 6
5 6 4 6
6 6 3 7
7 6 2 8
8 6 2 9
9 5 1 10
10 5 1 10
X1 X2 Y
63 46 68
rYX1 = -0.931
rYX2 = -0.951
rX1X2= 0.901
rYX2.X1 = -0.71
rYX1.X2 = -0.55
rX1X2.Y = 0.143
Interpretasi???
Koefisien korelasi Kekuatan Hubungan
0,00 Tidak ada hubungan
0,01 – 0,09 Hubungan kurang berarti
0,10 – 0,29 Hubungan lemah
0,30 – 0,49 Hubungan moderat
0,50 – 0,69 Hubungan kuat
0,70 – 0,89 Hubungan sangat kuat
> 0,90 Hubungan mendekati sempurna
(VERSI DE VAUS)
Koefisien korelasi Kekuatan Hubungan
0 Zero
0,1 – 0,3 Weak
0,4 – 0,6 Moderate
0,7 – 0,9 Strong
1 Perfect
(VERSI DANCEY AND REIDY)
Analisis Regresi Linier
Survey upah dan pendidikan terhadap 100 responden
GAJI (juta Rp)
oo
oo
oo
o
DIDIK (tahun)12 20
20
15
oo
o
o
o
o
o
o
o
o
o
o
oo
o
GAJI = α + DIDIK
α
> 0 hubungan +
ESTIMASI REGRESI
GAJI (juta Rp)
oo
oo
oo
o
DIDIK (tahun)12 20
25
17
oo
o
o
o
o
o
o
o
o
o
o
oo
o
GAJI = 5 + 1 DIDIK
5
1
Untuk setiap penambahan
lama pendidikan 1 tahun, gaji
meningkat 1 () juta rupiah per
bulan
Jika pendidikan = 0, gaji
sebesar 5 (α) juta rupiah per
bulan
RESIDUAL
GAJI (juta Rp)
oo
oo
oo
o
DIDIK (tahun)12
17
oo
o
o
o
o
o
o
o
o
o
o
oo
o
20} 3
GAJI = α + DIDIK +
Faktor-faktor lain yang
mempengaruhi gaji tetapi
tidak ada dalam model
Regresi Linier
Sederhana Y = a + bX
Berganda Y = b0 + b1X1 + b2X2 + … + bkkXk
• Dependent variable
• Explained variable
• Predictand
• Regressand
• Response variable
Y
• Independent variable
• Explanatory variable
• Predictor
• Regressor
• Stimulus atau control variable
X
Variabel dalam regresi linier
Y = a + bXY = variabel dependentX = variabel independenta = intersepb = slope
Persamaan matematik
Yi = α + Xi + i
Y = variabel dependentX = variabel independentα = parameter populasi = parameter populasi
Persamaan regresi
Yi = a + bXi
Y = variabel dependentX = variabel independenta = koefisien regresib = koefisien regresi
Estimasi
Berapa a dan b ?
i X =Harga
(Juta Rp)
Y = Demand
(ton)
1 8 3
2 7 4
3 7 5
4 7 6
5 6 6
6 6 7
7 6 8
8 6 9
9 5 10
10 5 10
0
2
4
6
8
10
12
0 2 4 6 8 10
SUMMARY
OUTPUT
Regression Statistics
Multiple R 0.93
R Square 0.87
Adjusted R
Square 0.85
Standard Error 0.94
Observations 10
ANOVA
df SS MS F Signif F
Regression 1 46.5 46.5 52.1 9.1E-05
Residual 8 7.1 0.9
Total 9 53.6
Coefficients
Standard
Error t Stat P-value
Intercept 21.9 2.1 10.4 0.0
X Variable 1 -2.4 0.3 -7.2 0.0
Y = 21.9 – 2.4X Interpretasi
Yi = + Xi + i i = 1, 2, …, 10
OLS
Investasi
Suku bunga IHS Inflasi Politik
Investasi = 0 + 1(suku bunga) + 2(IHS) + 3(Inflasi) + 4(Politik) +
Y = 0 + 1X1 + 2X2 + 3X3 + 4X4 +
Yi = 0 + 1X1i + 2X2i + 3X3i + 4X4i + i i = 1, 2, …, n
n observasi
OLS
Yi = b0 + b1X1i + b2X2i + b3X3i + b4X4i
Bentuk umum Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n
Pengeluaran ruta barang tahan lama
(juta Rp)
Pendapatan
(juta Rp)
Jumlah ART
(orang)
Y = 3,92 + 2,50X1 - 0,48X2
b0 b1 b2
Interpretasi:
b0 = 3,02 besarnya pengeluaran barang tahan lama jika tidak ada pendapatan dan ART
adalah 3,02 juta rupiah
b1 = 2,50 kenaikan pendapatan 1 juta rupiah sedangkan jumlah ART tetap
meningkatkan pengeluaran bahan tahan lama 2,50 juta rupiah
b2 = - 0,48 bertambahnya jumlah ART satu orang menurunkan pengeluaran barang
tahan lama 0,48 juta rupiah
Y = b0 + b1 X1 + b2 X2
n
XbXbYb
2211
0
YXYXnA 11
2
2
2
2 )( XXnB
2121 XXXXnC
YXYXnD 22
2
1
2
1 )( XXnE
2CEBF
F
CDABb
1
F
ACDEb
2
i X1 X2 Y X1Y X2Y X12 X2
2 X1X2
1 8 10 3 24 30 64 100 80
2 7 10 4 28 40 49 100 70
3 7 8 5 35 40 49 64 56
4 7 5 6 42 30 49 25 35
5 6 4 6 36 24 36 16 24
6 6 3 7 42 21 36 9 18
7 6 2 8 48 16 36 4 12
8 6 2 9 54 18 36 4 12
9 5 1 10 50 10 25 1 5
10 5 1 10 50 10 25 1 5
X1 X2 Y X1Y X2Y X1
2 X22 X1X2
63 46 68 409 239 405 324 317
b0 = 15,086 b1 = -1,015 b2 = -0,41
Y = 15,086 – 1,015 X1 – 0,41X2
PetaniPupuk = X1
(kg)Pestisida = X2
(gram)Jagung = Y
(kg)
1 5 3 44
2 10 4 49
3 12 4 59
4 13 5 60
5 18 10 67
6 24 11 70
7 29 15 80
8 32 16 85
9 37 18 87
10 40 24 89
1. Buat estimasi persamaan regresi Y dan X1
2. Buat estimasi persamaan regresi Y, X1, dan X2
3. Dengan menggunakan persamaan regresi no (2) berapa jumlahpanen jagung jika menggunakan pupuk 10 kg/are dan pestisida 5 gram/are
Korelasi dalam RegresiLinier Berganda
1. Ukuran statistik yang menunjukkan seberapa besarkemampuan semua variabel bebas dalam menjelaskanvariabilitas variabel terikat
2. Ukuran statistik yang menunjukkan berapa banyak variasidalam data dapat dijelaskan oleh model regresi yang dibangun
2
2
2
)(
)ˆ(11
YY
YY
SST
SSER
0 ≤ R2 ≤ 1R2 ↑: kemampuan X menjelaskan variabilitas Y semakin baik
X semakin banyak R2 ↑
2
22112
i
iiii
Y
YXbYXbR
KOEFISIEN DETERMINASI
i] X1 X2 Y X1Y X2Y X12 X2
2 X1X2
1 8 10 3 24 30 64 100 80
2 7 10 4 28 40 49 100 70
3 7 8 5 35 40 49 64 56
4 7 5 6 42 30 49 25 35
5 6 4 6 36 24 36 16 24
6 6 3 7 42 21 36 9 18
7 6 2 8 48 16 36 4 12
8 6 2 9 54 18 36 4 12
9 5 1 10 50 10 25 1 5
10 5 1 10 50 10 25 1 5
X1 X2 Y X1Y X2Y X1
2 X22 X1X2
63 46 68 409 239 405 324 317
b0 = 15,086
b1 = -1,015
b2 = -0,41
932,06,53
)8,73)(41,0()4,19)(015,1(2
22112
i
iiii
y
yxbyxbR
Ukuran statistik yang menunjukkan seberapa besar
kemampuan faktor-faktor selain variabel bebas
dalam menjelaskan variabilitas variabel terikat
Koefisien non-determinasi = 1 – R2
2. KOEFISIEN NON-DETERMINASI
Untuk mengukur hubungan linier antara variabeltak bebas Y dengan variabel bebas X1, X2, …, Xk
r = √R2 ; -1 ≤ r ≤ 1
KOEFISIEN KORELASI LINIER BERGANDA
Petunjuk
1. Tugas individu
2. Gunakan data sekunder dari www.bps.go.id
3. Buat model regresi linier berganda dengan 2 – 3 variabel
bebas
4. Interpretasikan hasilnya
STUDI KASUS
Pengujian Model RegresiBerganda
• Untuk menguji apakah masing-masing X1, X2, …, dan Xk berpengaruhsignifikan (nyata) pada Y
• Uji –t dengan statistik uji student-t (by William Sealy Gosset)
• Langkah-langkah uji parsial
1. Tentukan hipotesis H0: j = 0H1: j 0 ; j = 1, 2, …, k
2. Tentukan daerah kritis (daerah penolakan H0)
Tabel-t dengan df = n-(k+1)
3. Hitung t-hitung
4. Tentukan Keputusan
Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n
Y = b0 + b1X1 + b2X2 + … + bkXk
UJI SIGNIFIKANSI PARSIAL
• Untuk menguji apakah X1, X2, …, dan Xk secara bersama-sama(simultan) berpengaruh signifikan (nyata) pada Y
• Uji –F dengan statistik uji F
• Langkah-langkah uji simultan
1. Tentukan hipotesis H0: 1 = 2 = ….. = k = 0H1: minimal ada 1 j 0 ; j = 1, 2, …, k
2. Tentukan daerah kritis (daerah penolakan H0)
Tabel F dengan df pembilang = (k-1) dan df penyebut = (n-k)
3. Hitung F-hitung F = {R2/(k-1)} / {(1-R2)/(n-k)}
R2 = koefisien determinasi
4. Tentukan Keputusan
Yi = 0 + 1X1i + 2X2i + … + kXki + i i = 1, 2, …, n
Y = b0 + b1X1 + b2X2 + … + bkXk
UJI SIGNIFIKANSI SIMULTAN
• Untuk menguji apakah r berada cukup jauh dari suatu nilaitertentu 0 sebagai alasan untuk menolak H0 bahwa = 0
• Langkah-langkah pengujian
1. Tentukan hipotesis
2 arah: H0: = 0 (tidak ada korelasi linier)
H1: 0 (ada korelasi linier)
1 arah: H0: = 0 (tidak ada korelasi linier)
H1: > 0 (ada korelasi inier positif)
atau H0: = 0 (tidak ada korelasi linier)
H1: < 0 (ada korelasi linier negatif)
2. Tentukan daerah kritis (daerah penolakan H0)
Tabel-t dengan df = n-(k+1)
3. Hitung t-hitung t = (|R|(n-k-1))/(1-R2)
4. Tentukan Keputusan
UJI KOEFISIEN KORELASI
Asumsi dan PelanggaranAsumsi Klasik
Multikolinieritas
Heteroskedastisitas
Normalitas
Autokorelasi
ASUMSI KLASIK
• Untuk mengukur tingkat asosiasi (keeratan) hubungan ataupengaruh antar variabel bebas melalui koefisien korelasi (r)
• Beberapa pendapat:
jika r > 0,60
jika 0,5 < r < 0,90
• Statistik yang digunakan
• Nilai tolerance besarnya tingkat kesalahan yang dibenarkan secara statistik > 0,1 (tidak terjadi multikol)
• Nilai VIF faktor inflasi penyimpangan baku kuadrat < 10,0 (tidak terjadi multikol)
MULTIKOLINIERITAS
Hasil uji F signifikan Hasil uji t tidak signifikan
R2 besar Hasil uji t tidak signifikan
rYX1.X2 > R2 rYX2.X1 > R2 rX1X2.Y > R2
DETEKSI MULTIKOLINIERITAS
Untuk menguji ada tidaknya multikolinearitas, kita dapatmenggunakan nilai Toleransi atau VIF (Variance Inflation Factor), dengan rumus sebagai berikut :
Jika nilai Toleransi kurang dari 0,1 atau nilai VIF melebihi 10maka hal tersebut menunjukkan bahwa multikolinearitas adalahmasalah yang pasti terjadi antar variabel bebas.
• Nilai varians residu (error) tidak sama atau hetero
• Sering terjadi pada data CS (Cross Section)
• Deteksi:
• Metode grafik pola error data
• Uji korelasi rank spearman
HETEROSKEDASTISITAS
• Terjadi korelasi antar observasi (antar residu)
• Terjadi pada data TS
• Deteksi:
• Grafik
• Uji DW (Durbin Watson)
AUTOKORELASI
Analisis Regresi Logistik
• Analisis regresi dengan variabel dependen dikotomi
• Tidak ada asumsi hubungan linier antara variabel dependen dan independen
• Model:
log(p/(1-p)) = 0 + 1X1 + 2X2 + ... + kXk
p = p(Y=1)
• Interpretasi koefisien:
• Menjelaskan hub fungsional variabel dependen dan independen
• Menentukan unit perubahan setiap variabel bebas
• Mendapatkan nilai odds ratio (rasio peluang) yang menunjukkan perbandingkan tingkat kecenderungan kedua kategori dalam satu variabel bebas
PENGERTIAN
• Regresi logistik menghasilkan odds ratio (rasio peluang) terkait nilai setiap prediktor
• Odds (peluang) suatu kegiatan adalah: probabilitas hasil yang muncul dibagi probabiltias kejadian yang tidak terjadi
• Odds ratio adalah: sekumpulan peluang yang dibagi dengan peluang lainnya
• Odds ratio = exp(j) : resiko terjadinya peristiwa y=1 pada kategori xj = 1 adalah sebesar exp(j)
• Odds ratio juga digunakan untuk menunjukkan kecenderungan hubungan suatu variabel X dan Y
Petunjuk
1. Tugas individu2. Gunakan data sekunder dari instansi masing-masing3. Buat model regresi linier berganda dengan 2 – 3 variabel bebas4. Uji Asumsi5. Interpretasikan hasilnya6. Hasil studi kasus dibuat semacam laporan dengan format:
Bab I. Pendahuluan meliputi materi pembelajaran;Bab II Studi Kasus meliputi Gambaran Data, Langkah Kerja;Bab III. Pembahasan meliputi Hasil Analisis (Deskriptif, Korelasi,Regresi)Bab IV. Kesimpulan
STUDI KASUS
TERIMA KASIH