Upload
phamkhue
View
234
Download
0
Embed Size (px)
Citation preview
Analisis Regresi 2
Pokok Bahasan :
TUJUAN INSTRUKSIONAL KHUSUS :Mahasiswa dapat menjelaskan adanya multikolinieritas pada regresi
linier berganda serta prosedur penanganannya
Multikolinier &
penanganannya
Regresi linear berganda:Dalam notasi matriks
Y = X β + ε
DenganY = vektor peubah tak bebas (nx1)X = matriks peubah bebas (nxk)β = vektor penduga parameter (kx1)ε = vektor sisaan/galat (nx1)
εi menyebar saling bebas mengikuti sebaran normal (0.σ2)εi memiliki ragam homogenTidak adanya hubungan antar peubah X ( E(Xi,Xj) = 0, untuk semua i ≠ j ) atau sering disebut tidak ada masalah kolinearεi bebas terhadap peubah X
Beberapa asumsi yang mendasari
model tersebut adalah :
Muncul ketika adanya korelasi diantara peubah bebas yang dapat mempengaruhi ragam dari penduga kuadrat
terkecil dan pendugaan model yang dibuat. (Wetherhill,1986)
Apabila terdapat masalah multikolinear pada model regresi berganda, maka matriks X’X akan memiliki sifat kondisi buruk (ill-conditioned) atau hampir singular yang pada
akhirnya akan menyebabkan dugaan bagi memiliki dugaan ragam yang menduga lebih (overestimate) walaupun tetap
takbias.
MULTIKOLINEARITAS
1.Semua variabel dilibatkan dengan nilai VIF >102.Uji parsial-t mengindikasikan terima Ho (model tidak nyata)3.Uji-F mengindikasikan tolak Ho (model nyata)4.Rsq(adj) bernilai tinggi5.Adanya korelasi antara peubah bebasKetidaksesuaian hubungan antara peubah bebas dan peubah respon berdasarkan teori dan hasil.
Indikasi adanya multikolinearitas
1. Condition Index (CI) atau Indeks Kondisi Dilakukan dengan mengukur
perubahan akar ciri yang umum, yaitu:
n = √( λmax / λmin )
Jika n>30 maka menandakan derajat multikolinearitas yang tinggi
Selain itu, cara mendeteksi adanya
multikolinearitas melalui nilai:
2. Multikolinearitas Index (MCI) (Thisted,1980)
MCI =
Dengan:m = nilai eigen (akar ciri) minimal1 = nilai eigen (akar ciri) dari matriks Bila MCI mendekati 1 Multikolinearitas tinggiBila MCI mendekati 3 Peubah saling bebas
p
x
m
1
2
1
3. Variance Inflation Factor (VIF)dengan
VIFi = 1/(1-Ri²)Ri² = koefisien determinasi ganda bila Xi diregresikan terhadap semua peubah bebas lainnya.Nilai VIF yang lebih besar dari 10 menunjukkan adanya kolinearitas(Myers,1990).
Membuang peubah bebas yang mempunyai korelasitinggi terhadap peubah bebas lainnya.Menambah data pengamatan/contoh.Melakukan transformasi terhadap peubah-peubah
bebas yang mempunyai kolinearitas atau menggabungkan menjadi peubah-peubah bebas baru yang lebih berarti. Menggunakan regresi Gulud, regresi
kuadrat terkecil parsial dan Regresi Komponen Utama (principal component regression).
Cara dan pendekatan yang dilakukan
untuk mengatasi masalah
multikolinearitas, seperti:
REGRESI KOMPONEN UTAMA
(PRINCIPAL COMPONENT REGRESSION)
Regresi Komponen Utama ( Principal Component Regression)
Analisis komponen utama pada dasarnya mentransformasi peubah-peubah bebas yang berkorelasi menjadi peubah-peubah baru yang ortogonal dan tidak
berkorelasi. Analisis ini bertujuan untuk menyederhanakan peubah-peubah yang diamati dengan cara mereduksi dimensinya. Hal ini dilakukan dengan menghilangkan
korelasi di antara peubah melalui transformasi peubah asal ke peubah baru (komponen utama) yang tidak berkorelasi
(Gesperz, 1995).
Tahapan-tahapan yang dilakukan dalam analisis regresi komponen utama adalah:
1.Membakukan peubah bebas asal yaitu X menjadi Z.2.Mencari akar ciri dan vektor ciri dari matriks R.3.Menentukan persamaan komponen utama dari vektor ciri.4.Meregresikan peubah respon Y terhadap skor komponen utama W.5.Transformasi balik.
Biasanya tidak semua W digunakan. Morrison (1978) menyarankan agar memilih komponen-komponen utama sampai komponen-komponen utama tersebut mempunyai keragaman kumulatif 75 %, namun
sebagian ahli menyarankan agar memilih komponen utama yang mempunyai akar ciri lebih dari satu, karena jika akar
ciri kurang dari satu, keragaman data yang dapat diterangkan kecil sekali.
Berdasarkan teori dan konsep ekonomi, variabel-variabel yang mempengaruhi penawaran ekspor TPT Indonesiaadalah sebagai berikut:Y = Volume ekspor TPT (Tekstil dan Produk Tekstil) (kg)X1 = Pendapatan per kapita (dolar)X2 = Upah tenaga kerja (dolar)X3 = Harga ekspor TPT pada (dolar/kg)X4 = Indeks persepsi korupsi Indonesia (CPI)X5 = Nilai tengah kurs rupiah (rupiah/dolar)X6 = Suku bunga kredit investasi (%)
contoh kasus
Y X1 X2 X3 X4 X5 X6
1231259 1221,02 101,518 100,741 6,366 2,31988 0,15
3784049 1252,35 107,148 95,819 7,296 2,82953 0,135
12610093 929,03 49,919 115,86 10,348 6,46352 0,135
16262677 1020,79 64,109 102,191 12,192 4,57276 0,135
19652917 1066,94 106,114 81,993 13,052 3,33007 0,135
26066585 1018,6 159,541 69,089 14,347 3,56899 0,135
54588512 4327,72 164,611 49,617 16,065 2,87178 0,135
84680680 3793,76 139,723 53,641 17,447 3,10394 0,135
1,01E+08 3613,34 140,651 51,051 18,329 3,81087 0,193
1,28E+08 2771,18 87,752 52,635 17,247 4,2792 0,178
1,59E+08 2841,22 96,019 43,769 19,239 3,90727 0,187
2,05E+08 2808,28 93,805 44,101 20,155 3,2182 0,196
2,48E+08 2847,93 78,978 41,936 21,008 4,0113 0,188
3,09E+08 2933,46 80,505 44,015 23,781 4,28146 0,232
4,08E+08 2909,73 77,761 44,048 24,999 3,76041 0,191
5,78E+08 2922,27 99,133 44,405 26,512 4,20033 0,1819
6,9E+08 2959 112,733 36,717 29,096 3,76027 0,1528
7,71E+08 3021,99 144,148 29,589 30,986 2,8298 0,1527
8,26E+08 3096,76 150,796 28,13 33,066 2,40781 0,161
9,71E+08 3057,78 147,18 24,718 35,041 2,23297 0,1741
8,58E+08 933,63 56,405 18,54 37,813 2,25327 0,1833
1,19E+09 820,67 95,347 4,043 76,989 1,69289 0,262
1,58E+09 925,35 136,239 4,773 81,369 2,11452 0,179
1,73E+09 707,91 113,51 4,731 90,048 2,27233 0,1686
1,73E+09 665,66 126,703 3,957 97,379 2,46266 0,179
1,76E+09 795 208,356 3,406 100 2,24986 0,1782
1,65E+09 865,11 223,453 3,754 104,37 2,46344 0,1575
1,63E+09 824,06 200,482 4,019 110,2 2,41005 0,1391
1,8E+09 812,45 183,482 3,774 116,39 2,54001 0,1623
1,88E+09 921,43 211,937 3,642 126,16 2,78449 0,1542
Regression Analysis: Y versus X1, X2, X3, X4, X5, X6 The regression equation isY = 1.36E+09 - 38255 X1 - 1882111 X2 - 7980119 X3 + 12350726 X4 -34507807 X5
- 2.69E+09 X6
Predictor Coef SE Coef T P VIFConstant 1356844891 424915011 3.19 0.004X1 -38255 52547 -0.73 0.474 4.6X2 -1882111 1239485 -1.52 0.143 4.2X3 -7980119 2843555 -2.81 0.010 11.0X4 12350726 2923637 4.22 0.000 15.8X5 -34507807 45042940 -0.77 0.451 2.5X6 -2689286254 1411764071 -1.90 0.069 2.2
S = 153742395 R-Sq = 96.1% R-Sq(adj) = 95.1%
standardized residual
Analysis of Variance
Source DF SS MS F PRegression 6 1.34843E+19 2.24739E+18 95.08 0.000Residual Error 23 5.43645E+17 2.36367E+16Total 29 1.40280E+19
Source DF Seq SSX1 1 3.71673E+18X2 1 4.09562E+18X3 1 5.11166E+18X4 1 4.61654E+17X5 1 1.28943E+16X6 1 8.57703E+16
Unusual Observations
Obs X1 Y Fit SE Fit Residual St Resid20 3058 971167565 653131316 53575981 318036249 2.21R
R denotes an observation with a large
Correlations: X1, X2, X3, X4, X5, X6
X1 X2 X3 X4 X5X2 -0.139
0.465
X3 0.141 -0.5500.458 0.002
X4 -0.566 0.664 -0.8110.001 0.000 0.000
X5 0.257 -0.529 0.651 -0.5530.170 0.003 0.000 0.002
X6 0.098 -0.271 -0.417 0.128 -0.1420.605 0.147 0.022 0.501 0.453
Cell Contents: Pearson correlationP-Value
Hasil pembakuan dari peubah-peubah X i ke ZiZ1 Z2 Z3 Z4 Z5 Z6
-0.62888 -0.50233 1.81149 -0.98524 -0.84248 -0.60552
-0.60209 -0.38325 1.66399 -0.96128 -0.3355 -1.10485
-0.87868 -1.59365 2.26457 -0.88257 3.27946 -1.10485
-0.80018 -1.29354 1.85494 -0.83502 1.3986 -1.10485
-0.7607 -0.40512 1.24969 -0.81284 0.16242 -1.10485
-0.80205 0.72487 0.86301 -0.77945 0.40009 -1.10485
2.02883 0.8321 0.2795 -0.73516 -0.29347 -1.10485
1.57204 0.30572 0.40008 -0.69954 -0.06253 -1.10485
1.4177 0.32533 0.32246 -0.67677 0.6407 0.82589
0.69725 -0.79348 0.36994 -0.70467 1.10658 0.32656
0.75716 -0.61864 0.10424 -0.65332 0.7366 0.62616
0.72898 -0.66545 0.11421 -0.6297 0.05113 0.92575
0.76291 -0.97905 0.04933 -0.60771 0.84008 0.65945
0.83607 -0.94677 0.11161 -0.53621 1.10883 2.12414
0.81577 -1.00479 0.1126 -0.50479 0.59051 0.75931
0.8265 -0.55276 0.12332 -0.46579 1.02812 0.45639
0.85792 -0.26513 -0.10707 -0.39916 0.59037 -0.51231
0.91181 0.3993 -0.32068 -0.35041 -0.33524 -0.51564
0.97577 0.53991 -0.36438 -0.29679 -0.75501 -0.23934
0.94243 0.46342 -0.46664 -0.24587 -0.92893 0.19674
-0.87475 -1.45647 -0.65179 -0.1744 -0.90874 0.50299
-0.97138 -0.63284 -1.0862 0.83574 -1.46618 3.12279
-0.88183 0.23203 -1.06432 0.94868 -1.04676 0.35985
-1.06784 -0.2487 -1.06558 1.17249 -0.88978 0.01365
-1.10398 0.03034 -1.08878 1.3615 -0.70045 0.35985
-0.99334 1.7573 -1.10528 1.42909 -0.91214 0.33322
-0.93336 2.07661 -1.09487 1.54177 -0.69967 -0.35585
-0.96848 1.59078 -1.08692 1.69209 -0.75279 -0.96836
-0.97841 1.23122 -1.09425 1.8517 -0.6235 -0.19607
-0.88518 1.83304 -1.09821 2.10362 -0.38031 -0.46571
Nilai eigen dan vektor eigen:Principal Component Analysis: Z1, Z2, Z3, Z4, Z5, Z6
Eigen analysis of the Correlation Matrix
Eigenvalue 3.0626 1.3123 0.9525 0.4737 0.1655 0.0332Proportion 0.510 0.219 0.159 0.079 0.028 0.006Cumulative 0.510 0.729 0.888 0.967 0.994 1.000
Variable PC1 PC2 PC3 PC4 PC5 PC6Z1 -0.261 0.332 -0.816 -0.095 -0.159 0.348Z2 0.426 -0.339 -0.461 -0.223 0.630 -0.211Z3 -0.503 -0.312 0.139 0.211 0.533 0.549Z4 0.534 -0.064 0.182 -0.385 -0.160 0.710Z5 -0.451 -0.063 0.144 -0.862 0.014 -0.168Z6 0.097 0.818 0.219 -0.070 0.517 0.023
Hasil yang di dapat dari komponen utama pertama W1 dan W2 yang merupakan kombinasi linear dari Z dapat dinyatakan dalam persamaan berikut:W1 = -0.261 Z1 + 0.426 Z2 + 0.503 Z3 +0.534 Z4 -0.451 Z5 + 0.097 Z6
W2 = 0.332 Z1 + 0.339 Z2 - 0.312 Z3 – 0.064 Z4 - 0.063 Z5 + 0.818 Z6
Skor komponen utamaW1 W2 W3 W4 W5 W6
-1.16649 -0.98347 0.56379 1.70166 0.582702 0.309045
-1.31276 -1.41091 0.43465 1.22996 0.319862 0.132363
-3.64533 -1.51295 1.83746 -1.49488 -0.03854 0.068403
-2.459 -1.34529 1.31563 -0.05189 -0.11521 0.158095
-1.21736 -1.36769 0.61526 0.67605 0.093751 -0.12398
-0.61974 -1.66044 0.11424 0.12842 0.603699 -0.60554
-0.68302 -0.53407 -2.41855 0.29402 -0.10855 0.185921
-0.93385 -0.56193 -1.74641 0.2674 -0.30523 0.190588
-0.96291 0.93865 -1.11264 -0.48903 0.695591 0.032673
-1.54896 0.62738 -0.04919 -0.51701 -0.11588 -0.06569
-1.13313 0.93616 -0.19417 -0.33938 -0.01561 -0.12181
-0.80014 1.22635 -0.17711 0.23693 0.106089 0.022883
-1.27963 1.09506 -0.00975 -0.38016 -0.26137 -0.05805
-1.25667 2.26605 0.29639 -0.74298 0.530649 0.034297
-1.15916 1.19241 -0.02755 -0.19747 -0.22065 0.11793
-1.18058 0.76162 -0.2394 -0.66834 -0.08867 -0.02097
-0.8118 -0.02283 -0.69256 -0.36442 -0.55354 -0.09865
0.00748 -0.11083 -1.19794 0.21684 -0.28051 -0.14704
0.31734 0.12551 -1.31135 0.49221 -0.09715 -0.06326
0.49288 0.5368 -1.18351 0.59078 0.020392 -0.03925
0.30095 0.88626 1.24213 1.0864 -0.85028 -0.31369
1.94085 2.82509 1.55744 0.72877 0.637612 0.112298
1.87734 0.26053 0.5653 0.32 -0.26178 -0.08178
1.73663 0.05442 0.9264 0.2474 -0.74817 0.078748
1.92588 0.21446 0.96141 -0.0766 -0.42752 0.104856
2.77007 -0.34123 0.04825 -0.31768 0.605883 -0.14749
2.78255 -1.01717 -0.24606 -0.57083 0.431483 -0.1601
2.62519 -1.37431 -0.10637 -0.42656 -0.2063 0.036139
2.58034 -0.63996 0.28319 -0.57387 -0.05921 0.214109
2.81304 -1.06366 -0.04901 -1.00572 0.126458 0.248942
Meregresikan peubah tak bebas Y dengan skor komponen utama W1 dan W2
Regression Analysis: Y versus W1, W2
The regression equation isY = 7.14E+08 + 3.71E+08 W1 + 3798390 W2
Predictor Coef SE Coef T P VIFConstant 713684077 47118974 15.15 0.000W1 371064003 27384750 13.55 0.000 1.0W2 3798390 41834820 0.09 0.928 1.0
S = 258081252 R-Sq = 87.2% R-Sq(adj) = 86.2%
Analysis of VarianceSource DF SS MS F PRegression 2 1.22296E+19 6.11480E+18 91.81 0.000Residual Error 27 1.79836E+18 6.66059E+16Total 29 1.40280E+19
Source DF Seq SSW1 1 1.22291E+19W2 1 5.49081E+14
Unusual ObservationsObs W1 Y Fit SE Fit Residual St Resid3 -3.65 12610093 -644713694 127246505 657323787 2.93R
Transformasi peubah Z ke peubah asal (X)
Y = 7.14E+08 + 3.71E+08 W1 + 3798390 W2
Y = 7.14E+08 + 3.71E+08 (-0.261 Z1 + 0.426 Z2 + 0.503 Z3 +0.534 Z4 -0.451 Z5 +0.097 Z6) + 3798390 (0.332 Z1 + 0.339 Z2 - 0.312 Z3 – 0.064 Z4 - 0.063 Z5 +0.818 Z6)
Y = 7.14E+08 + -95569934.52 Z1 + 156758345.79 Z2 +87798097.68 Z3+197870903.04 Z4 +167560298.57 Z5+39094083.02 Z6
Y = 7.14E+08 + -95569934.52 + 156758345.79 + 87798097.68 + 197870903.04 + 167560298.57 + 39094083.02
Y = 7.67E+08 - 81753.5796 X1 + 3315531.848 X2 - 5.63E+06 X3 + 5102395.643 X4-166726665.2 X5 + 1301400899 X6
Jadi model akhir yang kita dapat adalah:
Y = 7.67E+08 - 81753.5796 X1 + 3315531.848 X2 - 5.63E+06 X3 + 5102395.643 X4 -166726665.2 X5 + 1301400899 X6
Analisis signifikansi koefesien regresi parsialPeubah (Zi) koefisien(γi) Simpangan baku s(γi) t-hitung
Z1 -95569934,52 7,102218521 -13456349,48
Z2 156758345,8 8,349539489 18774490,02
Z3 -187798097,7 8,628167101 -21765700,12
Z4 197870903 6,759499313 29273011,78
Z5 -167560298,6 5,741958242 -29181734,09
Z6 39094083,02 15,60628974 2505020,967
Karena nilai |t-hitung|>t-tabel maka setiap koefisien berpengaruh nyata.
Penduga koefisien regresi pada model regresi yang diperoleh dengan menggunakan regresi komponen utama seringkali berbias,
padahal sifat penduga yang baik adalah tak bias dengan ragam penduga minimum.
KesimpulanAnalisis komponen utama pada dasarnya
mentransformasi peubah-peubah bebas yang berkorelasi menjadi peubah-peubah baru yang
ortogonal dan tidak berkorelasi. Analisis ini bertujuan untuk menyederhanakan peubah-peubah
yang diamati dengan cara mereduksi dimensi, sehingga masalah multikolinearitas dapat diatasi.