UAP

Data berikut diambil dari skripsi mahasiswa Universitas Sumatera UtaraJudul : Metode Regresi Ridge untuk Mengatasi Model Regresi

Linier Berganda yang Mengandung MultikolinieritasNama : Nanang PradiptaJurusan : MatematikaFakultas : Matematika dan Ilmu Pengetahuan Alam

Tahun Y X1 X2 X31949 15.9 149.3 4.2 108.11950 16.4 161.2 4.2 114.81951 19 171.5 3.1 123.21952 19.1 175.5 3.1 126.91953 18.8 180.8 1.1 132.11954 20.4 190.7 2.2 137.71955 22.7 202.1 2.1 1461956 26.5 212.4 5.6 154.11957 28.1 226.1 5 162.31958 27.6 231.9 5.1 164.31959 26.3 239 0.7 167.61960 31.3 258 5.6 176.81961 33.3 269.8 3.9 186.61962 37 288.4 31 199.71963 43.3 304.5 4.6 213.91964 49.3 323.4 7 223.81965 50.3 336.8 1.2 2321966 56.6 353.9 4.5 242.9

Y : barang import (milliard Franc Prancis)X1 : barang yang dipesan (milliard Franc Prancis)X2 : persediaan barang (milliard Franc Prancis)X3 : barang yang dikonsumsi (milliard Franc Prancis)

1

1. Lakukan Pengujian Asumsi Regresi Linier Klasik! Jika terjadi pelanggaran asumsi maka lakukan pengujian untuk mengatasi pelanggaran tersebut

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

B Std. Error Beta t Sig.

1 (Constant)

-18.215 4.185 -4.353 .001

X1 .077 .195 .390 .394 .700

X2 -.080 .089 -.042 -.902 .383

X3 .182 .297 .606 .614 .549

a. Dependent Variable: Y

Dari hasil di atas didapatkan persamaan regresinya adalah

y = -18.215 + 0.077 X1 – 0.080 X2 + 0.182X3

X1 : ketika jumlah barang yang dipesan bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.077 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX2 : : ketika jumlah persediaan barang meningkat sebesar 1 satuan (milliard france Prancis) maka akan menurunkan jumlah barang yang diimpor sebesar 0.080 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX3: ketika jumlah barang yang dikonsumsi bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.182 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetap

Setelah mendapatkan model regresi kita lakukan uji asumsi. Asumsi regresi linier berganda yang pertama adalah normalitas galat. Dalam software SPSS ini uji normalitas dapat menggunakan uji kolmorgorov smirnov dengan hipotesisHipotesis :

2

H0 : Galat menyebar secara normal H1 : Galat tidak menyebar secara normalα = 0.05Berikut merupakan hasil analisis menggunakan software SPSS

One-Sample Kolmogorov-Smirnov Test

Unstandardized Residual

N 18

Normal Parametersa,,b Mean .0000000

Std. Deviation 2.11489406

Most Extreme Differences Absolute .100

Positive .100

Negative -.089

Kolmogorov-Smirnov Z .423

Asymp. Sig. (2-tailed) .994

a. Test distribution is Normal.

b. Calculated from data.

Dari hasil analisis di atas dapat dilihat bahwa nilai signifikansi sebesar 0.994 > α = 0.05. Jadi keputusannya terima H0. Galat menyebar secara normal. Apabila galat menyebar normal maka sampel tersebut pasti juga berasal dari populasi yang berdistribusi normal.

Uji asumsi yang kedua adalah uji homogenitas. Uji ini dimaksudkan untuk memperlihatkan bahwa dua atau lebih kelompok data sampel berasal dari populasi yang memiliki variansi yang sama. Atau ragam galat homogen. Ada beberapa macam uji yang digunakan untuk melihat kehomogenan ragam galat. Antara lain uji park, uji glesjer dan scatter plot. Namun pada analisis kali ini yang digunakan adalah uji glesjer. Dengan hipotesisH0 : ragam galat homogenH1 : ragam galat tidak homogen

3

Coefficientsa

Model


Standardized

Coefficients

t Sig.B Std. Error Beta

1 (Constant)

5.500 1.875 2.933 .011

X1 .242 .087 12.742 2.774 .015

X2 -.052 .040 -.287 -1.312 .210

X3 -.365 .133 -12.566 -2.740 .016

a. Dependent Variable: abresid

Dapat dilihat pada nilai signifikansi untuk keempat variabel ini masing-masing sebesar 0.011, 0.015, 0.210 dan 0.016. Terdapat tiga variabel yang p value < α = 0.05. Jadi tolak H0, yang berarti ragam galat tidak homogen atau terjadi kasus heterokesdastisitas. Dan terjadi pellanggaran terhadap asumsi homokesdastisitas

Selain dengan cara di atas untuk menguji kehomogenan galat juga dapat dilakukan dengan cara membuat plot antara residual dan nilai prediksi. Dapat dilihat dari plot, memiliki pola tertentu. Jadi terjadi heterokesdastisitas.

4

Uji asumsi berikutnya adalah uji autokorelasi, autokorelasi ini digunakan untuk menguji apakah dalam sebuah model regresi linier terdapat korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1 (sebelumnya). Untuk menguji Autokorelasi dapat dilihat dari nilai Durbin Waston (DW), yaitu jika nilai DW terletak antara du dan (4 – dU) atau du ≤ DW ≤ (4 – dU), berarti bebas dari Autokorelasi. Jika nilai DW lebih kecil dari dL atau DW lebih besar dari (4 – dL) berarti terdapat Autokorelasi. Nilai dL dan dU dapat dilihat pada tabel Durbin Waston, yaitu nilai dL ; dU = α ; n ; (k – 1) . Hipotesis untuk uji autokorelasi ini adalahH0 : Tidak terjadi autokorelasiH1 : Terjadi autokorelasi

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of

the Estimate

Durbin-

Watson

1 .986a .971 .965 2.33050 .709

a. Predictors: (Constant), X3, X2, X1

b. Dependent Variable: Y

5

Nilai Durbin Watson sebesar 0.709. Dengan n=18 k = 3 didapatkan nilai tabel durbin Watson dL = 0.9331 dan dU = 1.69661. Karena nilai DW = 0.709 < dL = 0.9331 maka tolak H0 terjadi kasus autokorelasi

Langkah selanjutnya adalah uji multikolinieritas. Multikolinieritas dapat dideteksi dengan menghitung koefisien korelasi ganda dan membandingkannya dengan koefisien korelasi antar variabel bebas. Uji multikolonieritas dengan SPSS dilakukan dengan uji regresi, dengan patokan nilai VIF (variance inflation factor) dan koefisien korelasi antar variabel bebas. Apabila VIF > 10 maka diindikasikan terjadi multikolinieritas.

Coefficientsa

Model


Standardized

Coefficients

t Sig.

Collinearity Statistics

BStd. Error Beta

Tolerance VIF

1 (Constant)

-18.215

4.185 -4.35

3

.001

X1 .077 .195 .390 .394 .700 .002 479.364

X2 -.080 .089 -.042 -.902 .383 .919 1.088

X3 .182 .297 .606 .614 .549 .002 477.742

a. Dependent Variable: Y

Dari nilai VIF di atas berturut-turut sebesar 479.364 , 1.088 dan 477.742. Terdapat dua variabel yang VIF > 10 maka terjadi kasus multikolinieritas

6

Yang terakhir adalah uji linieritas. Uji linieritas ini menggunakan ramsey test yang dikembangkan oleh Ramsey (1969) yang menyarankan suatu uji yang disebut general test of specification atau RESET. Uji ini bertujuan untuk meghasilkan F hitung, caranya: F = (R2 new – R2 old)/m

(1 - R2 new)/(n-k) Dimana: m = jumlah variable independent yang baru masuk n = jumlah data observasi k = banyaknya parameter dalam persamaan yang baru.

R2 new = nilai R2 dari persamaan regresi baru

R2 old = nilai R2 dari persamaan regresi lama.

Model Summaryb

Model R R SquareAdjusted R

SquareStd. Error of the

Estimate

1 .986a .971 .965 2.33050

a. Predictors: (Constant), X3, X2, X1

b. Dependent Variable: Y

Model Summary

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate

1 .994a .988 .985 1.54994

a. Predictors: (Constant), DFFIT, X3, X2, X1

7

Hipotesis:

H0 : Model Linier

H1 : Model Tidak Linier

F = (0.988 – 0.971)/1 (1 – 0.988)/(18-4) = 19.8333

Nilai Fα=0.05 (1,14) sebesar 4.60 jadi keputusannya tolak H0 model tidak linier.

Pada data di atas, penangangan pelanggaran asumsi hanya dilakukan untuk menangani kasus multikolinieritas. Berikut merupakan penanganan multikolinieritas menggunakan Principal Component Analysis.

Regression Analysis: Y versus X1, X2, X3

The regression equation isY = - 18.2 + 0.077 X1 - 0.0798 X2 + 0.182 X3

Predictor Coef SE Coef T P VIFConstant -18.215 4.185 -4.35 0.001X1 0.0767 0.1948 0.39 0.700 479.364X2 -0.07981 0.08853 -0.90 0.383 1.088X3 0.1823 0.2971 0.61 0.549 477.742

S = 2.33050 R-Sq = 97.1% R-Sq(adj) = 96.5%

Dari hasil di atas dapat diketahui bahwa model regresi yang terbentuk adalah y = -18.2 + 0.077 X1 – 0.0798 X2 + 0.182 X3

8

Interpretasi :X1 : ketika jumlah barang yang dipesan bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.077 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX2 : : ketika jumlah persediaan barang meningkat sebesar 1 satuan (milliard france Prancis) maka akan menurunkan jumlah barang yang diimpor sebesar 0.07981 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX3: ketika jumlah barang yang dikonsumsi bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.1823 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapLangkah selanjutnya adalah menguji ada tidaknya multikolinieritas. Dengan hipotesis:H0 : tidak terjadi multikolinieritas di antara variabel penjelasH1 : terjadi multikolinieritas di antara variabel H0. Apabila nilai VIF >10 maka diindikasikan terjadi multikolinieritas. Dari hasil VIF di atas dapat dilihat bahwa nilai VIF untuk variabel X1 dan X3 sebesar 479.364 dan 477.742, yang mengindikasikan adanya multikolinieritas. Selanjutnya karena ada multikolinieritas kita menangani masalah ini menggunakan analisis komponen utana atau Principal Component Analysis.

Principal Component Analysis: z1, z2, z3

Eigenanalysis of the Covariance Matrix

Eigenvalue 2.1110 0.8880 0.0010Proportion 0.704 0.296 0.000Cumulative 0.704 1.000 1.000

Variable PC1 PC2 PC3z1 0.674 -0.211 -0.708z2 0.303 0.953 0.005z3 0.673 -0.217 0.706

Untuk menentukan variabel mana yang direduksi. Kita dapat melihat dari nilai eigen value dan cumulative. Komponen yang digunakan

9

adalah yang memiliki nilai eigen value lebih dari 1. Jadi hanya komponen pertama yang memiliki eigen value lebih dari 1. Lalu bila dilihat dari nilai cumulative cari yang lebih dari 75%. Dalam kasus di atas apabila hanya melibatkan komponen yang pertama nilai cumulative sebesar 0.704 namun bila kita memakai komponen yang kedua juga nilai cumulative nya sudah 1. Jadi disini diputuskan menggunakan satu komponen saja, yaitu komponen yang pertama. Karena apabila dilihat dari segi eigen value komponen ke dua kurang dari 1. Lalu nilai cumulative pada komponen pertama sudah 70.4 % hampir mendekati 75%. Karena yang digunakan adalah w1. Maka kita memiliki persamaanW1 = 0.674 z1 + 0.303 z2 + 0.673 z3

Selanjutnya setelah diputuskan hanya satu komponen yang kita gunakan, komponen tersebut diregresikan berdsama variabel y.

Regression Analysis: Y versus w1

The regression equation isY = 30.1 + 8.23 w1

Predictor Coef SE Coef T PConstant 30.1056 0.8915 33.77 0.000w1 8.2311 0.6314 13.04 0.000

S = 3.78219 R-Sq = 91.4% R-Sq(adj) = 90.9%

Hasil regresi yang didapatkan dari model y dengan w1 adalahY = 30.1 + 8.23 w1

Lalu persamaan w1 di atas kita subtitusikan ke dalam persamaan ini.

10

Y = 30.1 + 8.23 (0.674 z1 + 0.303 z2 + 0.673 z3)Y = 30.1 + 5.547 z1 + 2.494 z2 + 5.539 z3

Descriptive Statistics: X1, X2, X3

Variable Mean StDev VarianceX1 237.5 63.5 4034.4X2 5.23 6.66 44.37X3 167.38 41.58 1728.98

Selanjutnya kita lakukan pendugaan parameter dengan rumus

β0= β0 (w )−β1 (w ) X1

S11

−β2 (w ) X2

S22

−β3 (w ) X3

S33

Dan

β j=β j (w )

S jj

Nilai rata-rata dan ragam itulah yang dimasukkan ke dalam rumus pendugaan parameter

β0=30.1−5.547 × 237.54034.4

−2.494 ×5.2344.37

−5.539× 167.381728.98

=28.943

β1=5.547

4034.4=0.001375

β2=2.49444.37

=0.0562

β3=5.539

1728.98=0.003204

11

Jadi persamaan yang baru adalah

Y = 28.943 + 0.001375 X1 + 0.0562 X2 + 0.003204 X3

Interpretasi :X1 : ketika jumlah barang yang dipesan bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.001375 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX2 : : ketika jumlah persediaan barang meningkat sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.0562 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX3: ketika jumlah barang yang dikonsumsi bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.003204 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetap

Cara kedua melakukan penanganan multikolinieritas dengan menggunakan regresi ridge. Kita akan mencari nilai penduga ridge βR (L) adalah

βR (L) = (Z ' Z+ L I )−1 Z ' YNilai matriks Z adalah

1 -1.38887 -0.15513 -1.425601 -1.20152 -0.15513 -1.264461 -1.03936 -0.32027 -1.062451 -0.97638 -0.32027 -0.973471 -0.89294 -0.62053 -0.848411 -0.73708 -0.45539 -0.71373

12

1 -0.55760 -0.47040 -0.514121 -0.39543 0.05505 -0.319321 -0.17974 -0.03503 -0.122121 -0.08843 -0.02002 -0.074021 0.02335 -0.68058 0.005341 0.32249 0.05505 0.226601 0.50826 -0.20017 0.462281 0.80110 3.86832 0.777331 1.05458 -0.09508 1.118831 1.35214 0.26523 1.356921 1.56310 -0.60552 1.554131 1.83233 -0.11009 1.81627

Hasil perkalian Z’Z adalahMatrix M6

18 -0.0000 -0.0000 0.0000-0 17.0000 4.2950 16.9819-0 4.2950 17.0000 4.1866 0 16.9819 4.1866 17.0000

L merupakan konstanta yang dicari dengan rumus

L= p σ2

β ' β

keterangan : p = banyaknya prediktor

σ 2 = kuadrat tengah galat

β ' β = perkalian matriks penduga parameter

L= 3∗5.983897.127

=0.0490911

Selanjutnya matriks LIMatrix Copy_2

0.0490911 0.0000000 0.0000000 0.00000000.0000000 0.0490911 0.0000000 0.00000000.0000000 0.0000000 0.0490911 0.00000000.0000000 0.0000000 0.0000000 0.0490911

13

(Z ' Z+ L I )Matrix M8

18.0491 -0.0000 -0.0000 0.0000-0.0000 17.0491 4.2950 16.9819-0.0000 4.2950 17.0491 4.1866 0.0000 16.9819 4.1866 17.0491

(Z ' Z+ L I )−1

Matrix M9

0.0554045 0.00000 -0.0000000 -0.00000 0.0000000 7.50614 -0.0584813 -7.46218-0.0000000 -0.05848 0.0628737 0.04281-0.0000000 -7.46218 0.0428111 7.48090

Y

Matrix Copy_3

15.916.419.019.118.820.422.726.528.1k27.626.331.333.337.043.349.350.356.6

Z ' Y

Matrix M11

541.900209.295 43.630

14

209.402

βR (L)=(Z ' Z+ LI )−1 Z ' Y

Matrix M12

30.0237 5.8528-0.5319 6.5832

Didapatkan penduga ridge

β0=30.0273 β1=5.8528 β2=−0.5319 β3=6.5832

Berdasarkan perhitungan di atas , maka diperoleh persamaan

ridge regression :

Y = 30.0273 + 5.8528 Z1 – 0.5319 Z2 + 6.5832 Z3 Descriptive Statistics: X1, X2, X3

Variable Mean StDev VarianceX1 237.5 63.5 4034.4X2 5.23 6.66 44.37X3 167.38 41.58 1728.98

Kemudian mengembalikan data Z ke X. Berikut ini

perhitungan untuk mengembalikan data Z ke X :

Selanjutnya kita lakukan pendugaan parameter dengan rumus

β0= β0 (w )−β1 (w ) X1

S11

−β2 (w ) X2

S22

−β3 (w ) X3

S33

Dan

15

β j=β j (w )

S jj

Nilai rata-rata dan ragam itulah yang dimasukkan ke dalam rumus pendugaan parameter

β0=30.0237−5.8528× 237.54034.4

−−0.5319 ×5.2344.37

−6.5832× 167.381728.98

=29.104

β1=5.85284034.4

=0.001451

β2=−0.5319

44.37=−0.01199

β3=6.5832

1728.98=0.003808

Jadi persamaan yang baru adalah

Y = 29.104 + 0.001451 X1 - 0.01199 X2 + 0.003808 X

Interpretasi :X1 : ketika jumlah barang yang dipesan bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.001451 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX2 : ketika jumlah persediaan barang meningkat sebesar 1 satuan (milliard france Prancis) maka akan menurunkan jumlah barang yang diimpor sebesar 0.01199 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetapX3: ketika jumlah barang yang dikonsumsi bertambah sebesar 1 satuan (milliard france Prancis) maka akan meningkatkan jumlah barang yang diimpor sebesar 0.003808 satuan (milliard france Prancis) dengan variabel yang lainnya dianggap tetap2. Apa yang Anda gunakan untuk mengatasi pelanggaran asumsi

tersebut? Mengapa?

16

Pada data di atas terjadi banyak kasus pelanggaran asumsi regresi linier berganda antara lain terjadi kasus heterokesdastisitas, autokorelasi, multikoinieritas dan model tidak linier. Untuk pelanggaran kasus heterokesdastisitas dapat ditangani dengan dua

cara. Jika σ i2 diketahui atau dapat ditaksir, metode yang paling jelas

dan berkaitan dengan heterokesdastisitas adalah dengan menggunakan kuadrat terkecil tertimbang (weighted least squares).

Jika σ i2 tidak diketahui metode kuadrat terkecil tertimbang yang

dibahas sebelumnya tadi tidak dapat digunakan. Oleh karena itu, dalam praktek, bisa terpaksa digunakan suatu asumsi ad hoc

mengenai σ i2, sekalipun cukup masuk akal, dan mentransformasikan

model regresi asli dengan cara sedemikian rupa sehingga model yang telah ditransformasikan akan memenuhi asumsi homoskedastisitas. Untuk kasus autokorelasi juga menggunkan transformasi. Ada model transformasinya sendiri bila ρ diketahui dan ρ tidak diketahui. Untuk mutikolinieritas dapat di atasi dengan analisis komponen utama dan regresi ridge.

Yt Xt10.00 6.0013.00 8.0015.00 11.0017.00 13.0021.00 16.0024.00 18.0027.00 21.0029.00 23.00

17

32.00 25.0035.00 28.00

Untuk memudahkan interpretasi dimisalkan Yt merupakan plant expenditure dan Xt merupakan sales

3. Data table 2 harus menggunakan analisis apa? Mengapa?

Data di atas menggunakan analisis model distribusi lag. Model regresi linier yang biasanya ditemui tidak memperihatkan pengaruh waktu karena pada umumnya model regresi linier cenderung mengasumsikan bahwa pengaruh variabel bebas terhadap variabel tak bebas terjadi dalam kurun waktu yang sama. Namun dalam model regresi inier juga terdapat model regresi yang memperhatikan pengaruh waktu. Waktu yang diperlukan bagi variabel X dalam mempengaruhi variabel tak bebas Y disebut bedakala atau a time lag. Seperti pada data di atas variabel tak bebas dipengaruhi oleh variabel bebas pada waktu t serta dipengaruhi juga oeh variabel bebas pada waktu t-1, t-2 dan seterusnya.

4. Lakukan pengujian terhadap data tersebut!

Berikut merupakan hasil analisis distribusi lagRegression Analysis: Yt versus Xt, Yt-1

The regression equation isYt = 2.76 + 0.795 Xt + 0.312 Yt-1

9 cases used, 1 cases contain missing values

18

Predictor Coef SE Coef T PConstant 2.7620 0.5955 4.64 0.004Xt 0.7948 0.3727 2.13 0.077Yt-1 0.3116 0.3277 0.95 0.378

S = 0.578121 R-Sq = 99.6% R-Sq(adj) = 99.4%

Analysis of Variance

Source DF SS MS F PRegression 2 475.99 238.00 712.09 0.000Residual Error 6 2.01 0.33Total 8 478.00

Source DF Seq SSXt 1 475.69Yt-1 1 0.30

Untuk menyelesaikan model distribusi lag menggunakan metode Koyck . Model transformasinya adalah

Ct=α 0¿+β0 Yt+τCt−1+Vt

Jadi dari hasil perhitungan minitab didapatkan model transformasi Koyck

Y = 2.760 + 0.7948 X1 + 0.3116 Yt-1

Interpretasi :

Plant expenditure sekarang dipengaruhi oleh sales sebesar 0.7948, oleh plant expenditure tahun kemarin sebesar 0.3116. Dari persamaan di atas didapatkanα 0∗¿¿ = 2.760β0=0.7948τ=0.3116

19

Selanjutnya hasil yang didapat ditransformasi menjadi persamaan regresi dengan rumus

α 0=α 0∗¿1− τ

= 2.7601−0.3116

=4.01163¿

β0=(τ ¿¿0) β0=(0.272¿¿0)× 0.7948=0. 7948¿¿

β1=( τ ¿¿1)β0=(0.272¿¿1)× 0.7948=0. 24804¿¿

Sehingga didapatkan persamaan regresi yang baru Yt = 4.01163 + 0.7948 Xt + 0.24804 Xt-1

InterpretasinyaPlant expenditure sekarang dipengaruhi oleh sales sebesar 0.7948, dan dipengaruhi oleh plant expenditure tahun kemarin sebesar 0.24804

20

21

Documents

UAP