2 Box Cox - Dwi Isprianti

Embed Size (px)

Citation preview

JURNAL MATEMATIKA DAN KOMPUTER Vol. 7. No. 3, 8 - 17, Desember 2004, ISSN : 1410-8518 8 PEMODELAN STATISTIKA DENGAN TRANSFORMASI BOX COX Dwi Ispriyanti Staf Pengajar Jurusan Matematika Fakultas MIPA UNDIP Semarang Abstrak Analisisregresiadalahsalahsatuteknikstatistikayangdigunakanuntuk menentukanmodelhubungansatuvariabelrespon(Y)dengansatuataulebih variabelpenjelas(X).Dalammelakukananalisisnyaharusdipenuhibahwa ic ~ NID(0,2o ) , jika asumsi tersebut tidak dipenuhi maka dapat dilakukan transfomasi terhadapYyangdipangkatkandenganparameter,sehinggamenjadiY. Pendugaanparameter dapatdicaridenganmenggunakanMetodeKemungkinan Maksimum(MaximumLikehoodMethod). dipilihsedemikian,sehingga didapat jumlah kuadrat sisaan yang paling minimum. Kata Kunci : Transformasi Box Cox, Maximum Likelihood Method 1. PENDAHULUAN Analisis Regresi merupakan salah satu cabang statistika yang paling banyak dipelajariolehilmuwan,khususnyaparapeneliti,baikilmuwanbidangsosial maupuneksakta.Melaluianalisisregresimodelhubunganantarvariabeldapat diketahui.Variabeldalamanalisisregresidikenaldengannamavariabelrespon( Y) dandan variabel penjelas (X). Dalammelakukananalisisregresiadabeberapaasumsiyangharus dipenuhi antara lainic (galat) bebas satu sama lain, mempunyai nilai tengah nol, ragamkontan,danmengikutisebarannormal,yanglebihumumditulis ic ~ NID(0,2o ).Apabilakenormalandata,kehomoginanragamdanlinieritastak dipenuhi , maka dapat dilakukan transformasi terhadap variabel respon. Salah satu cara untuk mengatsi kehomoginan ragam dengan menggunakan transformasi Box Cox,yaitutransformasipangkatberparametertunggal,katakanlah terhadapY, yangmenjadiY.Pendugaanparameter dapatdicaridenganmenggunakan Pemodelan Statistika dengan Transformasi Box Cox (Dwi Ispriyanti) 9 MetodeKemungkinanMaksimum(aximumLikehoodMethods). dipilih sedemikian, sehingga didapat jumlah kuadrat sisaan yang paling minimum.Dalampenulisanini,diambilcontohdatatentangtingkatplasmapada polyamine yang diambil dari sampel25 anak sehatyang berumur 0 ( baru lahir ), 1th,2th3thdan4th,penelitiandilakukanuntukmengetahuimodelhubungan antaraumurdantingkatplasma,dananalisisnyadibantudenganmenggunakan sofware SPSS versi 10. 2. METODE KEMUNGKINAN MAKSIMUM Metodekemungkinanmaksimummerupakanmetodeuntukmemperoleh estimator.MisalkanXvariabelrandomdengandistribusiprobabilitasf(x,u), dimana parameter u tidak diketahui, maka fungsi kemungkinan maksimumnya : L//(u /X) = [niix f ) , ( uPadamodelregresi,metodekemungkinanmaksimumadalahsebagai berikut :Pandang model regresi dalam matriks : Y = X | + c ; c ~NID(0,2o ) X Fixed & | konstan , sehingga Var (Y) = 2o Dalam ragresi linier sederhana, fungsi kemungkinan maksimum dapat dituliskan : L( } ) (21exp{ ) 2 ( ) , , , ,21 012212121 0 i in nii iX Y x Y | |oto o | | = [= =} ) (21exp{ ) 2 (21 0222i inX Y | |oto (1) Untukmenentukandugaandari 1 0| | dan dan 2o ,yaitub0 ,b1dan 2 o , maka persamaan (1) eqivalent: Ln( } ) ( )21( ln )2( 2 ln )2( ) , , , ,21 0122 21 0 i inii iX Yn nX Y | |oo t o | | == JURNAL MATEMATIKA DAN KOMPUTER Vol. 7. No. 3, 8 - 17, Desember 2004, ISSN : 1410-8518 10 0ln0=cc|L => == nii iX b b Y11 020 ) (1o (2)

== => =ccnii i iX X b b YL11 0210 ) (10lno |, dan(3) == + => =ccnii iX b b Yn L121 04 2 20 ) ( 21 20lno o o (4) Penyelesaian persamaan (2) , (3) dan (4)didapat : b0= _1_X b Yb1 = ==niinii iX XX X Y121) () ( o2 = nb b Ynio i211) (= b0 dan b1 adalah intersep dan slope,oadalah standard error dari regresi. Secara analog pada model Y = X | + cLn) ( ) )(21( ln )2( 2 ln )2('22| |oo t X Y X Yn nL =) ( ) ( 0ln1Y X X X biL' ' = => =cc| 3. TRANSFORMASI BOX COX Transformasi Box Cox adalah transformasi pangkat pada respon. Box Cox mempertimbangkankelastransformasiberparametertunggal,yaitu yang dipangkatkanpadavariabelresponY,sehinggatransformasinyamenjadi Y ,adalahparameteryangperludiduga.Tabeldibawahadalahbeberapanilaidengan transformasinya .Pemodelan Statistika dengan Transformasi Box Cox (Dwi Ispriyanti) 11 Tabel Nilaidan Taransformasinya Transformasi 2Y2 0.5 Y0log Y / ln Y -0.5 Y1 -1.01 / Y Prosedure Box Cox adalah secara simultan, mendugadalam model : W= X c | +; ic ~ NID(0,2t ) W=( w1 ,w2 ,.., wn )T

Menurut Drapers S, Harry S , 1992W didefinisikan : == =0 , ln0 , / ) 1 ( YYW (5) Pendugaan parameterdapat dicari dengan menggunakan metode kemungkinan maksimum . Dari modelW= X c | +, maka L( 2, , t | ) ==} ) (21exp{ ) 2 (21 0222i inx w | |ttt LnL=} ) ( )21( ln )2( 2 ln )2(21 0122i iniX Wn n| |to t = Ln L =) ( ) )(21( ln )2( 2 ln )2(22| |to t X W X Wn n ' L maks () , ( ln ) ( ln2)2Y Jn o + = nadalah banyaknya amatan , dan 2 o() adalah 1/n x JKS setelah menduga model regresi denganyang ditentukan. [ [=cc=niniYYWY J111) , (, untuk semua(6) JURNAL MATEMATIKA DAN KOMPUTER Vol. 7. No. 3, 8 - 17, Desember 2004, ISSN : 1410-8518 12 ln inY Y J ln ) 1 ( ) , (1 = , sehingga L maks( + =iYnln ) 1 ( ) ( ln2)2 o Jika kita reduksi terhadap konstante, makaL maks() ( ln2)2 o n =Sehinggamemaksimalkandengannilaiyangditetapkanadalahidentikdengan meminimalkan2 o ,yaitumeminimalkan dari Jumlah kuadrat Sesatan( JKS) yang diperoleh dari pengepasan model regresi. DariuraiantentangmetodeBoxCoxdiatas,makadapatdisimpulkanlangkah-langkah untuk menentukan . Langkah-langkah tersebut adalahsebagai berikut : 1.Pilih dari kisaran yang ditetapkan ( biasanya (-2,2) atau (-1,1) 2.untuk masing-masing , buat model W= X c | +, W adalah seperti ditetapkan pada persamaan ( 5 ) . Dari model regresi ini didapat JKS, langkah 2 ini dilakukan terus menerus pada setiap yang ditetapkan sehingga diperoleh beberapa JKS. 3.Plot antara JKS dan 4.Pilih sebagai penduga adalah yang meminumkan JKS. Bentuk alternatif lain, yang lebih disukai pemakai adalah : niiY JWV1)} , ( { = (7) dan L maks ( ) =) , ( ln22Vn o =dengan V= ( V1,V2,V3,..) dan) , ( 2V o =S(,V)/nadalah jumlah kuadrat sisa yang diperoleh berdasarkan model V= X c | + . Singkatnya adalah meminumkan fungsi S(,V) Dengan menggunakan persamaan (6) , makapersamaan (7) menjadi : Pemodelan Statistika dengan Transformasi Box Cox (Dwi Ispriyanti) 13

1=YWVii , dimanaY = (Y1,Y2,.)n1

Suatu pendekatan 100(1-o) % selang kepercayaan untuk dapat dihitung : JKS* = JKS( ) { 1 +}) ,22vv to

(8) JKS()adalahJKSminimumdanvaadalahderajadbebasdarigalat.Denganmembuatgrafik,dengansumbuxadalahharga-hargadansumbuyadalah harga-harga JKS, akan diperoleh suatu kurva dan dengan menarik garis horizontal padanilai JKS *pada sumbu y ,maka akan diperoleh batas batas selang untuk yang sesuai. CONTOH TERAPAN Data Suatupenelitiandilakukanuntukmenentukanmodelhubunganantara umur(X)dantingkatplasmapadaPolyamine(Y),datadiambilpadaanakbalita yang sehat, sejumlah 25 anak yangberumur 0 ( baru lahir) ,1 th ,2 th , 3 th dan 4 th., masing masing diambil 5 anak.Data sebagai berikut : Y13.44 12.84 11.91 20.09 15.60 10.11 11.38 10.288.868.599.839.00 X000001111122 Y8.657.858.887.946.015.146.906.774.865.105.675.756.23 X2223333344444 Sumber data : Neter J, 1990 Hasil dan Pembahasan Dari data tersebut diatas dapat kita definisikan bahwa sebagai peubah respon adalah tingkatplasma pada Polyamine(Y) dan sebagai peubah penjelas adalahUmur (X), banyaknya data adalah 25 , Karena hanya ada 1 peubah penjelas, maka model yang digunakan : Y = c | | + +1 1 0XJURNAL MATEMATIKA DAN KOMPUTER Vol. 7. No. 3, 8 - 17, Desember 2004, ISSN : 1410-8518 14 Dengan bantuan SPSS, didapat model di atas : Y = 13,475 2,182 X ,R 2 adj = 0,743 Dari model tersebut, dilakukan pengecekanasumsi2 nya. ScatterplotDependent Variable: YRegression Standardized Predicted Value1.5 1.0 .5 0.0 -.5 -1.0 -1.5Regressi on Standardized Residual43210-1-2 Gambar 1: Predict Value terhadap Standard Residual X5 4 3 2 1 0 -1Y22201816141210864 Gambar 2 : Plot antara Y dan X Ternyata dari gambar 1 di atas asumsi kehomoginan ragam tak dipenuhi , artinyaadapolatertentu(tidakacak),dilihatgambarplotYdanX(gambar2)juga menunjukkan curve yang tak linier dan denganuji kolmogorow _smirnov didapat sig=0.016 < 0.05 artinya kenormalan juga tak dipenuhi, Sehingga perlu dilakukan ditransformasiterhadappeubahresponY,yaituYdenganlangkahlangkah sebagai berikut : 1. diambil range (2,-2) 2.HitungY = (Y1 x Y2x Yn25)1/25 Pemodelan Statistika dengan Transformasi Box Cox (Dwi Ispriyanti) 15 3.Untuk tiap harga , hitung Y -1

4.Hitung Vi1=YWi 5.Regresikan antara V dan X , sehingga didapat JKS 6.Lanjutkan pada nilai yang lain 7.Tentukkan yang mempunyai JKS terkecil. Dari langkah-langkah diatas didapat nilai nilai dan JKS sebagai berikut : 210.90.70.50.30.10-0.1 JKS127845977.98370.34857.80148.39141.42436.44434.51933.101 -0.3-0.4-0.5-0.6-0.7-0.9-1-1.2-1.5-2 JKS31.22330.73230.62130.72131.10432.70333.90937.11844.014673000000 Darinilainilaitersebutdiatas,dapatdilihatbahwa=-0.5mempunyaiJKS paling kecil , sehingga tranformasi yang digunakan adalah Y-0.5 , artinya data awal Y dipangkatkan dengan -0.5 yang diberi simbul dengan Y2, kemudian Y2 dengan X diregresikandanmodel yang didapat adalah sebagai berikut : Y'= 0.268 +0.04 X R2=0.866, R2adj =0.861 F= 149.221,sig=0.000 Dengan sig =0.00 berarti model tersebut sangat significant, kemudian dilakukan pengecekanterhadap asumsi-asumsi: Gambar di bawah ini adalahGambar gambar setelah Y ditranformasidiperoleh sbb: X5 4 3 2 1 0 -1Y2.5.4.3.2 Gambar 3: Plot Y2 dan X JURNAL MATEMATIKA DAN KOMPUTER Vol. 7. No. 3, 8 - 17, Desember 2004, ISSN : 1410-8518 16 ScatterplotDependent Variable: Y2Regression Standardized Predicted Value1.5 1.0 .5 0.0 -.5 -1.0 -1.5Regressi on Standardized Residual3210-1-2 Gambar 4: Predict Value terhadap Standard Residual setelah ditranformasi

Dilihatdarigambardiatas,makaasumsiasumsiyangsemulatidakdipenuhi, denganmelakukantranformasiBocCoxmenjadidipenuhii,yaitulinieritas (gambar3),kehomoginanragam(gambar4),kenormalan(sig=0.200>0.05). Sehingga model yang cocok untuk hubungan tingkat plasmapada polyamine dan umuradalah 'Y =0.268+0.04X.Darimodelinidapatdigunakanuntuk menentukanbilaX=5,maka 'Y =0.468,karena 'Y = Y1,makaY= 21Y', sehingga untuk X=5 ,Y = 4.566 , artinya jika anak berumur 5 tahun, maka rata-rata tingkat plasma pada polyamine adalah 4,566. Darinilainilaidiatas,dihitungSelangkepercayaandengantingkat kesalahan 5 % sebagai berikut : Dari persamaan (8) : JKS* = JKS () ( 1 + 23223 , 25 . 0t) = 30.621 ( ! +23) 07 . 2 (2) = 36,326 Denganmenarikgarishorizontalpadanilai36,326padasumbuy , makaakan diperolehnilaibawahdanatasuntuk.SehinggaSKuntukadalah-1,16