23
TUGAS KELOMPOK 6 MATA KULIAH KAPITA SELEKTA “RESAMPLING” OLEH : 1. Apry Zakaria Ramadhan (0910950023) 2. Evellin Dewi Lusiana (0910950037) 3. Nur Istiqomah (0910953007) 4. Dita F. Aprianti (0910953023) 5. Prawitra Kusumastuti (0910953041) 6. Ridia Nurul Hijjah (0910953043) PROGRAM STUDI STATISTIKA JURUSAN MATEMATIKA

makalah resampling FIX.docx

Embed Size (px)

DESCRIPTION

kapita selekta

Citation preview

Page 1: makalah resampling FIX.docx

TUGAS KELOMPOK 6

MATA KULIAH KAPITA SELEKTA

“RESAMPLING”

OLEH :

1. Apry Zakaria Ramadhan (0910950023)

2. Evellin Dewi Lusiana (0910950037)

3. Nur Istiqomah (0910953007)

4. Dita F. Aprianti (0910953023)

5. Prawitra Kusumastuti (0910953041)

6. Ridia Nurul Hijjah (0910953043)

PROGRAM STUDI STATISTIKA

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS BRAWIJAYA

MALANG

2012

Page 2: makalah resampling FIX.docx

BAB I

PENDAHULUAN

1.1. Latar Belakang

Dalam statistika, penelitian atau pengamatan dilakukan terhadap sampel yaitu

sekumpulan individu yang mewakili populasi. Semakin besar ukuran smapel yang

digunakan maka semakin baik hasil penelitian karena bisa mendekati keadaan populasi

yang sebenarnya. Akan tetapi, mendapatkan ukuran sampel yang besar juga memerlukan

waktu, tenaga dan biaya yang besar, oleh karena itu seringkali seorang peneliti hanya

mampu mengadakan penelitian dengan ukuran sampel yang kecil. Hal ini kemudian

menimbulkan permasalahan di mana hasil penelitian menjadi tidak bisa benar-benar

merepresentasi populasi yang sebenarnya atau dengan kata lain akan terjadi bias. Salah

satu solusi untuk mengatasi hal ini adalah melalui metode resampling.

Resampling adalah suatu metode yang memungkinkan kita melakukan sampling

dari data sampel, sehingga seolah-olah data hasil penelitian tersebut merupakan populasi.

Terdapat dua metode resampling yang saat ini banyak digunakan yaitu dengan

menggunakan subset dari data yang tersedia (jackknifing) atau menggambar secara acak

dengan penggantian dari satu set titik data ( bootstrapping ). Bootstrap dan jackknife

umumnya bertujuan untuk menaksir salah baku dan selang kepercayaan parameter

populasi, seperti mean, median, koefisien korelasi dan regresi, dengan tidak

memperhatikan asumsi distribusi.

Metode bootstrap adalah metode resampling N data baru dari sampel asal

berukuran n (N<n) di mana setiap kali sampling dilakukan pengembalian terhadap data

asal. Banyaknya sampling yang dilakukan bisa mencapai ribuan kali. Sedangkan metode

Jackknife adalah metode resampling n-1 data baru dari sampel asal berukuran n, yang

mana setiap kali sampling dilakukan pengembalian. Banyaknya sampling yang dilakukan

adalah n kali.

Page 3: makalah resampling FIX.docx

1.2. Permasalahan

Permasalahan yang akan dibahas dalam makalah ini yaitu:

- Apa yang dimaksud dengan metode resampling bootstrap dan jackknife?

- Bagaimana prosedur metode resampling bootstrap dan jackknife?

- Bagaimana contoh penerapan metode bootstrap dan jackknife?

1.3. Tujuan

Tujuan pembuatan makalah ini yaitu:

- Untuk mengetahui pengertian metode resampling bootstrap dan jackknife

- Untuk mengetahui prosedur metode resampling bootstrap dan jackknife

- Untuk mengetahui cara menerapkan metode bootstrap dan jackknife

Page 4: makalah resampling FIX.docx

BAB II

TINJAUAN PUSTAKA

2.1. Metode Bootstrap

Metode Bootstrap pertama kali diperkenalkan oleh Efron dan Tibshirani pada tahun

1979. Bootstrap berasal dari kata “pull oneself up one’s bootstrap” yang berarti berpijak di

atas kaki sendiri. Hal ini mengandung pengertian bahwa data yang berukuran kecil, data yang

menyimpang dari asumsi-asumsi distribusi tertentu dan data yang tidak memiliki asumsi

mengenai asumsi distribusi populasi (Efron dan Tibshirani, 1993).

Metode bootstrap didasarkan pada prosedur resampling yaitu penarikan contoh acak

secara berulang yang dilakukan dengan pengembalian. Metode ini memungkinkan peneliti

untuk melakukan inferensi tanpa membuat anggapan atau asumsi mengenai distribusi

populasi yang kuat dan tidak membutuhkan rumus analisitis untuk menduga distribusi sampel

(Tinungki, 2000).

Langkah-langkah dalam prosedur Bootstrap yaitu ():

1. Sampel asal, dari eksperimen atau simulasi, berukuran n.

2. Resample berukuran N (N<n) dengan pengembalian sehingga, didapatkan Resampel

ke i (i = 1, 2, . . . , B). Hasil akan menjadi baik jika B>150 (Efron dan Tibshirani,

1993).

3. Perhitungan penaksir setiap hasil resample, didapatkan : ; bentuk

umumnya θ̂b , i

4. Perhitungan penaksir bootstrap

- Rata-rata (Mean)

- Ragam

Page 5: makalah resampling FIX.docx

- Selang kepercayaan

Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang

disebut selang persentil yaitu

di mana:

= penduga rata-rata bootstrap terurut

Lower = (α/2)B

Upper = (1-α/2)B

2.2. Metode Jackknife

Metode Jackknife pertama kalai diperkenalkan oleh Quenouille pada tahun 1949

dengan tujuan untuk mengurangi bias. Metode ini kemudian dikembangkan oleh Tukey pada

tahuj 1958 sehingga terbentuk metode umum untuk memperkirakan ragam sebuah parameter.

Tidak seperti metode Bootstrap yang mana banyaknya resample bisa mencapai ribuan, pada

metode Jackknife resample dilakukan sebanyak n kali atau sama dengan ukuran contoh.

Cara kerja metode Jackknife adalah sebagai berikut:

1. Sampel asal, berukuran n.

2. Resample berukuran n-1 dengan mengeluarkan pengamatan ke i, i = 1, 2, ... , n

sehingga didapatkan Resample ke i (i = 1, 2, . . . , n).

5. Perhitungan penaksir setiap hasil resample, didapatkan : ; bentuk

umumnya

6. Perhitungan penaksir bootstrap

- Rata-rata (Mean)

Page 6: makalah resampling FIX.docx

- Ragam

- Selang kepercayaan

Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang

disebut selang persentil yaitu

di mana:

= penduga rata-rata bootstrap terurut

Lower = (α/2)n

Upper = (1-α/2)n

Page 7: makalah resampling FIX.docx

BAB III

CONTOH SOAL DAN PEMBAHASAN

Berikut ini adalah data yang menunjukkan skor hasil efektivitas mahasiswa prodi

Statistika angkatan 2009 kelas A dalam mengikuti mata kuliah Statistika Non Parametrik

pada pagi hari dan siang hari :

Responden Pagi siang 1 16 12 2 17 13 3 14 12 4 14 10 5 16 10 6 16 10 7 16 16 8 16 10 9 17 10 10 18 15 11 16 15 12 15 13 13 16 12 14 10 12 15 15 10 16 17 14 17 16 13 18 12 7 19 16 10 20 16 12 21 15 11 22 12 12 23 16 10 24 16 12 25 12 5 26 14 14

Page 8: makalah resampling FIX.docx

27 14 14 28 14 10 29 18 9 30 18 9 31 17 13

Dari data tersebut, dapat dicari selisih antara skor efektivitas pada siang hari dengan pagi hari

sebagai berikut:

Responden Pagi Siang d 1 16 12 -4 2 17 13 -4 3 14 12 -2 4 14 10 -4 5 16 10 -6 6 16 10 -6 7 16 16 0 8 16 10 -6 9 17 10 -7 10 18 15 -3 11 16 15 -1 12 15 13 -2 13 16 12 -4 14 10 12 2 15 15 10 -5 16 17 14 -3 17 16 13 -3 18 12 7 -5 19 16 10 -6 20 16 12 -4 21 15 11 -4 22 12 12 0 23 16 10 -6 24 16 12 -4 25 12 5 -7 26 14 14 0 27 14 14 0 28 14 10 -4 29 18 9 -9 30 18 9 -9 31 17 13 -4

Page 9: makalah resampling FIX.docx

Dengan menggunakan metode Bootstarp dan Jackknife akan dilakukan resampling untuk

menduga apakah efektivitas mengikuti kuliah Statistika NonParamterik pada pagi dan siang

hari adalah berbeda.

3.1 Metode Bootstrap

Dengan menggunakan metode bootstrap akan dilakukan resampling dengan

pengembalian dengan nb= 16 dan B=500 .

Proses Penerapan Metode Bootstrap terhadap d dengan bantuan Ms. Excel 2007, langkah-

langkahnya adalah sebagai berikut :

1. Input data d pada worksheet seperti gambar

2. Blok cells yang memuat original data sample d tersebut lalu definisikan ‘Name’

sebagai ‘Samples’.

3. Lakukan pengacakan data sebanyak nb= 16 . Pada cell A10 isikan rumus:

=INDEX(Samples;ROWS(Samples)*RAND()+1;COLUMNS(Samples)*RAND()+1)

Lalu hold and drag sampai cell P10, sehingga diperoleh hasil seperti pada gambar

berikut:

4. Blok range A10:P10, lalu hold drag hingga baris ke 509 supaya diperoleh

pengulangan bootstrap sebanyak 500

5. Cari rata-rata dari masing-masing pengulangan dengan mengisikan rumus:

=AVERAGE(A10:P10) di cell R10 untuk perulangan ke 1, lalu hold and drag

sampai R509 untuk pengulangan ke 500.

6. Untuk mencari d.., isikan rumus: =AVERAGE(R10:R509) pada cell tertentu misal

S10. Sedangkan untuk mencari Sd.., isikan rumus =STDEV(R10:R509) pada cell S10.

Page 10: makalah resampling FIX.docx

7. Apabila kita tertarik untuk mencari interval konfidensi dari d.., maka lakukan

langkah berikut untuk sembarang cell.

8. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :

Page 11: makalah resampling FIX.docx

Pada kolom X : Isikan angka bin seperti pada cell X17 sampai X37

Pada kolom Y : isikan formula

=FREQUENCY(R10:R509;X17:X37)

Saat kursor masih berada di cell Y17, blok cell Y17:Y37, lalu tekan F2, lalu

tekan Ctrl+Shift+Enter

Pada cell Y38 : isikan formula =SUM(Y17:Y37)

Pada kolom Z : isikan formula =SUM(Y17/Y$38) lalu hold and drag

sampai Z37

Data yang digunakan untuk membuat Chart adalah dari ‘bin’ sebagai sumbu-X dan

‘Probability’ sebagai sumbu-Y.

Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih

Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi

kepekatan, pilih Chart dengan Scatter With Smooth Lines.

HASIL :

Hipotesis:

H0 : µsiang - µpagi = 0 atau H1 : µd = 0

H0 : µsiang - µpagi ≠ 0 H1 : µd ≠ 0

Dalam menerapkan metode bootstrap ini, resampling dilakukan terhadap d . dengan bantuan

software MS. Excel 2007 diperoleh hasil sebagai berikut :

d .. = -2,93538

Sd .. = 0,03158

Zhit = d ..−0

Sd ..

=−2,935380,03158

=−94.51315

Untuk nilai Z = −94.51315 memiliki p-value = 0,0000

Karena p-value < α, maka H0 ditolak

Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik

pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.

Page 12: makalah resampling FIX.docx

Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi

hari lebih efektif/baik daripada kuliah pada siang hari.

Selain itu dengan metode bootstrap ini, dapat pula dicari interval konfidensi untuk

rata-rata d, yaitu

P(-4,25 ≤ µd ≤ -1,75) = 1-(2*0,05)

P(-4,25 ≤ µd ≤ -1,75) = 0,90

Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga

efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah

berbeda.

Gambar 3.1. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan 500 pengulangan

bootstrap

3.2 Metode Jackknife

Dengan menggunakan metode jackknife akan dilakukan resampling dengan

pengambilan dan pengembalian sebanyak n (n=31)

Page 13: makalah resampling FIX.docx

Proses Penerapan Metode jackknife terhadap d dengan bantuan Ms. Excel 2007, langkah-

langkahnya adalah sebagai berikut :

1. Input data d pada worksheet seperti gambar:

2. Resample dengan mengeluarkan elemen sampel ke i, i = 1, 2, ... , n. Didapatkan Resample ke i (i = 1, 2, . . . , n).

Page 14: makalah resampling FIX.docx

3. Perhitungan penaksir setiap hasil resample, didapatkan : nilai rata-rata dan nilai standar deviasi (akan didapatkan 31 nilai rata-rata dan nilai standar deviasi)

4. Kemudian hitung nilai rata-rata dari ke-31 nilai rata-rata yang telah diperoleh dan hitung nilai rata-rata dari ke-31 nilai standar deviasi yang telah diperoleh.

5. Apabila kita tertarik untuk mencari interval konfidensi dari d.., maka lakukan

langkah berikut untuk sembarang cell.

6. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :

Page 15: makalah resampling FIX.docx

Pada kolom F : Isikan angka bin seperti pada cell F37 sampai F58

Pada kolom G : isikan formula

=FREQUENCY(D34:AH34;F37:F58)

Saat kursor masih berada di cell G37, blok cell G37:G58, lalu tekan F2, lalu

tekan Ctrl+Shift+Enter

Pada cell Y38 : isikan formula =SUM(G37:G58)

Pada kolom H : isikan formula =SUM(G37/G$59) lalu hold and drag

sampai H58

Data yang digunakan untuk membuat Chart adalah dari ‘bin’ sebagai sumbu-X dan

‘Probability’ sebagai sumbu-Y.

Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih

Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi

kepekatan, pilih Chart dengan Scatter With Smooth Lines.

HASIL :

Hipotesis:

H0 : µsiang - µpagi = 0 atau H1 : µd = 0

H0 : µsiang - µpagi ≠ 0 H1 : µd ≠ 0

Dalam menerapkan metode jackknife ini, resampling dilakukan terhadap d . dengan bantuan

software MS. Excel 2007 diperoleh hasil sebagai berikut :

d .. = -3.87097

Sd .. = 0.689

Zhit = d ..−0

Sd ..

=−3.870970.689

=−5.61967

Page 16: makalah resampling FIX.docx

Untuk nilai Z = −5.61967 memiliki p-value = 0.000

Karena p-value <α, maka H0 ditolak.

Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik

pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.

Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi

hari lebih efektif/baik daripada kuliah pada siang hari.

Selain itu dengan metode jackknife ini, dapat pula dicari interval konfidensi untuk

rata-rata d, yaitu

P(-4,06667 ≤ µd ≤ -3,76667) = 1-(2*0,05)

P(-4,06667 ≤ µd ≤ -3,76667) = 0,90

Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga

efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah

berbeda.

Gambar 3.2. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan metode jackknife

Page 17: makalah resampling FIX.docx

BAB IV

PENUTUP

4.1. Kesimpulan

Berdasarkan hasil analisis dan uraian yang telah dijabarkan, dapat disimpulkan

beberapa hal sebagai berikut:

- Resampling adalah metode pengambilan contoh acak dari data hasil pengamatan

- Metode resampling yang banyak digunakan adalah Bootstrap dan Jackknife

- Metode Bootstrap adalah metode pengambilan contoh acak N dari contoh

berukuran n dengan pengembalian sebanyak B kali

- Metode Jackknife adalah metode pengambilan contoh acak n-1 dari contoh

berukuran n dengan pengembalian sebanyak n kali

- Untuk contoh soal yang ada, kedua metode resampling menghasilkan kesimpulan

yang sama yaitu efektivitas mengikuti kuliah Statistika Non Parametrik pada siang

hari dan pagi hari adalah berbeda dengan keyakinan 90%.

4.2. Saran

Saran yang dapat disampaikan yaitu apabila memungkinkan, maka sebaiknya peneliti

menggunakan ukuran contoh yang besar. Namun, jika tidak maka disarankan untuk

menggunakan metode resampling.

Page 18: makalah resampling FIX.docx

DAFTAR PUSTAKA

Anonymous. 2012. Resume Bootstrap dan Jackknife. http://oc.its.ac.id/ambilfile.php?

idp=1150 diakses pada tanggal 20 Oktober 2012

Sahinler, S. dan Topuz, D. 2007. Bootstrap and Jackknife Resampling Algorithms for

Estimation of Regression Parameter. Journal of Quantitative Method (2): 188-199

Tinungki, G. M. 2007. Skripsi: Perbandingan Ragam Penduga Regresi Linier Sederhana

untuk Penarikan Contoh Dua Tahap dengan Metode Bootstrap. Metode Jackknife dan

Metode Klasik. IPB : Bogor