Upload
dita-arifianti
View
500
Download
28
Embed Size (px)
DESCRIPTION
kapita selekta
Citation preview
TUGAS KELOMPOK 6
MATA KULIAH KAPITA SELEKTA
“RESAMPLING”
OLEH :
1. Apry Zakaria Ramadhan (0910950023)
2. Evellin Dewi Lusiana (0910950037)
3. Nur Istiqomah (0910953007)
4. Dita F. Aprianti (0910953023)
5. Prawitra Kusumastuti (0910953041)
6. Ridia Nurul Hijjah (0910953043)
PROGRAM STUDI STATISTIKA
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2012
BAB I
PENDAHULUAN
1.1. Latar Belakang
Dalam statistika, penelitian atau pengamatan dilakukan terhadap sampel yaitu
sekumpulan individu yang mewakili populasi. Semakin besar ukuran smapel yang
digunakan maka semakin baik hasil penelitian karena bisa mendekati keadaan populasi
yang sebenarnya. Akan tetapi, mendapatkan ukuran sampel yang besar juga memerlukan
waktu, tenaga dan biaya yang besar, oleh karena itu seringkali seorang peneliti hanya
mampu mengadakan penelitian dengan ukuran sampel yang kecil. Hal ini kemudian
menimbulkan permasalahan di mana hasil penelitian menjadi tidak bisa benar-benar
merepresentasi populasi yang sebenarnya atau dengan kata lain akan terjadi bias. Salah
satu solusi untuk mengatasi hal ini adalah melalui metode resampling.
Resampling adalah suatu metode yang memungkinkan kita melakukan sampling
dari data sampel, sehingga seolah-olah data hasil penelitian tersebut merupakan populasi.
Terdapat dua metode resampling yang saat ini banyak digunakan yaitu dengan
menggunakan subset dari data yang tersedia (jackknifing) atau menggambar secara acak
dengan penggantian dari satu set titik data ( bootstrapping ). Bootstrap dan jackknife
umumnya bertujuan untuk menaksir salah baku dan selang kepercayaan parameter
populasi, seperti mean, median, koefisien korelasi dan regresi, dengan tidak
memperhatikan asumsi distribusi.
Metode bootstrap adalah metode resampling N data baru dari sampel asal
berukuran n (N<n) di mana setiap kali sampling dilakukan pengembalian terhadap data
asal. Banyaknya sampling yang dilakukan bisa mencapai ribuan kali. Sedangkan metode
Jackknife adalah metode resampling n-1 data baru dari sampel asal berukuran n, yang
mana setiap kali sampling dilakukan pengembalian. Banyaknya sampling yang dilakukan
adalah n kali.
1.2. Permasalahan
Permasalahan yang akan dibahas dalam makalah ini yaitu:
- Apa yang dimaksud dengan metode resampling bootstrap dan jackknife?
- Bagaimana prosedur metode resampling bootstrap dan jackknife?
- Bagaimana contoh penerapan metode bootstrap dan jackknife?
1.3. Tujuan
Tujuan pembuatan makalah ini yaitu:
- Untuk mengetahui pengertian metode resampling bootstrap dan jackknife
- Untuk mengetahui prosedur metode resampling bootstrap dan jackknife
- Untuk mengetahui cara menerapkan metode bootstrap dan jackknife
BAB II
TINJAUAN PUSTAKA
2.1. Metode Bootstrap
Metode Bootstrap pertama kali diperkenalkan oleh Efron dan Tibshirani pada tahun
1979. Bootstrap berasal dari kata “pull oneself up one’s bootstrap” yang berarti berpijak di
atas kaki sendiri. Hal ini mengandung pengertian bahwa data yang berukuran kecil, data yang
menyimpang dari asumsi-asumsi distribusi tertentu dan data yang tidak memiliki asumsi
mengenai asumsi distribusi populasi (Efron dan Tibshirani, 1993).
Metode bootstrap didasarkan pada prosedur resampling yaitu penarikan contoh acak
secara berulang yang dilakukan dengan pengembalian. Metode ini memungkinkan peneliti
untuk melakukan inferensi tanpa membuat anggapan atau asumsi mengenai distribusi
populasi yang kuat dan tidak membutuhkan rumus analisitis untuk menduga distribusi sampel
(Tinungki, 2000).
Langkah-langkah dalam prosedur Bootstrap yaitu ():
1. Sampel asal, dari eksperimen atau simulasi, berukuran n.
2. Resample berukuran N (N<n) dengan pengembalian sehingga, didapatkan Resampel
ke i (i = 1, 2, . . . , B). Hasil akan menjadi baik jika B>150 (Efron dan Tibshirani,
1993).
3. Perhitungan penaksir setiap hasil resample, didapatkan : ; bentuk
umumnya θ̂b , i
4. Perhitungan penaksir bootstrap
- Rata-rata (Mean)
- Ragam
- Selang kepercayaan
Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang
disebut selang persentil yaitu
di mana:
= penduga rata-rata bootstrap terurut
Lower = (α/2)B
Upper = (1-α/2)B
2.2. Metode Jackknife
Metode Jackknife pertama kalai diperkenalkan oleh Quenouille pada tahun 1949
dengan tujuan untuk mengurangi bias. Metode ini kemudian dikembangkan oleh Tukey pada
tahuj 1958 sehingga terbentuk metode umum untuk memperkirakan ragam sebuah parameter.
Tidak seperti metode Bootstrap yang mana banyaknya resample bisa mencapai ribuan, pada
metode Jackknife resample dilakukan sebanyak n kali atau sama dengan ukuran contoh.
Cara kerja metode Jackknife adalah sebagai berikut:
1. Sampel asal, berukuran n.
2. Resample berukuran n-1 dengan mengeluarkan pengamatan ke i, i = 1, 2, ... , n
sehingga didapatkan Resample ke i (i = 1, 2, . . . , n).
5. Perhitungan penaksir setiap hasil resample, didapatkan : ; bentuk
umumnya
6. Perhitungan penaksir bootstrap
- Rata-rata (Mean)
- Ragam
- Selang kepercayaan
Dalam resampling biasanya digunakan selang kepercayaan nonparametric yang
disebut selang persentil yaitu
di mana:
= penduga rata-rata bootstrap terurut
Lower = (α/2)n
Upper = (1-α/2)n
BAB III
CONTOH SOAL DAN PEMBAHASAN
Berikut ini adalah data yang menunjukkan skor hasil efektivitas mahasiswa prodi
Statistika angkatan 2009 kelas A dalam mengikuti mata kuliah Statistika Non Parametrik
pada pagi hari dan siang hari :
Responden Pagi siang 1 16 12 2 17 13 3 14 12 4 14 10 5 16 10 6 16 10 7 16 16 8 16 10 9 17 10 10 18 15 11 16 15 12 15 13 13 16 12 14 10 12 15 15 10 16 17 14 17 16 13 18 12 7 19 16 10 20 16 12 21 15 11 22 12 12 23 16 10 24 16 12 25 12 5 26 14 14
27 14 14 28 14 10 29 18 9 30 18 9 31 17 13
Dari data tersebut, dapat dicari selisih antara skor efektivitas pada siang hari dengan pagi hari
sebagai berikut:
Responden Pagi Siang d 1 16 12 -4 2 17 13 -4 3 14 12 -2 4 14 10 -4 5 16 10 -6 6 16 10 -6 7 16 16 0 8 16 10 -6 9 17 10 -7 10 18 15 -3 11 16 15 -1 12 15 13 -2 13 16 12 -4 14 10 12 2 15 15 10 -5 16 17 14 -3 17 16 13 -3 18 12 7 -5 19 16 10 -6 20 16 12 -4 21 15 11 -4 22 12 12 0 23 16 10 -6 24 16 12 -4 25 12 5 -7 26 14 14 0 27 14 14 0 28 14 10 -4 29 18 9 -9 30 18 9 -9 31 17 13 -4
Dengan menggunakan metode Bootstarp dan Jackknife akan dilakukan resampling untuk
menduga apakah efektivitas mengikuti kuliah Statistika NonParamterik pada pagi dan siang
hari adalah berbeda.
3.1 Metode Bootstrap
Dengan menggunakan metode bootstrap akan dilakukan resampling dengan
pengembalian dengan nb= 16 dan B=500 .
Proses Penerapan Metode Bootstrap terhadap d dengan bantuan Ms. Excel 2007, langkah-
langkahnya adalah sebagai berikut :
1. Input data d pada worksheet seperti gambar
2. Blok cells yang memuat original data sample d tersebut lalu definisikan ‘Name’
sebagai ‘Samples’.
3. Lakukan pengacakan data sebanyak nb= 16 . Pada cell A10 isikan rumus:
=INDEX(Samples;ROWS(Samples)*RAND()+1;COLUMNS(Samples)*RAND()+1)
Lalu hold and drag sampai cell P10, sehingga diperoleh hasil seperti pada gambar
berikut:
4. Blok range A10:P10, lalu hold drag hingga baris ke 509 supaya diperoleh
pengulangan bootstrap sebanyak 500
5. Cari rata-rata dari masing-masing pengulangan dengan mengisikan rumus:
=AVERAGE(A10:P10) di cell R10 untuk perulangan ke 1, lalu hold and drag
sampai R509 untuk pengulangan ke 500.
6. Untuk mencari d.., isikan rumus: =AVERAGE(R10:R509) pada cell tertentu misal
S10. Sedangkan untuk mencari Sd.., isikan rumus =STDEV(R10:R509) pada cell S10.
7. Apabila kita tertarik untuk mencari interval konfidensi dari d.., maka lakukan
langkah berikut untuk sembarang cell.
8. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :
Pada kolom X : Isikan angka bin seperti pada cell X17 sampai X37
Pada kolom Y : isikan formula
=FREQUENCY(R10:R509;X17:X37)
Saat kursor masih berada di cell Y17, blok cell Y17:Y37, lalu tekan F2, lalu
tekan Ctrl+Shift+Enter
Pada cell Y38 : isikan formula =SUM(Y17:Y37)
Pada kolom Z : isikan formula =SUM(Y17/Y$38) lalu hold and drag
sampai Z37
Data yang digunakan untuk membuat Chart adalah dari ‘bin’ sebagai sumbu-X dan
‘Probability’ sebagai sumbu-Y.
Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih
Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi
kepekatan, pilih Chart dengan Scatter With Smooth Lines.
HASIL :
Hipotesis:
H0 : µsiang - µpagi = 0 atau H1 : µd = 0
H0 : µsiang - µpagi ≠ 0 H1 : µd ≠ 0
Dalam menerapkan metode bootstrap ini, resampling dilakukan terhadap d . dengan bantuan
software MS. Excel 2007 diperoleh hasil sebagai berikut :
d .. = -2,93538
Sd .. = 0,03158
Zhit = d ..−0
Sd ..
=−2,935380,03158
=−94.51315
Untuk nilai Z = −94.51315 memiliki p-value = 0,0000
Karena p-value < α, maka H0 ditolak
Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik
pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.
Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi
hari lebih efektif/baik daripada kuliah pada siang hari.
Selain itu dengan metode bootstrap ini, dapat pula dicari interval konfidensi untuk
rata-rata d, yaitu
P(-4,25 ≤ µd ≤ -1,75) = 1-(2*0,05)
P(-4,25 ≤ µd ≤ -1,75) = 0,90
Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga
efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah
berbeda.
Gambar 3.1. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan 500 pengulangan
bootstrap
3.2 Metode Jackknife
Dengan menggunakan metode jackknife akan dilakukan resampling dengan
pengambilan dan pengembalian sebanyak n (n=31)
Proses Penerapan Metode jackknife terhadap d dengan bantuan Ms. Excel 2007, langkah-
langkahnya adalah sebagai berikut :
1. Input data d pada worksheet seperti gambar:
2. Resample dengan mengeluarkan elemen sampel ke i, i = 1, 2, ... , n. Didapatkan Resample ke i (i = 1, 2, . . . , n).
3. Perhitungan penaksir setiap hasil resample, didapatkan : nilai rata-rata dan nilai standar deviasi (akan didapatkan 31 nilai rata-rata dan nilai standar deviasi)
4. Kemudian hitung nilai rata-rata dari ke-31 nilai rata-rata yang telah diperoleh dan hitung nilai rata-rata dari ke-31 nilai standar deviasi yang telah diperoleh.
5. Apabila kita tertarik untuk mencari interval konfidensi dari d.., maka lakukan
langkah berikut untuk sembarang cell.
6. Apabila kita ingin membuat histogram dan fungsi kepekatan dari d :
Pada kolom F : Isikan angka bin seperti pada cell F37 sampai F58
Pada kolom G : isikan formula
=FREQUENCY(D34:AH34;F37:F58)
Saat kursor masih berada di cell G37, blok cell G37:G58, lalu tekan F2, lalu
tekan Ctrl+Shift+Enter
Pada cell Y38 : isikan formula =SUM(G37:G58)
Pada kolom H : isikan formula =SUM(G37/G$59) lalu hold and drag
sampai H58
Data yang digunakan untuk membuat Chart adalah dari ‘bin’ sebagai sumbu-X dan
‘Probability’ sebagai sumbu-Y.
Untuk menampilkan histogram pilih chart dengan model Column (pada trendline pilih
Two Average Moving Average). Sedangkan untuk menampilkan gambar fungsi
kepekatan, pilih Chart dengan Scatter With Smooth Lines.
HASIL :
Hipotesis:
H0 : µsiang - µpagi = 0 atau H1 : µd = 0
H0 : µsiang - µpagi ≠ 0 H1 : µd ≠ 0
Dalam menerapkan metode jackknife ini, resampling dilakukan terhadap d . dengan bantuan
software MS. Excel 2007 diperoleh hasil sebagai berikut :
d .. = -3.87097
Sd .. = 0.689
Zhit = d ..−0
Sd ..
=−3.870970.689
=−5.61967
Untuk nilai Z = −5.61967 memiliki p-value = 0.000
Karena p-value <α, maka H0 ditolak.
Jadi, dapat disimpulkan bahwa efektivitas mengikuti kuliah Statistika Non Parametrik
pada siang hari dan pagi hari adalah berbeda dengan keyakinan 90%.
Lebih spesifik, terlihat bahwa mengikuti kuliah Statistika Non Parametrik pada pagi
hari lebih efektif/baik daripada kuliah pada siang hari.
Selain itu dengan metode jackknife ini, dapat pula dicari interval konfidensi untuk
rata-rata d, yaitu
P(-4,06667 ≤ µd ≤ -3,76667) = 1-(2*0,05)
P(-4,06667 ≤ µd ≤ -3,76667) = 0,90
Karena µd = 0 tidak masuk dalam selang interval tersebut, maka H0 ditolak. Sehingga
efektivitas mengikuti kuliah Statistika NonParametrik pada siang hari dan pagi hari adalah
berbeda.
Gambar 3.2. Histogram dan fungsi kepekatan Nilai tengah d berdasarkan metode jackknife
BAB IV
PENUTUP
4.1. Kesimpulan
Berdasarkan hasil analisis dan uraian yang telah dijabarkan, dapat disimpulkan
beberapa hal sebagai berikut:
- Resampling adalah metode pengambilan contoh acak dari data hasil pengamatan
- Metode resampling yang banyak digunakan adalah Bootstrap dan Jackknife
- Metode Bootstrap adalah metode pengambilan contoh acak N dari contoh
berukuran n dengan pengembalian sebanyak B kali
- Metode Jackknife adalah metode pengambilan contoh acak n-1 dari contoh
berukuran n dengan pengembalian sebanyak n kali
- Untuk contoh soal yang ada, kedua metode resampling menghasilkan kesimpulan
yang sama yaitu efektivitas mengikuti kuliah Statistika Non Parametrik pada siang
hari dan pagi hari adalah berbeda dengan keyakinan 90%.
4.2. Saran
Saran yang dapat disampaikan yaitu apabila memungkinkan, maka sebaiknya peneliti
menggunakan ukuran contoh yang besar. Namun, jika tidak maka disarankan untuk
menggunakan metode resampling.
DAFTAR PUSTAKA
Anonymous. 2012. Resume Bootstrap dan Jackknife. http://oc.its.ac.id/ambilfile.php?
idp=1150 diakses pada tanggal 20 Oktober 2012
Sahinler, S. dan Topuz, D. 2007. Bootstrap and Jackknife Resampling Algorithms for
Estimation of Regression Parameter. Journal of Quantitative Method (2): 188-199
Tinungki, G. M. 2007. Skripsi: Perbandingan Ragam Penduga Regresi Linier Sederhana
untuk Penarikan Contoh Dua Tahap dengan Metode Bootstrap. Metode Jackknife dan
Metode Klasik. IPB : Bogor