DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN …eprints.undip.ac.id/55059/1/Fatimah.pdf · Pada kesempatan ini ... 4.4.2 Penentuan Tetangga Terdekat Sebanyak k pada Setiap Data Bootstrap

ANALISIS CREDIT SCORING MENGGUNAKAN METODEBAGGING K-NEAREST NEIGHBOR

SKRIPSI

Disusun oleh :

FATIMAH24010210120028

DEPARTEMEN STATISTIKAFAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGOROSEMARANG

2016

iv

KATA PENGANTAR

Puji syukur penulis ucapkan atas kehadirat Allah SWT yang telah melimpahkan

rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir yang

berjudul “Analisis Credit Scoring Menggunakan Metode Bagging k-Nearest

Neighbor”. Pada kesempatan ini penulis ingin mengucapkan terima kasih kepada:

1. Bapak Dr. Tarno, M.Si. selaku Ketua Departemen Statistika Fakultas

Sains dan Matematika.

2. Bapak Moch. Abdul Mukid, S.Si, M.Si. dan Bapak Drs. Agus Rusgiyono,

M.Si. sebagai dosen pembimbing yang telah memberikan bimbingan dan

pengarahan dalam penulisan tugas akhir ini.

3. Bapak dan Ibu dosen Departemen Statistika Fakultas Sains dan

Matematika Universitas Diponegoro yang telah memberikan ilmu yang

bermanfaat.

4. Semua pihak yang tidak dapat disebutkan satu per satu yang telah

mendukung penulis menyelesaikan tugas akhir ini.

Penulis berharap tugas akhir ini dapat bermanfaat bagi civitas akademika di

Universitas Diponegoro, khususnya Departemen Statistika dan masyarakat

pada umumnya.

Semarang, November 2016

Penulis

v

ABSTRAK

Menurut Melayu (2004) kredit adalah semua jenis pinjaman yang harus dibayar kembali

bersama bunganya oleh peminjam sesuai dengan perjanjian yang telah disepakati.

Untuk tetap menjaga kualitas kredit yang diberikan dan menghindari kegagalan

keuangan bank akibat resiko kredit yang terlalu besar, maka dibutuhkan cara untuk

mengidentifikasi nasabah berpotensi kredit macet yakni salah satunya dengan metode

Credit Scoring. Satu diantara metode statistika yang dapat digunakan untuk

memprediksi klasifikasi pada Credit Scoring adalah Bagging k-Nearest Neighbor.

Metode ini menggunakan sejumlah k-objek tetangga terdekat antara data testing dengan

data training yang di-resampling sebanyak B kali. Dalam tugas akhir ini, digunakan

enam variabel independen yakni usia, lama kerja, pendapatan bersih, pinjaman lain,

nominal akun, dan rasio hutang. Berdasarkan analisis, diperoleh nilai optimal

parameternya adalah k = 1 dan ketepatan prediksi klasifikasi status kredit menggunakan

Bagging k-Nearest Neighbor adalah sebesar 66,67%.

Kata kunci : Credit scoring, Klasifikasi, Bagging k-Nearest Neighbor

vi

ABSTRACT

According to Melayu (2004) credit is all types of loans that have to be paid along with

the interest by the borrower according to the agreed agreement. To keep the quality of

loans and avoid financial failure of banks due to large credit risks, we need a method to

identified any potentially customer’s with bad credit status, one of the methods is Credit

Scoring. One of Statistical method that can predict the classification for Credit Scoring

called Bagging k-Nearest Neighbor. This Method uses k-object nearest neighbor

between data testing to B-bootstrap of the training dataset. This classification will use

six independence variables to predict the class, these are Age, Work Year, Net Earning,

Other Loan, Nominal Account and Debt Ratio. The result determine k =1 as the optimal

k-value and show that Bagging k-Nearest Neighbor’s accuracy rate is 66,67%.

Key word : Credit scoring, Classification, Bagging k-Nearest Neighbor

ANALISIS CREDIT SCORING MENGGUNAKAN METODEBAGGING K-NEAREST NEIGHBOR

SKRIPSI

Disusun oleh :FATIMAH

24010210120028



2016

i

ANALISIS CREDIT SCORING MENGGUNAKAN METODE

BAGGING K-NEAREST NEIGHBOR

Disusun Oleh :

FATIMAH

24010210120028

Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains

pada Departemen Statistika



2016

ii

HALAMAN PENGESAHAN I

Judul :Analisis Credit Scoring Menggunakan Metode Bagging k-Nearest

Neighbor

Nama : Fatimah

NIM : 24010210120028

Departemen : Statistika

Telah diujikan pada sidang Tugas Akhir dan dinyatakan lulus pada tanggal

3 November 2016.


Mengetahui,

Ketua Panitia PengujiUjian Tugas Akhir,

Prof. Drs. Mustafid,M.Eng,Ph.DNIP. 1955052819800310002

Ketua Departemen StatistikaFSM UNDIP

Dr. Tarno, M.SiNIP. 196307061991021001

iii

HALAMAN PENGESAHAN II

Judul :Analisis Credit Scoring Menggunakan Metode Bagging k-Nearest

Neighbor

Nama : Fatimah

NIM : 24010210120028

Departemen : Statistika

Telah diujikan pada sidang Tugas Akhir tanggal 3 November 2016

Semarang, 3 November 2016

Pembimbing II

Drs. AgusRusgiyono, M.Si

NIP. 196408131990011001

Pembimbing I

Moch. Abdul Mukid, S.Si, M.Si

NIP. 197808172005011001

iv

KATA PENGANTAR

Puji syukur penulis ucapkan atas kehadirat Allah SWT yang telah

melimpahkan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan

tugas akhir yang berjudul “Analisis Credit Scoring Menggunakan Metode

Bagging k-Nearest Neighbor”. Pada kesempatan ini penulis ingin mengucapkan

terima kasih kepada:

1. Bapak Dr. Tarno, M.Si. selaku Ketua Departemen Statistika Fakultas

Sains dan Matematika.

2. Bapak Moch. Abdul Mukid, S.Si, M.Si. dan Bapak Drs. Agus Rusgiyono,

M.Si. sebagai dosen pembimbing yang telah memberikan bimbingan dan

pengarahan dalam penulisan tugas akhir ini.

3. Bapak dan Ibu dosen Departemen Statistika Fakultas Sains dan

Matematika Universitas Diponegoro yang telah memberikan ilmu yang

bermanfaat.

4. Semua pihak yang tidak dapat disebutkan satu per satu yang telah

mendukung penulis menyelesaikan tugas akhir ini.

Penulis berharap tugas akhir ini dapat bermanfaat bagi civitas

akademika di Universitas Diponegoro, khususnya Departemen Statistika dan

masyarakat pada umumnya.


Penulis

v

ABSTRAK

Menurut Melayu (2004) kredit adalah semua jenis pinjaman yang harus

dibayar kembali bersama bunganya oleh peminjam sesuai dengan perjanjian yang

telah disepakati. Untuk tetap menjaga kualitas kredit yang diberikan dan

menghindari kegagalan keuangan bank akibat resiko kredit yang terlalu besar,

maka dibutuhkan cara untuk mengidentifikasi nasabah berpotensi kredit macet

yakni salah satunya dengan metode Credit Scoring. Satu diantara metode

statistika yang dapat digunakan untuk memprediksi klasifikasi pada Credit

Scoring adalah Bagging k-Nearest Neighbor. Metode ini menggunakan sejumlah

k-objek tetangga terdekat antara data testing dengan data training yang di-

resampling sebanyak B kali. Dalam tugas akhir ini, digunakan enam variabel

independen yakni usia, lama kerja, pendapatan bersih, pinjaman lain, nominal

akun, dan rasio hutang. Berdasarkan analisis, diperoleh nilai optimal

parameternya adalah k = 1 dan ketepatan prediksi klasifikasi status kredit

menggunakan Bagging k-Nearest Neighbor adalah sebesar 66,67%.

Kata kunci : Credit scoring, Klasifikasi, Bagging k-Nearest Neighbor

vi

ABSTRACT

According to Melayu (2004) credit is all types of loans that have to be paid along

with the interest by the borrower according to the agreed agreement. To keep the

quality of loans and avoid financial failure of banks due to large credit risks, we

need a method to identified any potentially customer’s with bad credit status, one

of the methods is Credit Scoring. One of Statistical method that can predict the

classification for Credit Scoring called Bagging k-Nearest Neighbor. This Method

uses k-object nearest neighbor between data testing to B-bootstrap of the training

dataset. This classification will use six independence variables to predict the class,

these are Age, Work Year, Net Earning, Other Loan, Nominal Account and Debt

Ratio. The result determine k =1 as the optimal k-value and show that Bagging k-

Nearest Neighbor’s accuracy rate is 66,67%.

Key word : Credit scoring, Classification, Bagging k-Nearest Neighbor

vii

DAFTAR ISIHalaman

HALAMAN JUDUL………......................................................................................i

HALAMAN PENGESAHAN I ....................................................................…….. ii

HALAMAN PENGESAHAN II ...............................................................……….. iii

KATA PENGANTAR…………………………………………………………… iv

ABSTRAK ................................................................................................................v

ABSTRACT.............................................................................................................vi

DAFTAR ISI...........................................................................................................vii

DAFTAR GAMBAR……………………………………………………………. ..ix

DAFTAR TABEL…………………………………………………………………. x

DAFTAR LAMPIRAN…………………………………………………………....xi

BAB I PENDAHULUAN

1.1 Latar Belakang………………………………………………………….1

1.2 Rumusan Masalah…………………………………………...………….3

1.3 BatasanMasalah……………………………………………………... …3

1.4 Tujuan………………………………………………………................. .3

BAB II TINJAUAN PUSTAKA

2.1 Kredit ..…………………………………………………………………4

2.2 Credit Scoring…………………………………………………………. 7

2.3 Data Mining ………..………………………………………................. 7

2.3.1 Klasifikasi…………………………………………………......... 9

2.3.2 Pendekatan Teknik Klasifikasi..………………………………. 10

2.3.3 Analisisk-Nearest Neighbor……………………………..…..... 13

2.3.3.1 Jarak Euclidian………………………………………13

2.3.3.2 Penentuan Parameter………………………………...14

2.3.3.3 Algoritma k-Nearest Neighbor (kNN)………………15

2.3.3.4 Karakteristik Klasifikasi dengan k-NearestNeighbor…………………………………………… 16

2.4 Metode Bagging (Bootstrap Aggregating) ………………………….. 17

viii

BAB III METODE PENELITIAN

3.1 Sumber Data………………………………………………………...... 20

3.2 Variabel Penelitian…………………………………………………… 20

3.3 Metode Penelitian…………………………………………………..... 21

3.4 Diagram Alir………………………………………………………..... 23

BAB IV HASIL DAN PEMBAHASAN

4.1 Deskripsi Data……………………………………………………….. 24

4.2 Pembagian Data……………………………………………………… 25

4.3 Penentuan Nilai Parameter Terbaik………………………………….. 26

4.4 Penentuan Klasifikasi Kelas untuk Observasi Pertama Data Testing.. 27

4.4.1 Perhitungan Jarak antara Data Testing dengan Data Bootstrap..27

4.4.2 Penentuan Tetangga Terdekat Sebanyak k pada Setiap DataBootstrap………………………………………………. 30

4.4.3 Penentuan Kelas dari Observasi Pertama Data TestingBedasarkan Hasil Majority Vote……………………….. 31

4.5 Accuracy (Ketepatan) Hasil Prediksi Gabungan MenggunakanBagging k-Nearest Neighbor……………………………………….…32

BAB V KESIMPULAN…………………………………………………. .35

DAFTAR PUSTAKA……………………………………………………. 36

LAMPIRAN……………………………………………………………… 38

ix

DAFTAR GAMBAR

Halaman

Gambar 1 Ilustrasi Model Klasifikasi……………………………………….11

Gambar 2 Ilustrasi Metode Kombinasi Model…………………….………..18

x

DAFTAR TABELHalaman

Tabel 1 Deskripsi Variabel Usia, Lama Kerja, Pinjaman Lain, PendapatanBersih, Nominal Akun dan Rasio Hutang…..…………............................ 24

Tabel 2 Deskripsi Data Usia, Lama Kerja, Pinjaman Lain, Pendapatan Bersih,Nominal Akun dan Rasio Hutang pada Data Training…………………………… 25

Tabel 3 Deskripsi Data Usia, Lama Kerja, Pinjaman Lain, Pendapatan Bersih,Nominal Akun dan Rasio Hutang pada Data Testing…………………….. 25

Tabel 4 Perbandingan Nilai Error Rate Hasil Klasifikasi Kelas Data Training danData Testing………………………………………………………………. 26

Tabel 5 Data Bootstrap Pertama………………………………………………….. 28

Tabel 6 Observasi Pertama pada Data Testing…………………………………… 28

Tabel 7 Jarak Euclidian Data Bootstrap Pertama ke Data Testing………………...30

Tabel 8 Urutan Jarak dari Nilai yang Terkecil Hingga Terbesar untuk DataBootstrap Pertama………………………………………………………… 31

Tabel 9 Hasil Prediksi Kelas untuk Status Kredit Berdasarkan Jarak dengan DataBootstrap………………………………………………………………….. 32

Tabel 10 Hasil Majority Vote untuk Penentuan Kelas Observasi Pertama DataTesting……………………………………………….………………. 33

xi

DAFTAR LAMPIRAN

Halaman

Lampiran1 Data Training, n = 900 ……………………………………………. 39

Lampiran 2 Data Testing, n = 99 ………………………………………… 40

Lampiran 3 Syntax Cross Validation di SAS………………………………….. 41

Lampiran 4 Syntax Bootstrap di SAS………………………...…………… 42

Lampiran 5 Hasil Klasifikasi Kelas Lengkap Berdasarkan Data BootstrapMenggunakan Majority Vote…………………………..……..43

1

BAB I

PENDAHULUAN

1.1 Latar Belakang

Istilah kredit berasal dari bahasa Yunani yaitu ‘credere’ yang berarti

kepercayaan (Herprasetyo, 2012). Menurut Undang-undang RI nomor 10 tahun

1998, perbankan adalah badan usaha yang menghimpun dana dari masyarakat

dalam bentuk simpanan dan menyalurkan kepada masyarakat dalam bentuk kredit

dan atau bentuk-bentuk lainnya dalam rangka meningkatkan taraf hidup rakyat

banyak. Dalam perundangan yang sama, pengertian kredit adalah suatu

penyediaan uang atau tagihan yang dapat dipersamakan dengan itu, berdasarkan

persetujuan atau kesepakatan pinjam-meminjam antara bank dengan pihak lain

yang mewajibkan pihak peminjam untuk melunasi hutangnya setelah jangka

waktu tertentu dengan pemberian bunga.

Menurut Chapra (2000), kredit harus dialokasikan dengan tujuan membantu

merealisasikan kemaslahatan sosial secara umum. Tujuan dari kesepakatan kredit

menurut Kasmir (2002) adalah memberikan keuntungan bagi bank, membantu

usaha nasabah dan membantu pemerintah. Lebih rincinya, bagi debitur yang tidak

mempunyai cukup modal untuk membuka usaha, kegiatan kredit ini sangat

membantu debitur untuk menjalankan usahanya. Sedangkan untuk pihak bank

sendiri, pemberian kredit memperoleh peningkatan laba bagi bank yang berasal

dari bunga yang dibayarkan oleh nasabah. Dan bagi pemerintah, semakin banyak

kredit yang disalurkan oleh pihak perbankan, maka semakin banyak peningkatan

pembangunan di berbagai sektor. Namun jika ditemui kondisi dimana nasabah

sudah tidak sanggup membayar sebagian atau seluruh kewajibannya kepada bank

2

seperti yang telah diperjanjikan maka kondisi ini disebut dengan kredit macet

(Kuncoro dan Suhardjono, 2002). Semakin banyak jumlah nasabah kredit macet

dalam sebuah bank, akan menghambat kinerja bank dan melemahkan pendapatan

dari usaha perbankan tersebut.

Untuk mencegah terjadinya hal tersebut, maka dibutuhkan metode untuk

membantu pihak bank memprediksi lebih awal potensi kredit macet dari calon

nasabah kredit tersebut. Sehingga dapat dilakukan pertimbangan atas persetujuan

pengajuan kredit oleh calon nasabah tersebut ataukah tidak. Metode untuk menilai

kelayakan dari calon nasabah kredit diantaranya adalah metode Credit Scoring.

Metode statistika yang dapat digunakan untuk mengklasifikasikan kondisi

status kredit nasabah menggunakan Credit Scoring diantaranya adalah metode

k-Nearest Neighbor (kNN). Metode k-Nearest Neighbor, dapat

mengklasifikasikan apakah seorang nasabah kredit termasuk dalam kategori kredit

lancar atau tidak, dengan catatan data-data yang dilibatkan terjamin akurasinya.

Metode k-Nearest Neighbor merupakan kelompok instance-based learning,

dimana pengklasifikasian dilakukan dengan mencari kelompok k objek dalam data

training yang paling dekat dengan objek pada data baru atau data testing.

Telah banyak dilakukan inovasi untuk meningkatkan keakuratan dalam hal

memprediksi suatu klasifikasi, diantaranya seperti yang dikembangkan oleh

Breiman (1996) yakni metode klasifikasi yang menggabungkan dua metode yakni

Bootstrap dan juga Aggregating, dimana metode ini lebih dikenal sebagai metode

Bagging.

3

Berdasarkan latar belakang masalah tersebut dilakukan penelitian dengan

judul “Analisis Credit Scoring Menggunakan Metode Bagging k-Nearest

Neighbor”.

2.1 Perumusan Masalah

Berdasarkan latar belakang yang telah dikemukakan tersebut dapat

dirumuskan masalah yang diteliti adalah bagaimana menerapkan Metode Bagging

k-Nearest Neighbor dalam mengklasifikasi kelompok status kredit macet dan

lancar pada data nasabah bank ‘X’?

3.1 Pembatasan Masalah

Pada penelitian ini terdapat beberapa batasan masalah yang bertujuan agar

pembahasan lebih mudah dan lebih fokus. Batasan masalah tersebut adalah

sebagai berikut:

1) Penelitian ini hanya dibatasi pada data tahun 2011 Laporan kondisi

Nasabah Kredit di Bank ‘X’.

2) Masalah yang diteliti adalah, menganalisis hasil klasifikasi kelompok

nasabah kredit lancar atau macet pada Bank ‘X’ dengan menggunakan

metode Bagging k-Nearest Neighbor.

4.1 Tujuan Penelitian

Tujuan dalam penulisan tugas akhir ini adalah memperoleh hasil prediksi

klasifikasi status kredit macet dan lancar pada data Nasabah Bank ‘X’

menggunakan metode Bagging k-Nearest Neighbor.

4

BAB II

TINJAUAN PUSTAKA

2.1 Kredit

Secara etimologi, kata kredit berasal dari bahasa Yunani yaitu “Cradere’’

yang berarti “Kepercayaan” (Herprasetyo, 2012). Menurut Kasmir (2001), kredit

adalah pemberian prestasi (misalnya uang, barang) dengan balas prestasi (kontra

prestasi) yang akan terjadi pada waktu yang akan datang. Menurut Melayu (2004),

kredit adalah semua jenis pinjaman yang harus dibayar kembali bersama

bunganya oleh peminjam sesuai dengan perjanjian yang telah disepakati.

Pengertian kredit menurut UU No.10 Tahun 1998, yaitu meminjamkan uang atau

tagihan yang dapat dipersamakan dengan itu, berdasarkan perjanjian tertulis baik

dibawah tangan maupun dihadapan notaris dari berbagai pengamanan maka

debitur akan menyerahkan suatu jaminan baik yang berupa kebendaan maupun

yang bukan kebendaan, dan pihak debitur berkewajiban untuk melunasi utangnya

setelah jangka waktu tertentu di masa mendatang dengan balas prestasi yaitu

berupa pemberian bunga.

Bedasarkan pengertian di atas dapat disimpulkan bahwa kredit adalah

pemberian uang atau barang kepada pihak lain yang didasarkan atas kepercayaan

disertai dengan balas jasa dan jangka waktu tertentu. Kredit bermasalah akan

berdampak negatif baik bagi kelangsungan hidup bank itu sendiri maupun bagi

perekonomian negara, menurut Mahmoedin (2002) kondisi tersebut akan

mempengaruhi penghasilan bank, kepercayaan masyarakat kepada bank,

menurunkan tingkat kesehatan bank dan juga mempengaruhi modal bank tidak

dapat berkembang dengan baik.

5

Sebelum kredit diberikan, bank terlebih dahulu mengadakan analisis kredit.

Tujuan analisis ini adalah agar bank yakin bahwa kredit yang diberikan benar-

benar aman dalam arti uang yang disalurkan pasti kembali. Menurut Ismail

(2010), analisis kredit adalah suatu proses analisis kredit yang dilakukan oleh

bank untuk menilai suatu permohonan kredit yang telah diajukan oleh calon

debitur.

Menurut Rivai dan Permata dalam bukunya Credit Management Handbook

(2007), hal-hal yang terlebih dahulu harus dipenuhi adalah prinsip 6C’s analysis,

yaitu sebagai berikut:

1. Character

Character adalah keadaan watak (sifat) dari nasabah, baik dalam

kehidupan pribadi maupun dalam lingkungan usaha. Kegunaan dari

penilaian terhadap karakter ini adalah untuk mengetahui sampai sejauh

mana itikat atau kemauan nasabah untuk memenuhi kewajibannya

(willingness to pay) sesuai dengan perjanjian yang telah ditetapkan.

2. Capital

Capital adalah jumlah dana (modal) sendiri yang dimiliki oleh calon

nasabah. Semakin besar modal sendiri dalam perusahaan, tentu semakin

tinggi kesungguhan calon nasabah dalam menjalankan usahanya dan bank

akan semakin lebih yakin dalam memberikan kredit. Kemampuan modal

sendiri merupakan benteng yang kuat agar tidak mudah mendapat

goncangan dari luar, misalnya jika terjadi kenaikan suku bunga, komposisi

modal sendiri ini perlu ditingkatkan. Penilaian atas besarnya modal sendiri

merupakan hal yang penting mengingat kredit bank hanya sebagai

6

tambahan pembiayaan dan bukan untuk membiayai seluruh modal yang

diperlukan.

3. Capacity

Capacity adalah kemampuan yang dimiliki calon nasabah dalam

menjalankan usahanya guna memperoleh laba yang diharapkan. Kegunaan

dari penilaian ini adalah untuk mengukur (untuk mengetahui) sampai

sejauh mana calon nasabah mampu mengembalikan atau melunasi hutang-

hutangnya (ability to pay) secara tepat waktu dari usaha yang

diperolehnya.

4. Collateral

Collateral adalah barang-barang yang diserahkan nasabah sebagai

agunan terhadap kredit yang diterimanya. Collateral tersebut harus dinilai

oleh bank untuk mengetahui sejauh mana risiko kewajiban finansial

nasabah kepada bank. Penilaian terhadap jaminan ini meliputi jenis, lokasi,

bukti kepemilikan, dan status hukumnya.

5. Condition of economy

Condition of economy, yaitu situasi dan kondisi politik, sosial,

ekonomi, budaya yang memengaruhi keadaan perekonomian pada suatu

saat yang berpotensi memengaruhi kelancaran perusahaan calon debitur.

6. Constraint

Constaint adalah batasan dan hambatan yang tidak memungkinkan

suatu bisnis untuk dilaksanakan pada tempat tertentu, misalkan pendirian

suatu usaha pompa bensin yang disekitarnya banyak bengkel las atau

pembakaran batu bata.

7

2.2 Credit Scoring

Metode credit scoring dapat diterjemahkan sebagai salah satu metode

statistika (atau metode kuantitatif) yang digunakan untuk memprediksi peluang

calon nasabah tidak sanggup membayar kembali pinjaman, ataupun bagi nasabah

kredit yang sudah terdaftar berpeluang menjadi nasabah yang pembayaran

pinjamannya menunggak (Mester, 1997). Penggunaan metode credit scoring ini

dapat membantu pihak yang memberi pinjaman menentukan apakah pengajuan

kredit seorang peminjam dapat disetujui (Morrison, 2004). Dari pernyataan

tersebut dapat disimpulkan bahwa credit scoring atau penilaian kredit adalah

sistem (cara) yang digunakan oleh bank atau lembaga pembiayaan lainnya yang

berguna untuk menentukan apakah yang bersangkutan layak atau tidak

mendapatkan pinjaman. Sedangkan untuk data nasabah yang dibutuhkan dalam

penerapan credit scoring, diambil dari masing-masing data aplikasi pinjaman

nasabah, selain dengan menggunakan program statistik yang berisi tentang

sejarah pinjaman yang bersangkutan (Mester, 1997), data juga berisi antara lain

mengenai siklus pembayaran tagihan apakah tepat waktu atau tidak, berapa

banyak kredit yang masih atau pernah dimiliki yang bersangkutan.

2.3 Data Mining

Menurut Hermawan (2013), data mining adalah proses yang mempekerjakan

satu atau lebih teknik pembelajaran komputer (machine learning) untuk

menganalisis dan mengekstraksi pengetahuan (knowledge) secara otomatis.

Definisi lain diantaranya adalah pembelajaran berbasis induksi (induction-based

learning) adalah proses pembentukan definisi-definisi konsep umum yang

8

dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep

yang akan dipelajari. Knowledge Discovery in Database (KDD) adalah penerapan

metode saintifik pada data mining.

Menurut Prasetyo (2014), data mining bertujuan untuk memanfaatkan data

dalam basis data dengan mengolahnya sehingga menghasilkan informasi baru

yang berguna. Dengan kondisi adanya sisi data yang belum dieksplorasi, dan di

sisi lain, kemajuan teknik komputasi dan ilmu komputer sudah tumbuh pesat,

keterbutuhan akan ekplorasi informasi baru semakin meningkat. Data mining

menjadi solusi penyelesaian pencarian informasi yang sebelumnya tidak dapat

dideteksi secara tradisional dan hanya menggunakan kemampuan analisis

manusia.

Proses dalam tahap data mining terdiri dari tiga langkah utama (Sumathi

dan Sivanandam, 2006), yaitu:

a. Data Preparation

Pada langkah ini, data dipilih, dibersihkan (cleaning) dan dilakukan

preprocessed mengikuti pedoman dan knowledge dari ahli domain yang

menangkap dan mengintegrasikan data internal dan eksternal ke dalam

tinjauan organisasi secara menyeluruh.

b. Algoritma data mining

Penggunaan algoritma data mining dilakukan pada langkah ini untuk

menggali data yang terintegrasi untuk memudahkan identifikasi informasi

tambahan yang dibutuhkan.

9

c. Fase analisis data

Keluaran dari data mining dievaluasi untuk melihat apakah

knowledge domain ditemukan dalam bentuk rule yang telah diekstrak dari

jaringan.

Data mining didefiniskan sebagai proses penemuan pola dalam data (Witten

et all, 2011). Berdasarkan tugasnya, data mining dikelompokkan menjadi

deskripsi, estimasi, prediksi, klasifikasi, clustering dan asosiasi (Larose, 2005).

2.3.1 Klasifikasi

Teknik data mining yang digunakan dalam tugas akhir ini adalah

teknik klasifikasi. Menurut Prasetyo (2014), klasifikasi adalah proses

pembelajaran suatu fungsi tujuan (target) f yang memetakan tiap

himpunan atribut x ke satu dari label kelas himpunan atributy yang

didefinisikan sebelumnya. Fungsi targetan disebut juga model

klasifikasi. Algoritma klasifikasi yang digunakan dalam penulisan

tugas akhir ini adalah k-nearest neighbor.

Menurut Han dan Kamber (2006) ada dua jenis Klasifikasi, yaitu:

1. Pemodelan Deskriptif

Model klasifikasi yang dapat berfungsi sebagai suatu alat

penjelasan untuk membedakan objek-objek dalam kelas-kelas

yang berbeda.

2. Pemodelan Prediktif

Model klasifikasi yang dapat digunakan untuk

memprediksi label kelas record yang tidak diketahui.

10

Menurut Gorunescu (2011), proses klasifikasi data didasarkan

pada empat komponen, yaitu:

a. Kelas

Variabel dependen yang berupa kategorikal yang

merepresentasikan ‘label’ yang terdapat pada objeknya.

Contohnya: status kredit macet dan lancar.

b. Predictor

Variabel independen yang direpresentasikan oleh

karakteristik (atribut) data. Contohnya: usia, lama bekerja, total

pendapatan bersih, ataupun total pinjaman lain yang dimiliki

nasabah kredit.

c. Training dataset

Satu set data yang berisi nilai dari kedua komponen di

atas yang digunakan untuk menentukan kelas yang cocok

berdasarkan predictor.

d. Testing dataset

Berisi data baru yang akan diklasifikasikan oleh model

yang telah dibuat dan akurasi klasifikasi dievaluasi.

2.3.2 Pendekatan Teknik Klasifikasi

Teknik klasifikasi merupakan suatu pendekatan sistematis untuk

membangun model klasifikasi dari suatu himpunan data masukan. Tiap

teknik menggunakan suatu algoritma pembelajaran (learning

algorithm) untuk mendapatkan suatu model yang paling memenuhi

hubungan antara himpunan atribut dan label kelas dalam data

11

masukan. Tujuan dari algoritma pembelajaran adalah untuk

membangun model yang berkemampuan baik, yaitu model yang dapat

memprediksi label kelas dari record yang tidak diketahui kelas

sebelumnya dengan lebih akurat. Biasanya dataset yang diberikan

dibagi menjadi data training dan data testing. Data training digunakan

untuk membangun model dan data testing digunakan untuk

memvalidasi (Hermawati, 2013). Berikut ini merupakan ilustrasi

model klasifikasi untuk dua kelas dengan menggunakan sepuluh data

training, lima data testing yang dapat dilihat pada Gambar 1.

Tid. Attrib1 Attrib2 Attrib3 Class1. Yes Large 125K No2. No Medium 100K No3. No Small 70K No4. Yes Medium 120K No5. No Large 95K Yes6. No Medium 60K No7. Yes Large 220K No8. No Small 85K Yes9. No Medium 75K No10. No Small 90K YesTraining SetTid. Attrib1 Attrib2 Attrib3 Class

1. No Small 55K ?2. Yes Medium 80K ?3. Yes Large 110K ?4. No Small 95K ?5. No Large 67K ?Testing Set

Gambar 1. Ilustrasi Model Klasifikasi

Pada Gambar 1, terdapat langkah-langkah dalam menerapkan

model klasifikasi, dimana proses yang digunakan untuk membentuk

model klasifikasi adalah dengan algoritma pembelajaran berdasarkan

himpunan training set yang disebut dengan proses induksi. Sedangkan

MODEL

MODEL

Induksi

deduksi

LearningAlgorithm

LearnModel

MODEL

ApplyModel

12

proses penerapan model klasifikasi untuk memprediksi kelas tabel dari

data dalam himpunan testing set disebut dengan proses deduksi.

Untuk mengevaluasi performa dari model yang dibangun, perlu

dilakukan pengukuran performa, yaitu pengukuran akurasi (accuracy)

atau tingkat kesalahan (error rate). Jika fij menotasikan jumlah record

dari kelas i yang berada di kelas j pada saat pengujian (Hermawati,

2013), maka pengukuran akurasi dapat dituliskan sebagai berikut:

= ℎ_ _ _ ℎℎ_ _ ℎ = ++ + + (1)Dimana:

= jumlah data kelompok 1 yang benar diklasifikasikan ke

kelompok 1

= jumlah data kelompok 0 yang benar diklasifikasikan ke

kelompok 0

= jumlah data kelompok 1 yang salah diklasifikasikan ke

kelompok 0

= jumlah data kelompok 0 yang salah diklasifikasikan ke

kelompok 1

2.3.3 Analisis k-Nearest Neighbor (kNN)

Metodek-nearest neighbor (kNN) termasuk dalam kelompok

instance-based learning. Algoritma ini juga merupakan salah satu

teknik lazy learning. Metode kNN dilakukan dengan mencari

kelompok k objek dalam data training yang paling dekat dengan objek

pada data baru atau data testing (Wu dan Kumar,2009).

13

2.3.3.1 Jarak Euclidian

Pada metode klasifikasi seperti metode k-nearest neighbor

menggunakan suatu kuantitas yang disebut dengan kedekatan

atau proximity. Secara geometris, pengukuran kedekatan akan

diukur berdasarkan jarak antara data yang pertama terhadap data

yang pertama terhadap data yang kedua. Semakin dekat jarak

kedua data maka akan semakin besar kemiripannya, dan semakin

jauh jarak kedua data maka semakin kecil kemiripannya

(Prasetyo, 2014).

Jarak yang digunakan untuk mengukur jarak antar data pada

tugas akhir ini adalah jarak Euclidian. Diketahui permisalan,

obyek A dengan hasil pengukuran adalah ( , , … , ) dan

obyek B dengan hasil pengukuran adalah ( , , … , ) maka

jarak euclidian antara A dan B adalah sebagai berikut:

( , ) = ∑ ( − ) (2)

2.3.3.2 Penentuan Parameter

Di dalam penggunaan algoritma kNN, diperlukan

perhitungan jarak dari sebuah datum ke datum yang lain. Nilai

jarak inilah yang digunakan sebagai nilai kedekatan antara data

uji (data testing) dengan data latih (data training). Nilai k pada

kNN berarti k-data terdekat dari data testing. Jika k=1, kelas dari

satu data training sebagai tetangga terdekat (terdekat pertama)

dari data testing tersebut akan diberikan sebagai kelas untuk data

14

testing, yaitu kelas 1. Jika k=2, akan diambil 2 tetangga terdekat

dari data training. Begitu juga jika nilai k= 3, 4, 5 dan seterusnya.

Jika dalam k-tetangga ada dua kelas yang berbeda, akan diambil

kelas dengan jumlah data terbanyak (voting majority) (Prasetyo,

2012).

Langkah yang digunakan dalam metode k-Nearest Neighbor:

1. Tentukan parameter k (jumlah tetangga paling dekat),

menggunakan metode hold-out.

2. Hitung jarak Euclidian antara data testing dengan data

training yang ada.

3. Urutkan jarak tersebut dimulai dari kelompok yang memiliki

jarak terkecil ke yang terbesar.

4. Tentukan jarak terdekat sebanyak nilai k yang telah

ditentukan.

5. Dengan kategori nearest neighbor yang paling banyak, maka

dapat ditetapkan kelas terbanyak tersebut sebagai kelas dari

masing-masing objek data testing.

2.3.3.3 Algoritma k-Nearest Neighbor (k-NN)

Pada proses klasifikasi data, penentuan nilai parameter

merupakan hal yang sangat memengaruhi ketepatan suatu metode

dalam mengklasifikasikan data. Pada metode k-nearest neighbor

ini, parameter yang dimaksud adalah nilai k. Nilai k yang tinggi

akan mengurangi efek noise pada klasifikasi, tetapi membuat

batasan antara setiap klasifikasi menjadi lebih kabur. Pemilihan

15

jumlah k yang paling tepat perlu dijajaki agar error rate bisa

diperkecil. Nilai k ganjil untuk kelas berjumlah dua akan

memudahkan voting karena dijamin tidak akan terjadi dua kelas

yang mendapatkan suara voting yang sama. Akan tetapi jika k

genap, akan ada kemungkinan dua kelas mendapatkan suara

voting yang sama. Nilai k yang bagus dapat dipilih dengan

optimasi parameter, misalnya dengan menggunakan cross-

validation.

Terdapat berbagai langkah dalam menetapkan k terbaik,

diantaranya adalah proses cross validation dengan menggunakan

metode hold-out (Bishop, 1995) sebagai berikut:

1. Secara acak, bagi data menjadi 2 bagian, yakni data training,

dan data testing.

2. Tentukan nilai parameter nearest neighbor = 1.3. Hitung jarak Euclidian antara data training dengan data

testing.

4. Urutkan nilai jarak tersebut, dari yang nilainya terkecil

hingga yang terbesar.

5. Tentukan jarak terdekat sebanyak nilai k yang telah

ditentukan.

6. Tetapkan kelas yang terbanyak muncul dari hasil data

tetangga terdekat tersebut, sebagai kelas dari data testing.

7. Hitunglah error rate hasil klasifikasi kelas data training dan

data testing untuk nilai k tersebut.

16

8. Kemudian tentukan nilai k=k+1

9. Lakukan kembali langkah 3 – 7 hingga didapati nilai error

rate yang paling rendah.

10. Lalu tentukan nilai k yang mempunyai nilai error rate yang

paling rendah untuk kedua hasil klasifikasi data training dan

data testing sebagai nilai k yang terbaik, yang akan digunakan

untuk mengklasifikasikan data testing menggunakan

Bagging.

2.3.3.4 Karakteristik Klasifikasi dengan k-Nearest Neighbor

k-Nearest Neighbor (kNN) merupakan teknik klasifikasi yang

sederhana tetapi mempunyai hasil yang cukup bagus. Meskipun

begitu, kNN juga mempunyai kelebihan dan kekurangan.

Beberapa karakteristik kNN adalah sebagai berikut:

1. kNN merupakan algoritma yang menggambarkan seluruh

data training untuk melakukan proses klasifikasi (complete

storage). Hal ini mengakibatkan proses prediksi yang sangat

lama untuk data dalam jumlah yang sangat besar. Tetapi

semakin banyak data training, maka akan dapat dibuat batas

keputusan yang semakin halus.

2. Algoritma kNN tidak membedakan setiap fitur dengan suatu

bobot, semua bobot untuk fiturnya bernilai sama untuk satu

sama lainnya.

3. Karena kNN masuk kategori lazy learning yang menyimpan

sebagian atau semua data dan hampir tidak ada proses

17

pelatihan, kNN sangat cepat dalam proses pelatihan (karena

memang tidak ada), tetapi sangat lambat dalam proses

prediksi.

4. Hal yang rumit adalah menentukan nilai k yang paling sesuai

karena kNN pada prinsipnya memilih tetangga terdekat,

parameter jarak juga penting untuk dipertimbangkan sesuai

dengan kasus datanya. Jarak Euclidian sangat cocok untuk

menggunakan jarak terdekat (lurus) antara dua data.

2.4 Metode Bagging (Bootstrap Aggregating)

Metode kombinasi model adalah metode yang masing-masingnya

merupakan kombinasi barisan yang memuat sejumlah k-model yakni M1, M2, …,

Mk, dengan tujuan untuk membuat sebuah peningkatan pada model gabungan,

M*. Secara umum terdapat dua metode kombinasi model, yakni Bagging dan

Boosting. Keduanya dapat digunakan dalam proses klasifikasi dan prediksi (Han

dan Kamber, 2006). Ilustrasi metode gabungan tersebut dapat dilihat pada Gambar

2.

Gambar 2.Ilustrasi Metode Kombinasi Model

Data

M1

M2

M3

PilihanKombinasi

New DataSample

Prediction

18

Pada Gambar 2, terdapat gambaran langkah kerja dari metode kombinasi

model, dimana metode tersebut bertujuan untuk meningkatkan ketepatan model

yang terdiri dari metode Bagging dan Boosting. Metode ini menghasilkan sebuah

model klasifikasi atau prediksi, M1, M2, …, Mk. Dimana strategi voting terhadap

pilihan kombinasi yang muncul adalah strategi yang digunakan untuk

menggabungkan prediksi untuk objek yang telah diberikan yang belum diketahui

kategorinya.

Metode Bagging merupakan teori yang diusulkan oleh Breiman (1996),

yang didasari oleh konsep teori bootstrap dan aggregating yang menggabungkan

kedua manfaat teori tersebut menjadi satu. Bootstrap ini diterapkan berdasarkan

pada teori sampling acak dengan pengembalian (Tibshirani dan Efron,1993). Oleh

karena itu bootstrap = , , … , (menerapkan pengambilan sampel

acak dengan pengembalian) dari data training = ( , ,… , ), dimana

penggunaan metode ini dianggap dapat meminimalisir kesalahan dalam

pengklasifikasian. Sebagai pengaruhnya, model pada teknik klasifikasi(classifier)

yang telah dibentuk tersebut kemungkinan mempunyai kinerja yang lebih baik.

Pengertian dari proses aggregating adalah menggabungkan beberapa classifier

tersebut.

Terkadang classifier gabungan memberikan hasil yang lebih baik

dibandingkan dengan satu classifier saja, dikarenakan adanya penggabungan

kedua manfaat dari beberapa classifier tersebut pada akhir penyelesaiannya.Oleh

karena itu Bagging bermanfaat untuk membantu membangun atau membentuk

classifier yang lebih baik pada sampel data training.

19

Berikut ini merupakan tahapan penerapan teknik Bagging:

1. Lakukan replikasi bootstrap sebanyak m, dari sejumlah n data training.

Ulangi langkah ini untuk = 1,2, … , . Dimana m adalah banyaknya data

yang diambil dari data training, n adalah ukuran sampel dari data training

dan B adalah banyaknya replikasi bootstrap yang dilakukan.

2. Dengan menggunakan simple majority vote, dipilih label yang paling banyak

muncul dari hasil penilaian sebagai aturan untuk pengambilan keputusan

terakhir.

20

BAB III

METODOLOGI PENELITIAN

3.1. Sumber Data

Data yang digunakan adalah data sekunder nasabah tahun 2011 yang

diperoleh dari Bank “X” yang terletak di Provinsi Lampung, dimana terdapat data

diri nasabah kredit macet dan kredit lancar di dalamnya.

3.2. Variabel Penelitian

Variabel yang digunakan dalam penelitian ini yaitu satu variabel respon (Y)

dan enam variabel prediktor (X).

1. Variabel respon (Y) merupakan status kredit dari nasabah kredit yang

dikategorikan dengan notasi 0 untuk kredit lancar dan notasi 1 untuk kredit

macet.

2. Variabel prediktor (X) merupakan data nasabah kredit yang terdiri dari:

a. Usia debitur dalam satuan tahun (X1)

b. Lama bekerja dalam satuan tahun (X2)

c. Pendapatan bersih dalam satuan rupiah (X3)

d. Pinjaman lain dalam satuan rupiah (X4)

e. Nominal yang tertera dalam akun tabungan yang dimiliki (X5)

f. Rasio hutang terhadap pendapatan (X6)

21

3.3. Metode Analisis

Software atau alat bantu yang digunakan dalam pengolahan data ini adalah

Ms.Excel 2010 dan SAS 9.0. Setelah data diperoleh, maka langkah-langkah yang

dilakukan dalam menganalisis data adalah:

1. Memasukkan data status kredit nasabah sebagai variabel repon sedangkan usia

debitur, lama bekerja, jumlah pendapatan bersih, jumlah pinjaman lain, jumlah

nominal dalam akun tabungan, dan rasio hutang terhadap pendapatan

dimasukkan sebagai variabel prediktor.

2. Analisis deskriptif data debitur berdasarkan status kredit.

3. Membagi data menjadi data training, dan data testing dengan proporsi 90:10

4. Melakukan analisis k-Nearest Neighbor menggunakan Bagging (Bootstrap

Aggregating) dengan langkah sebagai berikut:

a. Menentukan nilai k terbaik dengan cross validation dengan langkah

sebagai berikut:

1) Tentukan nilai parameter nearest neighbor = 1.2) Hitung jarak Euclidian antara data training ke data testing

3) Urutkan nilai jarak tersebut, dari yang nilainya terkecil hingga yang

terbesar.

4) Tentukan jarak terdekat sebanyak nilai k yang telah ditentukan.

5) Hitunglah error rate hasil klasifikasi kelas data training dan data

testing untuk nilai k tersebut.

6) Kemudian tentukan nilai k = k + 1

7) Lakukan kembali langkah 2 – 5 hingga didperoleh nilai error rate

yang paling rendah.

22

8) Lalu tentukan nilai k yang mempunyai nilai error rate yang paling

rendah pada kedua hasil klasifikasi data training dan data testing

sebagai nilai k yang terbaik, yang akan digunakan untuk

mengklasifikasikan data testing dengan menggunakan data hasil

bootstrap.

b. Melakukan resampling pada data training menggunakan teknik

bootstrap sebanyak B kali dengan ukuran sampel sebanyak m, dimana

jumlah m adalah 80% dari n data training

c. Menghitung jarak Euclidian setiap data hasil bootstrap data training

kesemua data testing

d. Urutkan objek–objek dimulai dari kelompok yang memiliki jarak

terkecil ke yang terbesar.

e. Menentukan nilai keanggotaan terbesar padas tiap perhitungan

jarakterdekat data hasil bootstrap dengan data testing.

f. Melakukan aggregating dengan aturan majority vote, menggunakan nilai

keanggotaan dengan jumlah terbesar untuk menentukan kelas dari setiap

data yang sudah diperoleh dari hasil bootstraping, untuk menentukan

kategori untuk setiap nilai observasi pada data testing.

g. Mengklasifikasikan data observasi menggunakan hasil aggregating

tersebut.

h. Melakukan validasi hasil prediksi dengan menghitung nilai keakuratan

hasil klasifikasi dengan menghitung nilai accuracy dari analisis tersebut.

23

3.4. Diagram AlirMulai

Input data

Analisis deskriptif

Menentukan nilai parameter k terbaik, dengan metode hold-out

Pembagian data training,dan data testing

Melakukan resampling pada data training menggunakan teknik bootstrapsebanyak B kali, dengan ukuran sampel 80% dari data training

Menghitung jarak Euclidian setiap data hasil bootstrap ke semua datatesting

Urutkan data dimulai dari yang memiliki jarak terkecil ke yang terbesar.

Menentukan nilai keanggotaan terbesar pada setiap perhitungan jarakterdekat data hasil bootstrap dengan data testing sebagai kelas untuk data

testing

Menghitung nilai Accuracy

Selesai

Menggunakan sebanyak B nilai keanggotaan terbesar untuk menentukankelas dari setiap data yang sudah diperoleh dari hasil bootstraping

Mengklasifikasikan data observasi menggunakan hasil aggregatingtersebut

Menentukan sejumlah k-tetangga terdekat berdasarakan jarak terkecil.

24

BAB IV

HASIL DAN PEMBAHASAN

4.1 Deskripsi Data

Data yang digunakan pada penelitian ini merupakan data pribadi nasabah

kredit pada Bank ‘X’ di Provinsi Lampung yang terdiri dari enam variabel

prediktor. Terdiri dari 999 data nasabah yang diambil sebagai sampel, terdapat

199 (19,9%) nasabah termasuk ke dalam status kredit yang macet, dan 800

(80,1%) nasabah lainnya termasuk ke dalam status kredit yang lancar. Deskripsi

untuk enam variabel prediktor yakni usia, lama kerja, pinjaman lain, pendapatan

bersih, nominal akun, rasio hutang, untuk setiap kelas pada status kredit nasabah

dapat dilihat pada Tabel 1.

Tabel 1. Deskripsi Variabel Usia, Lama Kerja, Pinjaman Lain, PendapatanBersih, Nominal Akun, dan Rasio Hutang

Variabel Prediktor Rata-rata Standar DeviasiKredit Lancar Kredit Macet Kredit Lancar Kredit Macet

Usia 37,75 37,02 7,60 8,49Lama Kerja 7,63 6,24 6,78 6,65Pinjaman Lain 347.000 223.000 1.170.186,822 990.688,178Pendapatan Bersih 5.160.000 4.560.000 5.888.368,369 4.839.785,008Nominal Akun Tabungan 14.501.000 6.944.900 121.433.000 20.374.500Rasio Hutang 30,552 31,825 11,067 14,786

Dari data pada Tabel 1, terlihat bahwa nilai rata-rata pendapatan bersih pada

nasabah berstatus kredit lancar adalah sebesar Rp 5.160.000, nilai ini lebih besar

dari rata-rata pendapatan bersih pada nasabah kredit macet sebesar Rp 4.560.000.

Begitu pula dengan rasio hutang, dimana pada nasabah kredit lancar rasio

hutangnya memiliki rata-rata 30,552. Nilai tersebut bernilai lebih kecil daripada

rata-rata rasio hutang pada nasabah kredit macet sebesar 31,825.

25

4.2 Pembagian Data

Penerapan metode k-Nearest Neighbor (kNN) pada klasifikasi nasabah

kredit dilakukan dengan terlebih dahulu membagi data menjadi data training dan

data testing. Dari sejumlah 999 data, diambil 900 data (90,09%) sebagai data

training dan 99 data (9,91%) digunakan sebagai data testing. Deskripsi data untuk

data training dan data testing dapat dilihat pada Tabel 2 dan Tabel 3.

Tabel 2. Deskripsi Data Usia, Lama Kerja, Pinjaman Lain, Pendapatan Bersih,Nominal Akun dan Rasio Hutang pada Data Training

Variabel Prediktor Rata-rata Standar DeviasiKredit Lancar Kredit Macet Kredit Lancar Kredit Macet

Usia 37,74 36,70 7,599 8,472Lama Kerja 7,77 6,17 6,77 6,642Pinjaman Lain 358.000 228.000 1.215.002,674 1.036.672,932Pendapatan Bersih 5.180.000 4.720.000 6.023.282,017 5.076.876,648Nominal AkunTabungan 15.246.000 6.950.500 127.663.000 20.525.900

Rasio Hutang 30,572 31,076 10,889 14,435

Tabel 3. Deskripsi Data Usia, Lama Kerja, Pinjaman Lain, PendapatanBersih, Nominal Akun dan Rasio Hutang pada Data Testing

Variabel PrediktorRata-rata Standar Deviasi

KreditLancar Kredit Macet Kredit Lancar Kredit Macet

Usia 37,87 39,67 7,72 8,404Lama Kerja 6,35 6,81 6,70 6,897Pinjaman Lain 245.000 156.000 612.130,647 246.476,771Pendapatan Bersih 5.020.000 3.180.000 4.477.960,266 1.248.659,542Nominal AkunTabungan 7.598.700 6.898.000 18.781.700 19.521.100

Rasio Hutang 30,367 38,178 12,675 16,522

Pada Tabel 2 dan Tabel 3 dapat dicermati kondisi nilai rata-rata untuk

variabel pendapatan bersih pada nasabah kredit yang lancar lebih besar

dibandingkan dengan nasabah kredit macet. Begitupula pada nilai rasio hutang

pada nasabah kredit lancar bernilai lebih kecil dibandingkan dengan nasabah

26

kredit macet. Pada Lampiran 1 dan Lampiran 2 dapat dilihat tabel dari data

training dan data testing yang digunakan dalam tugas akhir ini.

4.3 Penentuan Nilai Parameter Terbaik

Pada metode k-Nearest Neighbor, sebelum menghitung jarak Euclidian

terdekat dari data yang akan dicari klasifikasi kelasnya, diperlukan proses untuk

menentukan nilai parameter terbaik k terlebih dahulu. Dalam tugas akhir ini akan

digunakan metode hold-out. Proses penentuan parameter terbaik ini menggunakan

data training dan data testing dengan bantuan software SAS 9.0, yang listing code

nya dapat dilihat pada Lampiran 3.

Tabel 4.Perbandingan Nilai Error Rate Hasil Klasifikasi Kelas DataTraining dan Data Testing

k Error rateData Training Data Testing

1 0 0,3131312 0,0907 0,3636363 0,1655 0,3939394 0,2341 0,5151525 0,2805 0,5656576 0,2749 0,4343437 0,2848 0,4141418 0,3025 0,4646469 0,3209 0,48484810 0,3317 0,515152

Hasil penentuan nilai parameter terbaik k, dapat dilihat dari nilai error rate

terkecil hasil klasifikasi kelas pada kedua data tersebut. Tabel 4 menunjukkan

perbandingan error rate pada kedua data tersebut dengan nilai k = 1, 2, … ,10.

Berdasarkan Tabel 4, diperoleh nilai error rate terkecil untuk data training

dan testing ada pada nilai k = 1, yakni error rate untuk klasifikasi data training

adalah sebesar 0, sedangkan error rate untuk klasifikasi data testing adalah

27

sebesar 0,313131. Maka dapat diambil kesimpulan bahwa nilai k terbaik yang

digunakan untuk melakukan klasifikasi menggunakan metode Bagging k-Nearest

Neighbor untuk data testing adalah nilai k = 1.

4.4 Penentuan Klasifikasi Kelas untuk Observasi Pertama Data Testing

Pada metode ini akan digabungkan dua metode untuk mengklasifikasikan

kelas dari data testing, yakni metode Bagging dan k-Nearest Neighbor. Sebelum

diterapkan metode k-Nearest Neighbor akan dilakukan terlebih dahulu metode

Bagging.

Pada metode Bagging (Bootstrap Aggregating) nantinya akan ada dua

proses. Pertama, proses bootstrap yakni pengambilan sampel ulang disertai

pengembalian pada data training sebanyak 50 kali dengan jumlah data pada

masing-masing hasil bootstrap sebanyak 720 data (80%) menggunakan bantuan

software SAS 9.0. Kedua, proses aggregating yaitu pendugaan kelas secara

gabungan berdasarkan dugaan data testing menggunakan data hasil bootstrap

yang telah ada dengan aturan majority vote (suara terbanyak).

4.4.1 Perhitungan Jarak Euclidian antara Data Testing dengan Data

Bootstrap

Proses bootstrap dilakukan dengan bantuan software SAS 9.0,

yang listing code nya dapat dilihat pada Lampiran 4, dimana

pengambilan sampel acak disertai dengan pengembalian, sehingga data

yang sudah terambil mempunyai kemungkinan untuk kembali terambil

menjadi data bootstrap. Data training yang di-resampling sebanyak 50

kali menjadi data bootstrap dengan ukuran sampelnya 720 data.

28

Sebelum ditentukan kelas untuk data testing observasi pertama,

data bootstrap inilah yang akan dijadikan sebagai data training yang

akan dihitung majority vote nya untuk penentuan kelas tersebut. Pada

Tabel 5 dapat dilihat data hasil bootstrap pertama.

Tabel 5. Data Bootstrap Pertama

No. Usia Lamakerja

Pinjamanlain

Pendapatanbersih

Nominalakun

Rasiohutang

Statuskredit

1 40 7 0 3.920.069 164.824,2 24,027 Lancar2 45 14 0 2.222.741 3.600.000 47,901 Macet3 30 2 0 11.601.567 918.311,4 21,988 Lancar4 47 28 0 3.809.983 10.261.638 39,554 Lancar5 41 1 1.070.693 6.140.795 540.000 43,349 Lancar. . . . . . . .

716 36 2 456.303 5.913.697 900.000 36,736 Lancar717 36 2 456.303 5.913.697 900.000 36,736 Lancar718 40 15 913.296 4.129.724 14.098.273 55,464 Lancar719 40 15 913.296 4.129.724 14.098.273 55,464 Lancar720 40 15 913.296 4.129.724 14.098.273 55,464 Lancar

Pada Tabel 5 dapat dilihat karakteristik dari data bootstrap dimana

terdapat sampel yang muncul lebih dari sekali dikarenakan bootstrap

merupakan metode resampling with replacement (pengambilan sampel

dengan pengembalian), yang tiap sampelnya memiliki peluang untuk

terambil kembali walaupun sudah terpilih sebelumnya.

Pada Tabel 6 terdapat data observasi pertama dari data testing yang

akan diklasifikasikan kelasnya berdasarkan jaraknya dengan data hasil

bootstrap.

Tabel 6. Observasi Pertama, pada Data Testing.

UsiaLamaKerja

PinjamanLain

PendapatanBersih

NominalAkun

RasioHutang

32 4 461.221 2.293.779 6.419.734 46,2

29

Selanjutnya akan dihitung jarak Euclidian dari data bootstrap

pertama ke data testing untuk observasi pertama, dengan perhitungan

sebagai berikut ini:

a. Berikut ini akan dihitung jarak dari observasi pertama data

bootstrap pertama dengan data testing observasi pertama, dimana

dilambangkan dengan ( , )( , ) = (40 − 32) + (7 − 4) + (0 − 461.221) + (3.920.069 − 2.293.779) +(164.824,2 − 6.419.734) + (24,027 − 46,2)

= 6.479.309b. Berikut ini akan dihitung jarak dari observasi kedua data bootstrap

pertama dengan data testing observasi pertama, dimana

dilambangkan dengan ( , )( , ) = (45 − 32) + (14 − 4) + (0 − 461.221) + (2.222.741 − 2.293.779) +(3.600.000 − 6.419.734) + (47,901 − 46,2)

= 2.858.089c. Berikut ini akan dihitung jarak dari observasi ketiga data bootstrap

pertama dengan data testing observasi pertama, dimana

dilambangkan dengan ( , )( , ) = (30 − 32) + (2 − 4) + (0 − 461.221) + (11.601.567 − 2.293.779) +(918.311,4 − 6.419.734) + (21,988 − 46,2)

= 10.821.890d. Berikut ini akan dihitung jarak dari observasi keempat data


dilambangkan dengan ( , )( , ) = (47 − 32) + (28 − 4) + (0 − 461.221) + (3.809.983 − 2.293.779) +(10.261.638,4 − 6.419.734) + (39,554 − 46,2)

= 4.155.938

30

e. Berikut ini akan dihitung jarak dari observasi kelima data


dilambangkan dengan ( , )( , ) = (41 − 32) + (1 − 4) + (1.070.693 − 461.221) + (6.140.795 − 2.293.779) +(540.000 − 6.419.734) + (43,349 − 46,2)

= 7.052.819Langkah menghitung jarak Euclidian data bootstrap dengan data

testing ini dilakukan hingga observasi ke 720 pada data bootstrap

pertama.Sehingga didapati hasil perhitungan jarak Euclidian semua

observasi seperti yang dapat dilihat pada Tabel 7.

Tabel 7. Jarak Euclidian data Bootstrap pertama ke datatesting

No. Usia Lamakerja

Pinjamanlain

Pendapatanbersih

Nominalakun

Rasiohutang

Statuskredit Jarak

1 40 7 0 3.920.069 164.824,2 24,027 Lancar 6.479.309

2 45 14 0 2.222.741 3.600.000 47,901 Macet 2.858.089

3 30 2 0 11.601.567 918.311,4 21,988 Lancar 10.821.890

. . . . . . . .

718 40 15 913.296 4.129.724 14.098.273 55,464 Lancar 7.907.909

719 40 15 913.296 4.129.724 14.098.273 55,464 Lancar 7.907.909

720 40 15 913.296 4.129.724 14.098.273 55,464 Lancar 7.907.909

4.4.2 Penentuan Tetangga Terdekat Sebanyak k pada Setiap data

Bootstrap

Setelah melakukan perhitungan jarak Euclidian antar data, akan

ditentukan tetangga terdekat sebanyak k, dimana k = 1 adalah nilai

terbaik parameter k, untuk memutuskan kelas dari observasi pertama

data testing berdasarkan data hasil bootstrap. Namun sebelumnya,

langkah yang harus dilakukan adalah mengurutkan nilai jarak antar

data tersebut dari yang terkecil hingga yang terbesar.

31

Pada Tabel 8 dapat dilihat urutan jarak antar data dari yang terkecil

ke yang terbesar pada data bootstrap pertama.

Tabel 8. Urutan Jarak dari Nilai yang Terkecil Hingga Terbesaruntuk Data Bootstrap Pertama

No. Usia Lamakerja

Pinjamanlain

Pendapatanbersih

Nominalakun

Rasiohutang

StatusKredit Jarak

715 38 9 408.412 2.173.496 6.391.048 23,647 Lancar 134.460,892 50 6 535.991 2.630.509 6.480.000 22,876 Lancar 350.156,6

288 32 1 0 2.581.924 6.215.350 29,853 Lancar 580.969,482 44 17 0 2.581.747 6.068.012 29,186 Lancar 647.579

477 43 13 0 2.687.930 6.819.995 19,117 Lancar 726.834.5. . . . . . . .. . . . . . . .. . . . . . . .

384 53 17 493.090 3.843.320 1,77E+08 30,015 Macet 1,7E+08294 35 10 0 4.328.601 2,04E+08 34,815 Lancar 1,97E+08351 34 2 1.188.659 5.756.717 9,94E+08 30,676 Lancar 9,87E+08352 34 2 1.188.659 5.756.717 9,94E+08 30,676 Lancar 9,87E+08472 45 3 2.360.289 45.639.712 2,88E+09 13,339 Lancar 2,87E+09

Pada Tabel 8 tersebut, dapat dilihat untuk nilai k=1, jarak terdekat

pertama dari data bootstrap pertama ke data testing adalah data

observasi ke-715, dengan nilai jarak = 134.460,8. Sehingga prediksi

kelas menggunakan data bootstrap pertama untuk observasi pertama

data testing masuk ke dalam kelas kredit Lancar, sesuai dengan kelas

dari data tetangga terdekat pertama observasi ke-715.

4.4.3 Penentuan Kelas dari Observasi Pertama Data Testing

Berdasarkan Hasil Majority Vote

Berdasarkan hasil dari penentuan tetangga terdekat di langkah

sebelumnya, telah didapati 50 prediksi kelas untuk observasi pertama

data testing dari perhitungan jarak dengan data hasil bootstrap.

Langkah terakhir adalah Aggregating, dilakukan untuk menentukan

kelas dari observasi pertama adalah dengan menghitung suara

32

terbanyak (majority vote) kelas yang muncul dari total 50 hasil

prediksi kelas sebelumnya. Berikut ini dapat dilihat pada Tabel 9, hasil

prediksi kelas status kredit dari 50 data hasil perhitungan jarak dengan

data bootstrap.

Tabel 9.Hasil Prediksi Kelas untuk Status Kredit BerdasarkanJarak dengan Data Bootstrap.

nHasil Prediksi berdasarkan jarak dengan Data Hasil Bootstrap ke-

L MMajority

Vote1 2 3 4 5 6 7 8 9 10 … 40 41 42 43 44 45 46 47 48 49 50

1 L L L L L L L L L L L L L L L L L L L L L 50 0 L

Keterangan: L= Status Kredit Lancar, M = Status Kredit Macet

Setelah melihat hasil prediksi dari 50 data bootstrap, langkah

selanjutnya adalah menghitung suara terbanyak dari kelas yang muncul

tersebut yang telah direkap juga pada Tabel 9.

Hasilnya, untuk observasi pertama data testing diklasifikasikan ke

dalam status kredit Lancar, karena hasil perhitungan kelas Lancar

muncul lebih banyak yakni sebanyak 50 kali, dibandingkan dengan

kelas Macet yang tidak muncul sama sekali atau nol.

Lakukan juga secara berulang untuk observasi kedua hingga

terakhir pada data testing, yakni menentukan kelas dari observasi

berdasarkan suara terbanyak dari kelas yang muncul pada hasil

prediksi kelas status kredit berdasarkan data bootstrap tersebut.

4.5 Accuracy (Ketepatan) Hasil Prediksi Gabungan Menggunakan

Bagging k-Nearest Neighbor

Setelah selesai menentukan kelas untuk semua observasi data testing,

langkah yang terakhir adalah menghitung ketepatan klasifikasi kelas status kredit

33

tersebut. Cara menghitungnya adalah dengan menghitung error rate terlebih

dahulu seperti pada Persamaan (1).

Pada Tabel 9 telah disajikan data hasil penentuan kelas berdasarkan suara

terbanyak untuk 99 observasi data testing. Dari 99 hasil prediksi kelas status

kredit data testing tersebut selanjutnya akan dihitung error rate klasifikasi.

Setelah di hitung terdapat 33 hasil prediksi yang berbeda dengan data asli kelas

dari status kredit pada data testing, dan terdapat 66 data yang sesuai dengan data

asli kelas dari status kredit tersebut. Hasil prediksi dari kelas status nasabah kredit

selengkapnya dapat dilihat pada Lampiran 5.

Tabel 10.Hasil Majority Vote untuk Penentuan Kelas Observasi PertamaData Testing

n

S

tat

us

Hasil Prediksi berdasarkan jarak dengan Data Hasil Bootstrap

L M MajorityVote

1 2 3 4 5 6 7 8 9 10….

41 42 43 44 45 46 47 48 49 50

1 L L L L L L L L L L L … L L L L L L L L L L 50 0 Lancar

2 L L L M L L L L L L L … L L L L L M L L L L 45 5 Lancar

3 L L L L L L L L L L L … M L L L L L L L L L 45 5 Lancar

4 M L L L L L L L L L L … L M L M L L L L L L 47 3 Lancar5 L M M M M M M M M M L … L M M M L M M M M L 12 3

8Macet

.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..95 L L L L M L L L L L L … L L L L L L L L L L 47 2 Lancar


97 M L L L L L L L L L L … L L L L L L L L L L 49 0 Lancar98 L M M L M M M M M M M … M M M L M M M M M M 3 4

6Macet


Keterangan: L= Status Kredit Lancar, M = Status Kredit Macet

Selanjutnya cara menghitung error rate nya adalah sebagai berikut:

= ℎ ℎℎ ℎ = 3399 = 0,333333

34

Dengan diketahuinya error rate akan dapat dihitung nilai accuracy

(ketepatan), yakni:= 1 − = 1 − 0,333333 = 0,666667Dengan nilai accuracy 0,666667 berarti ketepatan hasil klasifikasi dengan

Bagging k-Nearest Neighbor adalah sebesar 0,666667 atau 66,7%

35

BAB V

KESIMPULAN

Berdasarkan hasil dari pembahasan, diperoleh kesimpulan bahwa metode

Bagging k-Nearest Neighbor dapat digunakan untuk mengklasifikasi status

nasabah kredit lancar dan macet pada Bank ‘X’ di provinsi Lampung. Hasil

pengklasifikasian tersebut, selanjutnya digunakan untuk memprediksi calon

nasabah yang akan menggunakan layanan jasa kredit. Dalam penelitian ini,

diperoleh hasil ketepatan klasifikasi nasabah kredit dengan metode Bagging k-

Nearest Neighbor sebesar 66,67%.

36

DAFTAR PUSTAKA

Breiman, L. 1996. Bagging Predictors. Machine Learning 24 123-140.

Bishop, C. M. 1995. Neural Networks For Pattern Recognition. Clarendon Press:

Oxford

Chapra, M. U. 2000. Sistem Moneter Islam, terj. Ikhwan Abidin Basri, Towards a

Just Monetary System. Jakarta: Gema Insani.

Gorunescu, F. 2011. Data Mining: Concepts, Model and Techniques, Prof. Janusz

Kacprzyk and Prof. Lakhmi C. Jain, Eds. Berlin. Jerman: Springer

Han, J. dan Kamber, M. 2006. Data Mining: Concept and Techniques. San

Frasisco: Morgan Kaufmann Publishers.

Hermawati, F. A. 2013. Data Mining. Yogyakarta: ANDI.

Herprasetyo, B. 2012. Sukses Ubah Kartu Kredit jadi Modal Usaha.

Tulungagung: Adora media

Ismail. 2010. Manajemen Perbankan. Surabaya: Kencana

Kasmir. 2001. Manajemen Perbankan. Jakarta: Raja Grafindo Persada

Kasmir. 2002. Bank dan Lembaga Keuangan Lainnya. Edisi Revisi 2002. Jakarta:

PT. Rajagrafindo Persada.

Kuncoro, M dan Suhardjono. 2002. Manajemen Perbankan: Teori Dan Aplikasi.

Jogjakarta: BPFE

Larose, D. T. 2005. Discovering Knowledge in Data. New Jersey: John Willey &

Sons, Inc.

Mahmoedin. 2002. Melacak Kredit Bermasalah. Jakarta: Pustaka Sinar Harapan.

Mester, L. J. 1997. What’s The Point of Credit Scoring? Business Review

(September) 3-16.

37

Melayu, H. 2004. Dasar-dasar Perbankan. Jakarta: CV. Haji Masagung.

Morrison, J. 2004. Introduction to Survival Analysis in Business, The Journal of

Business Forecasting Methods & Systems 23 (1) 18-22.

Prasetyo, E. 2012. DATA MINING – Konsep dan Aplikasi Menggunakan Matlab.

Yogyakarta: ANDI.

Prasetyo, E. 2014. DATA MINING: Mengolah Data Menjadi Informasi

Menggunakan Matlab. Yogyakarta: ANDI.

Tibshirani, R. J dan Efron, B. 1993. An Introduction to the Bootstrap. London:

Chapman dan Hall.

Republik Indonesia. 1998. Undang-Undang No.10 1998 tentang Perbankan.

_______. Jakarta.

Rivai, V dan Permata, A. 2007. Credit Management Handbook. Jakarta: PT.Elex

Media Komputindo.

Sumathi, dan Sivanandam, S. N. 2006. Introduction to Data Mining and its

Application. Berlin Heidelberg. New York: Springer.

Witten, I. H, Frank E, Hall, M. A. 2011. Data Mining : Practical Machine

Learning and Tools. Burlington: Morgan Kaufmann Publisher.

Wu, X. dan Kumar, V. 2009. The Top Ten Algorithms in Data Mining. London:

CRC Press Taylor & Analitic Machine Intelligence 13: 841-847.

38

LAMPIRAN

Lampiran 1.Data Training, n = 900

Debitur Usia LamaKerja PinjamanLain PendapatanBersih Nominal

AkunRasio

Hutang Status

Debitur371 40 7 0 3920069 164824,20 24,027 LancarDebitur1622 49 7 316045 2042409 39600000,00 39,111 MacetDebitur2335 45 14 0 2222741 3600000,00 47,901 MacetDebitur535 46 17 0 7902600 78203649,60 27,294 LancarDebitur163 30 2 0 11601567 918311,40 21,988 LancarDebitur520 47 28 0 3809983 10261638,00 39,554 LancarDebitur3050 25 2 0 2712000 180000,00 29,306 MacetDebitur97 41 1 1070693 6140795 540000,00 43,349 LancarDebitur666 51 8 0 6677132 77540094,00 7,485 LancarDebitur2756 26 2 0 2054607 3576340,80 22,66 MacetDebitur94 41 14 0 4282100 6072904,80 26,395 LancarDebitur493 40 1 0 0 15660000,00 17,318 LancarDebitur340 52 27 0 0 5363096,40 17,129 LancarDebitur329 40 15 0 2609000 90000,00 39,391 LancarDebitur650 36 5 1408000 4977000 90000,00 39,753 LancarDebitur313 27 6 0 3827397 6594397,20 19,687 Lancar

… … … … … … … …… … … … … … … …… … … … … … … …

Debitur557 35 16 297084 3045884 241614,00 37,062 LancarDebitur1913 38 1 0 5764060 9540000,00 130,724 MacetDebitur169 26 6 402778 1989021 949879,80 38,324 LancarDebitur1403 51 12 0 0 360000,00 26,279 MacetDebitur1749 40 8 0 2808545 810000,00 52,903 MacetDebitur133 26 2 0 5192867 180000,00 13,179 LancarDebitur687 30 6 600000 1744330 138007,80 47,513 LancarDebitur688 39 5 0 2777350 1,80 33,913 LancarDebitur824 33 9 0 2960575 9000000,00 31,814 LancarDebitur659 38 9 408412 2173496 6391047,60 23,647 LancarDebitur455 36 2 456303 5913697 900000,00 36,736 LancarDebitur76 40 15 913296 4129724 14098273,20 55,464 LancarDebitur518 31 8 0 2857109 2532598,20 32,966 LancarDebitur730 52 24 0 5203000 83225905,20 31,136 Lancar

39

Lampiran 2.Data Testing, n = 99

Debitur Usia Lamakerja

PinjamanLain

PendapatanBersih

NominalAkun

RasioHutang status

Debitur299 32 4 461221 2293779 6419734 46,2 LancarDebitur542 53 2 0 3159337 1,8 40,662 LancarDebitur476 44 21 0 2594667 180000 59,413 LancarDebitur336 39 3 261000 4666000 90000 40,432 MacetDebitur63 33 4 466737 10734847 90000 28,318 LancarDebitur131 35 3 3375636 19867926 1,03E+08 37,801 LancarDebitur755 35 3 0 2197620 2250000 28,059 LancarDebitur1789 40 1 0 5000000 17156315 36,909 MacetDebitur398 50 2 0 17593582 1,29E+08 58,414 LancarDebitur827 30 2 0 2873500 9000000 17,883 MacetDebitur2563 40 2 110952 5669048 1800000 18,41 MacetDebitur67 36 13 0 2544708 127526,4 48,675 LancarDebitur854 40 15 83333 3023064 180000 30,103 MacetDebitur789 34 1 0 2662300 10016581 13,511 LancarDebitur50 27 4 0 2529350 180000 53,479 LancarDebitur727 44 16 0 6752159 9033156 29,934 LancarDebitur1771 45 2 0 2827025 540000 54,53 MacetDebitur3822 29 5 541000 3379000 7156420 24,113 Macet

… … … … … … … …Debitur507 43 11 0 3088000 146340 24,401 LancarDebitur587 42 4 50000 3310000 2250353 41,667 LancarDebitur1601 25 1 425000 3780620 1630091 42,206 MacetDebitur222 40 6 663705 2445565 2863098 39,37 MacetDebitur134 35 5 975529 8332471 15033298 39,545 LancarDebitur443 29 4 0 3167413 1800000 8,245 LancarDebitur41 30 1 0 6000000 6266506 18,838 LancarDebitur475 53 3 0 3434698 180000 59,843 LancarDebitur107 50 22 0 3768304 3234233 34,993 LancarDebitur646 28 2 181732 3611225 5400000 27,637 LancarDebitur567 41 14 0 4285000 75243,6 37,881 MacetDebitur722 29 1 0 5774046 309020,4 18,705 LancarDebitur110 32 2 0 3128900 5718600 30,102 Lancar

40

Lampiran 3.Syntax cross validation di SAS

Proc discrim data= trainmethod =npar k=1 pool=yesmetric= full testdata= test testout= testout;class status;var Usia Lama_kerja Pinjaman_lain Pendapatan_bersih Nominal_akunRasio_hutang ;run;

proc print data=testout;run;

41

Lampiran 4.Syntax bootstrap di SAS

Proc survey select data=train out=outbootseed=30459584method=urssamprate=80outhitsrep=50;

run;

ods listing close;proc univariate data=outboot;var x;by Replicate;output out=outall kurtosis=curt;run;ods listing;

proc univariate data=outall;var curt;output out=final pctlpts=2,5, 97,5 pctlpre=ci;run;

proc print data=outboot;run;

42

Lampiran 5. Hasil klasifikasi kelas lengkap berdasarkan data bootstrap menggunakan majority voteKode Status Kredit, 0= Lancar, 1=Macet

nSt

atus

Asli

Hasil Prediksi berdasarkan jarak dengan Data Hasil Bootstrap

Lanc

arM

acet

Maj

ority

Vot

e

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

2 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0

45 5 0

3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0

45 5 0

4 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0

47 3 0

5 0 1 1 1 1 1 1 1 1 1 0 0 1 0 1 1 1 0 1 1 0 1 1 1 0 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1 1 0 1 1 1 1 0

12 38

1

6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

7 0 0 0 1 0 0 1 0 1 0 0 1 0 1 1 1 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0

34 16

0

8 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1

45 5 0

9 0 0 0 1 0 1 0 0 1 1 1 0 1 0 0 1 0 1 1 1 0 0 0 0 1 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 0 1 1

20 30

1

10

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

11

1 0 1 0 0 0 0 0 1 1 0 1 0 0 1 1 0 1 0 1 1 0 1 1 0 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 1 0 1 1 0 1 0 0 1 0

29 21

0

12

0 1 0 1 0 1 0 1 1 0 1 1 1 0 1 0 1 1 0 1 1 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1 1 0 0 0 1 1 1 0 0 0 0 0 1 0 1

20 30

1

13

1 1 1 0 1 0 1 1 1 0 1 0 1 0 1 0 1 1 0 1 1 1 0 0 1 1 0 0 0 0 0 0 1 1 1 1 0 1 0 0 1 0 1 1 0 0 1 0 1 1 1

22 28

1

43

140 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0

41 9 015

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

16

0 0 0 0 1 0 0 1 0 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0

38 12

0

17

1 0 1 0 0 1 0 0 0 1 1 1 0 1 0 1 0 0 1 1 0 0 0 1 0 0 0 1 1 0 1 1 1 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 1 1 0

28 22

0

18

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

19

0 0 0 1 0 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 1 0 0 1 1 0 0 1 1 0 1 1 1 1 0 1 1 1 0 1 1 0 0 1 0 1 1 0 1 1 0

21 29

1

20

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

21

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

22

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0

46 4 0

23

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

24

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

25

1 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 1 0 1 0 0 1 1 1 0 1 0 1 0 1 1 0 0 1 0 0 1 0 1 0 0

33 17

0

26

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 1 0

27

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

28

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

29

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

30

0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0

45 5 0

31

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

44

320 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 1 033

0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0

43 7 0

34

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

35

1 0 0 0 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0

41 9 0

36

0 1 0 0 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 1 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1

11 39

1

37

0 1 1 0 1 0 1 0 1 0 1 0 0 1 1 1 1 1 1 1 0 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 0 1 0 1 0 1 1 0 0 1 1 1 0 1

16 34

1

38

0 0 1 1 0 0 0 1 1 1 1 0 1 0 0 0 0 0 0 0 1 0 0 0 1 0 1 0 1 1 0 0 1 1 1 1 1 0 1 0 0 0 0 0 0 1 1 0 1 0 0

29 21

0

39

0 0 0 1 0 0 1 1 0 0 1 1 1 0 1 0 1 0 1 1 1 0 0 1 1 0 1 1 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 1 1 0 1 0 0

26 24

0

40

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

41

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

42

0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0

45 5 0

43

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

44

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

45

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1

46 4 0

46

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

50 0 0

47

0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 1 1 0 1 0 0 0 0 0 1 0 0 0 1 1 0

35 15

0

48

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 1 0

49

0 1 1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 0 7 43

1

45

501 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

47 3 051

0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0

37 13

0

52

0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0

45 4 0

53

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

54

0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0

42 7 0

55

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

48 1 0

56

1 0 0 0 0 0 1 0 1 0 0 0 0 0 1 1 1 0 1 0 1 1 1 0 0 0 0 0 0 0 0 1 1 1 0 1 1 1 0 0 1 1 1 0 0 0 0 0 0 1 1

30 19

0

57

0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

46 3 0

58

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

59

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

47 2 0

60

0 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 3 46

1

61

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

62

0 1 0 1 0 0 1 1 0 0 0 1 1 0 0 0 0 1 1 1 1 0 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 1 0 1

29 20

0

63

0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

48 1 0

64

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

47 2 0

65

0 0 0 0 1 0 1 0 1 1 0 1 0 0 1 0 1 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 1

34 15

0

66

1 0 1 0 0 0 0 0 1 0 0 0 0 1 1 0 1 1 1 0 0 0 1 1 0 0 0 0 1 0 1 0 1 0 0 1 0 0 1 0 1 0 0 1 0 1 1 0 0 0 0

32 17

0

67

0 1 1 1 1 0 1 0 0 1 0 0 0 1 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 0 0 0 1 1 1 0 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1

16 33

1

46

680 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 069

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

70

1 0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 1 1 1 0 0 0 1 1 0 0 0 0 1 0 1 0 1 0 0 1 0 0 1 0 1 0 0 1 0 1 1 1 1 0 1

29 20

0

71

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

72

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

73

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0

45 4 0

74

0 0 1 1 1 1 1 1 0 1 1 1 1 0 1 0 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 0 0 1 1 0 1 1 1 1 1 1 1 0 0 1 0 1 1 1

14 35

1

75

1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0

43 6 0

76

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0

44 5 0

77

1 1 1 1 1 1 1 1 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 0 1 0 1 1 0 1 0 1 0 1 0 1

13 36

1

78

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

79

0 0 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 1 0 0 1 1 0 0 1 0 0 0 0

36 13

0

80

1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0

38 11

0

81

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

82

0 1 1 1 0 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 6 43

1

83

0 0 1 1 1 0 1 1 1 1 0 0 1 1 1 0 1 1 1 1 1 0 1 1 0 1 0 0 1 1 1 1 1 0 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1

15 34

1

84

0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

45 4 0

85

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

47

860 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 1 0 1 1 0 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1

35 14

087

0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0

44 5 0

88

0 1 0 1 0 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 1

36 13

0

89

1 1 0 0 1 1 0 0 0 1 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0 0 0 1 1 0

36 13

0

90

1 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0

43 6 0

91

0 1 0 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 1 1 1 0 0 0 0 0 0 1 1 0 0

37 12

0

92

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

93

0 1 1 0 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 0 1 8 41

1

94

0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 1 1 1 0 1 0 1 0 1 1 0 0 1 0 0 1 0 1 0 0

34 15

0

95

0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

47 2 0

96

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

97

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

98

0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 1 1 3 46

1

99

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

49 0 0

Documents

DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN …eprints.undip.ac.id/55059/1/Fatimah.pdf · Pada kesempatan ini ... 4.4.2 Penentuan Tetangga Terdekat Sebanyak k pada Setiap Data Bootstrap