Upload
others
View
28
Download
0
Embed Size (px)
Citation preview
PENERAPAN ALGORITMA C4.5
UNTUK MEMPREDIKSI KEAHLIAN KARYAWAN
(STUDI KASUS PT.YANMAR INDONESIA)
SKRIPSI
Oleh:
MUSTAFA KAMIL
311410561
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PENERAPAN ALGORITMA C4.5
UNTUK MEMPREDIKSI KEAHLIAN KARYAWAN
(STUDI KASUS PT.YANMAR INDONESIA)
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan
Program Strata Satu (S1) pada Program Studi Teknik Informatika
Oleh:
MUSTAFA KAMIL
311410561
PROGRAM STUDI TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
iii
iii
PERNYATAAN KEASLIAN PENELITIAN
Saya yang bertandatangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah
diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi
pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga tidak terdapat
karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar
pustaka.
Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.
Bekasi, 08 Desember 2018
Materai 6.000
Mustafa Kamil
NIM: 311410561
iv
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah
melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang
berjudul “PENERAPAN ALGORITMA C4.5 UNTUK MEMPREDIKSI
KEAHLIAN KARYAWAN (Studi Kasus Di PT. Yanmar Indonesia)”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom)
pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan S. Sunge, M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
c. Bapak Aswan S. Sunge, M.Kom selaku Pembimbing Utama yang telah banyak
memberikan arahan dan bimbingan kepada penulis dalam penyusunan Skripsi
ini.
d. Seluruh Dosen STT Pelita Bangsa yang telah membekali dengan wawasan dan
ilmu di bidang teknik informatika.
e. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
f. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
g. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat
dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.
v
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.
Bekasi, 08 Desember 2018
Mustafa Kamil
NIM: 311410561
vi
DAFTAR ISI
PERSETUJUAN .................................................... Error! Bookmark not defined.
PENGESAHAN ..................................................... Error! Bookmark not defined.
PERNYATAAN KEASLIAN PENELITIAN ........................................................ ii
KATA PENGANTAR ........................................................................................... iv
DAFTAR ISI .......................................................................................................... vi
DAFTAR TABEL .................................................................................................. ix
DAFTAR GAMBAR .............................................................................................. x
ABSTRACT ............................................................................................................ xii
ABSTRAK ........................................................................................................... xiii
BAB I PENDAHULUAN ....................................................................................... 1
Latar Belakang ......................................................................................... 1
Identifikasi Masalah ................................................................................. 2
Batasan Masalah ....................................................................................... 3
Rumusan Masalah .................................................................................... 3
Tujuan dan Manfaat .................................................................................. 3
1.5.1 Tujuan ............................................................................................... 3
1.5.2 Manfaat ............................................................................................. 3
1.6 Sistematika Penulisan ............................................................................... 4
BAB II LANDASAN TEORI ................................................................................. 6
vii
2.1 Kajian Penelitian ...................................................................................... 6
2.2 Pengertian Karyawan ............................................................................... 7
2.2.1 Pengertian Pegawai ........................................................................... 7
2.2.2 Pengertian Kinerja Karyawan ........................................................... 7
2.2.3 Kriteria Kinerja Karyawan ................................................................ 8
2.3 Data Msining .......................................................................................... 10
2.3.1 Bagian Metode Data Mining ........................................................... 12
2.4 Pohon Keputusan (Decision tree) ........................................................... 15
2.5 Algoritma C4.5 ....................................................................................... 17
2.6 RapidMiner ............................................................................................. 19
BAB III METODE PENELITIAN........................................................................ 22
3.1 Objek Penelitian ..................................................................................... 22
3.1.1 Sejarah Tempat Penelitian............................................................... 22
3.1.2 Struktur Organisasi ......................................................................... 23
3.1.3 Visi Perusahaan ............................................................................... 23
3.2 Metodologi Penelitian ............................................................................ 24
3.3 Pengumpulan data .................................................................................. 25
3.4 Pengolahan Data Awal ........................................................................... 26
3.5 Penentuan Metode .................................................................................. 26
3.6 Kerangka Pemikiran ............................................................................... 28
BAB IV HASIL DAN PEMBAHASAN .............................................................. 29
viii
4.1 Hasil Penelitian ....................................................................................... 29
4.1.1 Select Data ...................................................................................... 29
4.1.2 Split Validation ............................................................................... 30
4.1.3 Proces Validasi Menggunakan RapidMiner.................................... 32
4.2 Pembahasan ............................................................................................ 37
4.2.1 Hasil Validasi Menggunakan RapidMiner ..................................... 37
4.2.2 Perhitungan Jumlah Kasus Data Keseluruhan, Data Training dan
Data Testing .................................................................................................. 45
4.2.3 Pemodelan Menggunakan Algoritma C4.5 ..................................... 54
4.2.4 Akurasi Prediksi .............................................................................. 70
BAB V PENUTUP ................................................................................................ 73
5.1 Kesimpulan ............................................................................................. 73
5.2 Saran ....................................................................................................... 73
DAFTAR PUSTAKA ........................................................................................... 74
LAMPIRAN .......................................................................................................... 76
ix
DAFTAR TABEL
Tabel 3.1 Kriteria Penelitian Karyawan ................................................................ 26
Tabel 4.1 Pemilihan Data ...................................................................................... 30
Tabel 4.2 Rule Decision Tree Data Training ........................................................ 43
Tabel 4.3 Rule Decision Tree Data Testing .......................................................... 45
Tabel 4.4 Jumlah Nilai Atribut Keseluruhan ........................................................ 45
Tabel 4.5 Jumlah Kasus Data Training ................................................................ 48
Tabel 4.6 Jumlah Kasus Data Testing .................................................................. 51
Tabel 4.7 Perhitungan Note 1 (Root) .................................................................... 54
Tabel 4.8 Perhitungan Note 1.1 ............................................................................. 59
Tabel 4.9 Perhitungan Note 1.2 ............................................................................. 61
Tabel 4.10 Perhitungan Note 1.1.1 ........................................................................ 64
Tabel 4.11 Perhitungan Note 1.1.1.1 ..................................................................... 66
Tabel 4.12 Perhitungan Note 1.2.1 ........................................................................ 68
x
DAFTAR GAMBAR
Gambar 2.1 Tahapan Data Mining ........................................................................ 11
Gambar 2.2 Bentuk Decision Tree Secara Umum ................................................ 16
Gambar 3.1 Strukrtur Organisasi Objek Penilitian ............................................... 23
Gambar 3.2 Tahapan Penilitian ............................................................................. 24
Gambar 3.3 Kerangka Pemikiran .......................................................................... 28
Gambar 4.1 Data Training ................................................................................... 32
Gambar 4.2 Data Testing ...................................................................................... 32
Gambar 4.3 Tampilan Awal RapidMiner ............................................................. 33
Gambar 4.4 Menu Utama New Project ................................................................. 33
Gambar 4.5 Proses Read Excel ............................................................................. 34
Gambar 4.6 Proses Import Data Wizard ............................................................... 34
Gambar 4.7 Import Data Training ......................................................................... 35
Gambar 4.8 Data Hasil Keputusan Sebagai Label ................................................ 35
Gambar 4.9 Proces Validation Menggunakan Data Training ............................... 36
Gambar 4.10 Proces Validation ............................................................................ 37
Gambar 4.11 Pengukuran Accuracy Data Training .............................................. 38
Gambar 4.12 Pengukuran Precision Data Training ............................................. 38
Gambar 4.13 Pengukuran recall Data Training .................................................. 39
Gambar 4.14 Pengukuran Accuracy Data Testing ................................................ 39
Gambar 4.15 Pengukuran Precision Data Testing ................................................ 40
Gambar 4.16 Pengukuran recall Data Testing ..................................................... 41
Gambar 4.17 Hasil Kurva ROC/AUC Data Training ........................................... 42
Gambar 4.18 Hasil Pohon Keputusan Data Training .......................................... 42
xi
Gambar 4.19 Hasil Kurva ROC/AUC Data Testing ............................................ 44
Gambar 4.20 Hasil Pohon Keputusan Data Testing ............................................. 44
Gambar 4.21 Pohon Keputusan Node 1 ................................................................ 59
Gambar 4.22 Pohon Keputusan Node 1.1 ............................................................. 61
Gambar 4.23 Pohon Keputusan Node 1.2 ............................................................. 63
Gambar 4.24 Pohon Keputusan Node 1.1.1 ......................................................... 66
Gambar 4.25 Pohon Keputusan Node 1.1.1.1 ....................................................... 68
Gambar 4.26 Pohon Keputusan Node 1.2.1 .......................................................... 70
Gambar 4.27 Proses Akurasi Data Training Dan Testing .................................... 71
Gambar 4.28 Hasil Akurasi Data accuracy .......................................................... 71
Gambar 4.29 Hasil Prediksi RapidMiner .............................................................. 72
xii
ABSTRACT
Application of C4.5 To Predict Employee Performance Expertise (Case Study: PT Yanmar Indonesia).
Advisor 1: Aswan S. Sunge, M.Kom.
Advisor 2: Dr.Ir. Supriyanto, M.P
The activity of evaluating employee performance has become a common thing, especially in large companies. This is done to evaluate the performance of the employee. However, employee performance evaluation will also have an impact on being a source of concern, commotion, or frustration for employees. Because it is due to the results of the assessment of the company sometimes assessed as not objective and not transparent what criteria are involved in the assessment of employees. Therefore we need classification techniques and data mining predictions in solving these problems. The classification used in data mining is Decision Tree because it is a technique that is widely used and produces output with existing rules, with it can present employee performance appraisal data. In this study using C4.5 Algorithm to produce classification rules for employee performance appraisal. After testing, it was obtained accuracy with the decision tree evaluated by confusion matrix resulting in an accuracy rate of 77.67%, while the evaluation with the ROC curve with an accuracy of Excellent Clasification was 0.947.
Keywords: Employee Skills, Data Mining, Decision Tree, C4.5 Algorithm
xiii
ABSTRAK
Penerapan C4.5 Untuk Memprediksi Keahlian Kinerja Karyawan (Studi Kasus : PT Yanmar Indonesia).
Pembimbing 1 : Aswan S. Sunge, M.Kom
Pembimbing 2 : Dr. Ir. Supriyanto, M.P
Kegiatan penilaian kinerja karyawan sudah menjadi hal umum khususnya di perusahaan besar. Hal ini di laksanakan untuk mengevaluasi kinerja si karyawan. Namun Penilaian kinerja karyawan juga akan berdampak menjadi sumber kerisauan, keributan, atau frustasi bagi karyawan. Karena disebabkan hasil penilaian dari perusahaan terkadang dinilai tidak obyektif dan tidak transparannya kriteria – kriteria apa saja yang dilibatkan dalam penilian karyawan. Oleh karena itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan masalah tersebut. Klasifikasi yang digunakan dalam data mining adalah Decision Tree dikarenakan merupakan teknik yang banyak digunakan dan menghasilkan output dengan aturan yang ada, dengan hal tersebut dapat menyajikan data penilaian kinerja karyawan. Dalam penelitian ini menggunakan Algoritma C4.5 untuk menghasilkan aturan klasifikasi penilaian kinerja karyawan. Setelah dilakukan pengujian, diperoleh akurasi dengan decision tree yang dievaluasi dengan confusion matrix menghasilkan tingkat akurasi sebesar 77.67%, sedangkan evaluasi dengan kurva ROC dengan akurasi Excellent Clasification sebesar 0.947.
Kata Kunci: Keahlian Karyawan, Data Mining, Decision Tree, Algoritma C4.5
xiv
1
BAB I
PENDAHULUAN
Latar Belakang
Sumber Daya Manusia merupakan aset terpenting dalam suatu perusahaan,
karena Sumber Daya Manusia menentukan keberhasilan suatu perusahaan. Sumber
Daya Manusia di perusahaan perlu dikelola secara profesional agar terwujud
keseimbangan antara kebutuhan karyawan dengan tuntutan dan kemampuan
perusahaan. Pandangan terhadap Sumber Daya Manusia dapat dilihat secara
individu maupun secara kelompok, hal tersebut dikarenakan perilaku manusia
mempunyai sifat dan karakteristik yang berbeda-beda.
Setiap perusahaan selalu mengharapkan karyawannya mempunyai prestasi,
karena dengan memiliki karyawan yang berprestasi akan memberikan sumbangan
yang optimal bagi perusahaan. Selain itu, dengan memiliki karyawan yang
berprestasi perusahaan dapat meningkatkan kinerja perusahaan.
Kegiatan penilaian kinerja karyawan sudah menjadi hal umum khususnya
di perusahaan besar. Hal ini di laksanakan untuk mengevaluasi kinerja si karyawan.
Selain itu penilaian kinerja karyawan juga mendorong para karyawan untuk
meningkatkan kuantitas dan kualitas kerjanya demi perusahaan. Perusahaan juga
akan memberikan apresiasi terhadap karyawan yang penilaian kinerjanya
berprestasi supaya dapat memacu kinerja karyawan yang lainnya.
Selain bermanfaat bagi perusahaan, penilaian kinerja karyawan juga akan
berdampak menjadi sumber kerisauan, keributan, atau frustasi bagi karyawan. Hal
tersebut disebabkan hasil penilaian dari perusahaan terkadang dinilai tidak obyektif
2
karena tidak transparannya kriteria – kriteria apa saja yang dilibatkan dalam
penilian karyawan, sehingga memunculkan anggapan bahwa data dapat
dimanipulasi dan hasil dari penilaiannya tidak adil. Hal itu bisa terjadi karena
sulitnya mengambil keputusan dengan kriteria yang banyak tanpa adanya
otomatisasi penggalian data. Perusahan akan mendapatkan dampaknya yaitu tidak
akan mendapatkan sumber daya manusia yang kompetitif karena data dengan
kenyataan yang di lapangan sangat berbeda mengenai kinerja karyawannya. Salah
satu solusi caranya dengan mengembangkan metode penelitian baru yang dapat
menambah keakuratan hasil keputusan yaitu penggunaan data mining.
Menimbang dari latar belakang masalah diatas maka penulis mengambil
penelitian skripsi ini dengan judul “Penerapan Data Mining Untuk Memprediksi
Keahlian Karyawan Dengan Metode Algoritma C4.5 (Studi Kasus PT. Yanmar
Indonesia)”.
Identifikasi Masalah
Berdasarkan latar belakang masalah yang penulis kemukakan diatas, maka
dapat diidentifikasikan masalah sebagai berikut:
1. Hasil Penilaian dinilai kurang obyektif di karenakan tidak transparannya
kriteria dan proses yang digunakan untuk melakukan penilaian karyawan.
2. Hasil keputusan penilaian karyawan belum dapat dinilai tingkat
keakuratannya.
3. Belum adanya suatu metode dalam melihat penilaian karyawan.
4. Belum adanya akurasi dan prediksi dalam melihat suatu keakuratan dalam
penilaian karyawan.
3
5. Masih menggunakan sistem penilaian manual terutama dalam melihat suatu
keputusan menilai karyawan.
Batasan Masalah
Berdasar pada latar belakang yang sudah dikemukakan, maka rumusan
masalah pada penelitian ini adalah
1. Bagaimana melihat akurasi akurasi dan prediksi dalam penilaian karyawan
dengan metode klasifikasi data mining dengan algoritma c4.5.
Rumusan Masalah
Pembahasan penelitian ini dibatasi agar tidak menyimpang dari apa yang
telah dirumuskan, batasan masalah pada penelitian ini sebagai berikut.
1. Bagaimana melihat suatu prediksi dan akurasi untuk penilaian karyawan.
Dengan prediksi penilaian karyawan dengan Algoritma C4.5.
Tujuan dan Manfaat
1.5.1 Tujuan
Tujuan yang ingin dicapai dalam penelitian ini adalah
1. Menganalisa pencapaian kinerja karyawan dengan menggali data-data yang
akurat untuk menjadi acuan dalam penetapan keputusan.
2. Untuk memprediksi hasil penilaian karyawan.
1.5.2 Manfaat
Manfaat yang diperoleh dari penelitian ini adalah
1. Mempermudah perusahaan dalam hal mengambil keputusan untuk
menentukan karyawan yang memiliki keahlian dan yang tidak secara
obyektif berdasarkan kriteria-kriteria yang sesuai dan transparan.
4
2. Menghindari manipulasi data maupun cara yang subyektif dari pengambilan
keputusan agar karyawan juga merasa keputusan yang di peroleh sudah
sesuai aktual.
3. Penelitian ini dapat dijadikan perbandingan bagi penelitian lain yang
berkaitan dengan pengambilan keputusan.
1.6 Sistematika Penulisan
Penelitian ini terbagi menjadi lima bab, dimana masing–masing bab terdiri
dari beberapa sub–sub bab untuk menghasilkan pembahasan secara
sistematis. Adapun lima bab tersebut ialah :
BAB I : PENDAHULUAN
Pada bab ini ingin mengemukakan gambaran tentang latar belakang,
maksud dan tujuan, rumusan masalah, batasan masalah, metode
pengumpulan data dan sistematika penulisan
BAB II : TINJAUAN PUSTAKA
Pada bab ini ingin menjelaskan tentang teori-teori yang didapat dari
sumber-sumber yang relevan untuk digunakan sebagai panduan dalam
penelitian serta penyusunan skripsi.
BAB III : METODE PENELITIAN
Pada bab ini akan menjelaskan tentang tahap penelitian, data yang
digunakan, pemodelan data, data prepocessing dan analisis cluster.
5
BAB IV : HASIL DAN PEMBAHASAN
Pada bab ini akan menjelaskan tentang implementasi algoritma serta
pembahasan dari penelitian yang dilakukan.
BAB V : PENUTUP
Pada bab ini akan memberikan kesimpulan dan saran dari keseluruhan
penelitian yang telah di bahas.
6
BAB II
LANDASAN TEORI
2.1 Kajian Penelitian
Berikut merupakan penelitian terdahulu yang masih berkaitan dengan metode
maupun akurasi menggunakan algoritma C4.5 adalah
1. Uji Akurasi Klasifikasi Dan Validasi Data Pada Pengguna Metode
Membersif Function Dan Algoritma C4.5 Dalam Penelitian Penerimaan
Beasiswa (Budiman, A. S, & Parandani, X. A. 2018)
Penelitian ini bertujuan untuk menguji dan memastikan validasi data dalam
penilain penerimaan beasiswa dengan menggunakan dua metode yaitu
Membersif Function dan Algoritma C4.5.
2. Implementation of Data Mining to Analyze Drug Cases Using C4.5
Decision Tree. (Wahyuni, S. 2018)
Penelitian ini bertujuan untuk menganalisa data tahanan yang melakukan
tindakan narkoba supaya di peroleh informasi serta meminimalkan tindak
pidana narkoba.
3. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 (Studi Kasus
: PT HANKOOK Tire Indonesia). (Sunge, A. S. 2018).
Penelitian ini bertujuan untuk memprediksi dalam melihat kompetensi
karyawan dan dihasilkan akurasi yang tepat.
4. Perbandingan Akurasi Algoritma C4.5 dan CART dalam Memprediksi
Kategori Indeks Prestasi Mahasiswa. (Alverina. D, dkk. 2018)
7
Penelitian ini bertujuan untuk membandingkan prediksi dalam penilaian
akurasi indek prestasi mahasiswa dengan menggunakan Algoritma C4.5 dan
CART.
2.2 Pengertian Karyawan
Menurut Hasibuan (2012), Karyawan adalah orang penjual jasa (pikiran
atau tenaga) dan mendapat kompensasi yang besarnya telah ditetapkan terlebih
dahulu.
Karyawan merupakan terjemahan dari kata “performance” yang memiliki
arti sebagai sebuah hasil kerja seorang pegawai atau pekerja, sebuah proses
manajemen yang mana hasil kerja tersebut harus memiliki sebuah bukti konkret
yang juga dapat diukur (Sedarmayanti, 2011).
2.2.1 Pengertian Pegawai
Menurut Musanef (2009:5) pegawai adalah orang-orang yang melakukan
pekerjaan dengan mendapat imbalan jasa berupa gaji dan tunjangan dari pemerintah
atau badan swasta.
A.W.Widjaja (2006:113) penyebut pegawai merupakan tenaga kerja
manusia jasmaniah maupun rohaniah (mental dan pikiran) yang senantiasa
dibutuhkan dan oleh karena itu menjadi salah satu modal pokok dalam usaha kerja
sama untuk mencapai tujuan tertentu (organisasi).
2.2.2 Pengertian Kinerja Karyawan
Istilah kinerja berasal dari kata Job Performance prestasi kerja atau prestasi
sesungguhnya yang dicapai oleh seseorang. Pengertian Kinerja adalah hasil kerja
8
secara kualitas dan kuantitas yang dicapai oleh seorang pegawai dalam
melaksanakan tugasnya sesuai dengan tanggung jawab yang diberikan padanya
Mangkunegara (2013).
Kinerja menurut Fahmi (2014) adalah hasil yang diperoleh oleh suatu
organisasi baik organisasi tersebut bersifat profit oriented dan non profit oriented
yang dihasilkan selama satu periode waktu.
Menurut Simanjuntak (2005) dalam Widodo (2015) Kinerja adalah
tingkatan pencapaian hasil atas pelaksanaan tugas tertentu. Simanjuntak juga
mengartikan kinerja individu sebagai tingkat pencapaian atau hasil kerja seseorang
dari sasaran yang harus dilaksanakan dalam kurun waktu tertentu.
2.2.3 Kriteria Kinerja Karyawan
Kriteria kinerja adalah dimensi-dimensi pengevaluasian kinerja seseorang
pemegang jabatan, suatu tim, dan suatu unit kerja. Secara bersama-sama dimensi
itu merupakan harapan kinerja yang berusaha dipenuhi individu dan tim guna
mencapai strategi organisasi.
Menurut Schuler dan Jackson 2004 (dalam Harsuko 2011) bahwa ada 3 jenis
dasar kriteria kinerja yaitu:
1. Kriteria berdasarkan sifat memusatkan diri pada karakteristik pribadi
seseorang karyawan. Loyalitas, keandalan, kemampuan berkomunikasi, dan
keterampilan memimpin merupakan sifat-sifat yang sering dinilai selama
proses penilaian. Jenis kriteria ini memusatkan diri pada bagaimana
9
seseorang, bukan apa yang dicapai atau tidak dicapai seseorang dalam
pekerjaanya.
2. Kriteria berdasarkan perilaku terfokus pada bgaimana pekerjaan
dilaksanakan. Kriteria semacam ini penting sekali bagi pekerjaan yang
membutuhkan hubungan antar personal. Sebagai contoh apakah SDMnya
ramah atau menyenangkan.
3. Kriteria berdasarkan hasil, kriteria ini semakin populer dengan makin
ditekanya produktivitas dan daya saing internasional. Kreteria ini berfokus
pada apa yang telah dicapai atau dihasilkan ketimbang bagaimana sesuatu
dicapai atau dihasilkan.
Menurut Bernandin & Russell (2001 dalam Riani 2011) kriteria yang
digunakan untuk menilai kinerja karyawan adalah sebagai berikut:
1. Quantity of Work (kuantitas kerja): jumlah kerja yang dilakukan dalam
suatu periode yang ditentukan.
2. Quality of Work (kualitas kerja): kualitas kerja yang dicapai berdasarkan
syarat-syarat kesesuaian dan ditentukan.
3. Job Knowledge (pengetahuan pekerjaan): luasnya pengetahuan mengenai
pekerjaan dan keterampilannya.
4. Creativeness (kreativitas): keaslian gagasan-gagasan yang dimunculkan dan
tindakan-tindakan untuk menyelesaikan persoalan-persoalan yang timbul.
5. Cooperation (kerja sama): kesedian untuk bekerjasama dengan orang lain
atau sesama anggota organisasi.
10
6. Dependability (ketergantungan): kesadaran untuk mendapatkan
kepercayaan dalam hal kehadiran dan penyelesaian kerja.
7. Initiative (inisiatif): semangat untuk melaksanakan tugas-tugas baru dan
dalam memperbesar tanggung jawabnya.
8. Personal Qualities (kualitas personal): menyangkut kepribadian,
kepemimpinan, keramah-tamahan dan integritas pribadi.
2.3 Data Mining
Data mining adalah serangkaian proses untuk menggali nilai tambah berupa
informasi yang selama ini tidak diketahui secara manual dari suatu basis data.
Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola
yang penting atau menarik dari data yang terdapat pada basis data. Data mining
terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data
yang besar sehingga sering disebut knowledge discovery database (KDD)
(Vulandari, 2017:1).
Menurut Clifton (dalam Suyanto,2017:1) terdapat dalam bukunya “Data
Mining Untuk Klasifikasi Dan Klastering Data”, data mining merupakan gabungan
sejumlah disiplin ilmu komputer, yang didefinisikan sebagai proses penemuan
pola-pola baru dari kumpulan-kumpulan data sangat besar, meliputi metode-metode
yang merupakan irisan dari artifical intelligence, machine learning, statistics dan
databases system.
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa
tahap proses yang diilustrasikan pada gambar di bawah ini. Tahap-tahap tersebut
11
bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge
base. (Larose, 2005)
Gambar 2.1 Tahapan Data Mining
Sumber : Han,dkk, 2012.
Tahap-tahap data mining adalah sebagai berikut:
a) Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilang-kan noise dan data yang
tidak konsisten atau data tidak relevan.
b) Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai database ke
dalam satu database baru.
c) Seleksi data (data selection)
12
Data yang ada pada database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari
database.
d) Transformasi data (data transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses
dalam data mining.
e) Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data. Beberapa metode yang
dapat digunakan berdasarkan pengelompokan data mining yaitu Estimation,
Prediction, Classification, Clustering, Association.
f) Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang
ditemukan.
g) Presentasi pengetahuan (knowledge presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang
digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.
2.3.1 Bagian Metode Data Mining
Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat dilakukan, yaitu:
1. Estimation (Estimasi)
13
Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target
adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau
diskrit).
Estimasi nilai dari variabel target ditentukan berdasarkan nilai dari varibel
prediktor (atribut).
Algoritma estimasi yang biasa digunakan adalah : Linear Regression, Neural
Network, Support Vector Machine
2. Prediction / Forecasting (Prediksi)
Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana
label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan
data rentet waktu (data time series).
Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk
prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan
berbagai atribut yang disediakan.
Algoritma prediksi yang biasa digunakan adalah : Linear Regression, Neural
Network, Support Vector Machine.
3. Classification (Klasifikasi)
Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang
telah didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan
memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan
hasilnya untuk memberikan sejumlah aturan. Salah satu contoh yang mudah dan
popular adalah dengan Decision tree yaitu salah satu metode klasifikasi yang paling
14
populer karena mudah untuk diinterpretasi. Decision tree adalah model prediksi
menggunakan struktur pohon atau struktur berhirarki.
Algoritma klasifikasi yang biasa digunakan adalah : Naive Bayes, K-Nearest
Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis,dll
4. Clustering (Klastering)
Digunakan untuk menganalisis pengelompokkan berbeda terhadap data, mirip
dengan klasifikasi, namun pengelompokkan belum didefinisikan sebelum
dijalankannya tool data mining. Biasanya menggunkan metode neural network atau
statistik. Clustering membagi item menjadi kelompok-kelompok berdasarkan yang
ditemukan tool data mining.
Algoritma clustering yang biasa digunakan adalah : K-Means, K-Medoids,
Self-Organizing Map (SOM), Fuzzy C-Means
5. Association (Asosiasi)
Digunakan untuk mengenali kelakuan dari kejadian-kejadian khusus atau
proses dimana hubungan asosiasi muncul pada setiap kejadian. Salah satu
contohnya adalah Market Basket Analysis, yaitu salah sati metode asosiasi yang
menganalisa kemungkinan pelanggan untuk membeli beberapa item secara
bersamaan.
Algoritma association rule diantaranya adalah : A priori algorithm, FP-Growth
algorithm, GRI algorithm.
15
2.4 Pohon Keputusan (Decision tree)
Vulandari (2017:15) menyimpulkan bahwa “Pohon dalam analisis
pemecahan masalah pengambilan keputusan adalah pemetaan mengenai alternatif-
alternatif pemecahan masalah yang dapat diambil dari masalah tersebut. Pohon
tersebut juga memperlihatkan faktor-faktor kemungkinan/ probabilitas yang akan
mempengaruhi alternatif-alternatif keputusan tersebut, disertai dengan estimasi
hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut”.
Decision tree adalah struktur flowchart yang menyerupai tree (pohon),
dimana setiap simpul internal menandakan suatu tes pada atribut, setiap cabang
merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau
distribusi kelas. Alur pada decision tree di telusuri dari simpul akar ke simpul daun
yang memegang prediksi. (Han, J., & Kamber, M. dalam Dennis, dkk :2013)
Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya
untuk mem-breakdown proses pengambilan keputusan yang kompleks menjadi
lebih simpel sehingga pengambil keputusan akan lebih menginterprestasikan solusi
dari permasalahan.
16
Gambar 2.2 Bentuk Decision Tree Secara Umum
Sumber : (Han, J., & Kamber, M. dalam Dennis, dkk :2013)
Pohon keputusan mempunyai tiga pendekatan klasik :
1. Pohon Klasifikasi, digunakan ketika hasil prediksi adalah keanggotaan kelas
(misalnya, Algoritma C4.5)
2. Pohon Regresi, digunakan ketika hasil prediksi dianggap sebagai bilangan
real (misalnya : harga minyak, nilai kendaraan)
3. CART (C & RT) yaitu klasifikasi dan pohon regresi.
Pohon keputusan banyak sekali perkembangan tetapi yang sering dipakai
adalah ID3 dan C4.5. Keduanya mempunyai prinsip yang sama dikarenakan
17
Algoritma C4.5 merupakan pengembangan dari ID3, tetapi mempunyai perbedaan
utama yaitu :
1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat
menangani data training dengan nilai yang hilang atau data yang kosong.
2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk
3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio
2.5 Algoritma C4.5
Algoritma adalah urutan logis langkah-langkah penyelesaian masalah yang
disusun secara sistematis (Munir, 2016)
Algoritma C4.5 adalah suatu deretan algoritma untuk permasalahan
klasifikasi di dalam sebuah mesin dan himpunan data. Algoritma C4.5
diperkenalkan oleh Quinlan (1996) sebagai versi pembenahan dari ID3. Dalam ID3,
induksi decision tree hanya dapat digunakan pada fitur kategorikal (nimonal),
sedangkan tipe numerik (ratio) tidak bisa digunakan. Perubahan yang membedakan
algoritma C4.5 dan ID3 adalah dapat menangani fitur dengan numerik , melakukan
pemotongan (pruning) decision tree, dan penurunan (deriving) rule set. Algoritma
C4.5 juga menggunakan kriteria gain dan menentukan fitur yang menjadi pemecah
node pada pohon yang diinduksi (Oktaviana, 2016)
Menurut Dennis, dkk (2013) terdapat dalam bukunya “Belajar Data Mining
Dengan Rapid Miner”, Algoritma C4.5 dapat menangani data numerik dan diskret.
Algoritma C.45 menggunakan rasio perolehan (gain ratio).
18
Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio
untuk diperbaharui information gain maka dengan rumus : (Aswan, 2018)
Dimana :
S = Ruang/Data Sample yang dipergunakan untuk data training.
A = Atribut
Gain(S,A) = information gain pada atribut A
SplitInfo(S,A) = split information pada atribut A
Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai
atribut test untuk simpul. Pendekatan ini menerapkan normalisasi pada information
gain dengan menggunakan apa yang disebut dengan split information, dengan
rumus :
Dimana:
S = Ruang (data) sample yang digunakan untuk training.
A = Atribut.
Si = Jumlah sample untuk atribut i
19
Pada saat membangun pohon keputusan, mungkin adanya data yang noise
maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk
mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih
mudah dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode
dalam melakukan pemakasan pohon keputusan yaitu:
A. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree
agar tidak sampai lebih jauh dalam pemangkas data training. Rumus
Prepruning :
Dimana :
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
c= confidence level
B. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang
beberapa cabang subtree setelah selesai dibangun. Metode ini sebagai bagian
standard untuk Algoritma C4.5.
2.6 RapidMiner
RapidMiner sebelumnya bernama YALE (Yet Another Learning
Environment), dimana versi awalnya mulai dikembangkan pada tahun 2001 oleh
RalfKlinkenberg, Ingo Mierswa, dan Simon Fischer di Artificial Intelligence Unit
dari University of Dortmund. RapidMiner didistribusikan di bawah lisensi AGPL
20
(GNU Affero General Public License) versi 3. Hingga saat ini telah ribuan aplikasi
yang dikembangkan mengunakan RapidMiner di lebih dari 40 negara. RapidMiner
sebagai software open source untuk data mining tidak perlu diragukan lagi karena
software ini sudah terkemuka di dunia. RapidMiner menempati peringkat pertama
sebagai Software data mining pada polling oleh KDnuggets, sebuah portal data-
mining pada 2010-2011.
RapidMiner menyediakan GUI (Graphic User Interface) untuk merancang
sebuah pipeline analitis. GUI ini akan menghasilkan file XML )Extensible Markup
Language) yang mendefenisikan proses analitis keingginan pengguna untuk
diterpkan ke data. File ini kemudian dibaca oleh RapidMiner untuk menjalankan
analis secara otomatis.
RapidMiner memiliki beberapa sifat sebagai berikut: (Wicaksana, I Wayan
Simri, 2013)
a) Ditulis dengan bahasa pemrograman Java sehingga dapat dijalankan di
berbagai sistem operasi.
b) Proses penemuan pengetahuan dimodelkan sebagai operator trees
c) Representasi XML internal untuk memastikan format standar pertukaran
data.
d) Bahasa scripting memungkinkan untuk eksperimen skala besar dan
otomatisasi eksperimen.
e) Konsep multi-layer untuk menjamin tampilan data yang efisien dan
menjamin penanganan data.
21
f) Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari
program lain.
Beberapa Fitur dari RapidMiner, antara lain:
a) Banyaknya algoritma data mining, seperti decision treee dan self-
organization map.
b) Bentuk grafis yang canggih, seperti tumpang tindih diagram histogram, tree
chart dan 3D Scatter plots.
c) Banyaknya variasi plugin, seperti text plugin untuk melakukan analisis teks.
d) Menyediakan prosedur data mining dan machine learning termasuk: ETL
(extraction, transformation,loading), data preprocessing, visualisasi,
modelling dan evaluasi
e) Proses data mining tersusun atas operator-operator yang nestable,
dideskripsikan dengan XML, dan dibuat dengan GUI
f) Mengintegrasikan proyek data mining Weka dan statistika R
22
BAB III
METODE PENELITIAN
3.1 Objek Penelitian
3.1.1 Sejarah Tempat Penelitian
PT Yanmar Indonesia adalah perusahaan jepang yang tergabung kedalam
yanmar group yang resmi didirikan pada 30 Januari 2012 yang dipimpin oleh
direktur YOSHIHIRO TAMAZAKI. Produk yang diproduksinya yaitu part mesin
diesel untuk tipe mesin kecil dan mesin besar.
Sedangkan Pada tahun 1912 PT Yanmar pusat yang berpusat di jepang
didirikan oleh YAMAOKA HATSUDOKI KOSAKUSHO. Memulai produksinya
dengan mesin gas/gas engines. Pada tahun 1921 nama YANMAR diadopsi sebagai
brand. Pada tahun 1930 A 2-cycle, vertical diesel engine model (5Hp) diluncurkan.
Pada 23 desember 1933 HB model, Mesin Diesel tipe kecil yg paling laku di dunia
(5-6Hp), diluncurkan. Pada 1955 Diesel dianugerahi Medali Emas oleh Asosiasi
Penemu Jerman. Pada 1957 Menerima penghargaan Merrit –Jerman.
Taman Batu Jepang mengenang Dr. Rudolf Diesel, disumbangkan ke kota
Augsburg, Jerman. Pada 1968 Dianugerahi Hadiah Deming. Pada 1983 L35 ultra
compact air cooled diesel engine model (3.5 Hp) diluncurkan. Pada 1995 BIWA
PLANT dibuka di Jepang. Pada 2006 Pencapaian Produksi TN series sebanyak 5
juta unit produksi. Pada 2012 menjadi peringatan ke-100th.bagi Yanmar Grup.
23
3.1.2 Struktur Organisasi
Strukrtur organisasi pada PT. Yanmar Indonesia dapat dilihat sebagai
berikut :
Gambar 3.1 Strukrtur Organisasi Objek Penilitian
3.1.3 Visi Perusahaan
Pernyataan Visi Perusahaan PT Yanmar Indonesia :
Kami hidup bersama dan saling terkait dengan alam
Menanggung pilar utama kehidupan
Dalam bidang produksi pangan dan pemanfaatan energi
Memecahkan permasalahan pelanggan
Menjadi perusahaan yang terhubung dengan masa depan
Serta mewujudkan kehidupan yang lebih makmur
24
3.2 Metodologi Penelitian
Pada tahap ini, data yang digunakan adalah data PT. Yanmar Indonesia di
Cikarang. Data tersebut akan diolah menggunakan metode Algoritma C4.5 dapat
digunakan sebagai rules untuk memprediksi penilaian kinerja karyawan. Dalam
penelitian ini akan dilakukan beberapa langkah atau tahapan penelitian.
Gambar 3.2 Tahap Penilitian
Penjelasan :
1. Pengumpulan data
Tahapan ini menerangkan tentang darimana sumber data dalam penelitian
ini didapatkan dan menemukan informasi yang bisa digunakan untuk
penelitian.
2. Pengolahan Data Awal
Tahapan ini menerangkan tentang tahap awal dalam data mining.
Pengolahan awal data meliputi proses input data keformat yang dibutuhkan.
3. Metode yang diusulkan
Tahapan ini dijelaskan pemilihan dan penggunaan metode algoritma C4.5
pada penelitian.
Pengumpulan data
Pengolahan data awal
Metode yang diusulkan
Pengujian/ Validasi hasil
25
4. Pengujian dan Validasi hasil
Tahapan ini menjelaskan tentang pengujian, hasil pengujian akan di validasi
dan kemudian di evaluasi. Penjelasan mengenai hal ini akan di paparkan
pada BAB IV.
3.3 Pengumpulan data
3.3.1 Sumber Data
Dalam penelitian ini penulis hanya menggunakan metode pengumpulan
data yang diperoleh langsung dari sumber objek penelitian. Dalam hal ini penulis
mendapatkan data dari management teknikal di PT Yanmar Indonesia. Data yang
digunakan dalam penelitian ini adalah data sekunder. Jumlah data yang ada
berjumlah 84 data, data yang ada terdiri berbagai bagian management teknikal yaitu
Quality Assurance, Casting Engineering, Patten Conservation dan Inspection.
3.3.2 Variabel Data
Variabel yang terdapat pada data penelitian ini meliputi variabel input dan
variabel output atau target.
1. Variabel input
Variabel input dinyatakan sebagai data penilaian karayawan. Berikut ini
adalah variabel input yang terdapat pada penilaian kinerja karyawan yang
akan digunakan untuk mengklasifikasi yaitu sebagai berikut:
26
Tabel 3.1 Kriteria Penilaian Karyawan
Kode Kemampuan Kode Sikap Kode Kontribusi
Kp1 Pengetahuan Sk1 Tanggung Jawab Kt1 Kecermatan
Kp2 Ketrampilan Sk2 Kerjasama Kt2 Kebersihan
Kp3 Pemahaman Sk3 Kerajinan Kt3 Kecekatan
Sk4 Disiplin Kt4 Tugas Khusus
Sk5 Kejujuran Kt5 Sumbang Saran
Kt6 Kesadaran Pembiayaan
Kt7 Citra Perusahaan
2. Variabel Target
Variabel target dinyatakan sebagai hasil dari penelitian yang dilakukan
terhadap variabel input. Sedangkan variabel target dari penelitian ini adalah
atribut “Hasil” yang berisikan label “Kompetensi” dan “Tidak”.
3.4 Pengolahan Data Awal
Pada tahap ini menjelaskan tentang tahap awal data mining. Data yang telah
didapatkan akan diolah keformat yang dibutuhkan, pengelompokkan dan penentuan
atribut data. Dalam melakukan pengolahan data awal, akan dilakukan beberapa
tahapan agar pada akhirnya akan didapatkan data yang bisa digunakan pada tahap
selanjutnya. Tahapan tersebut antara lain: select data dan split validation.
3.5 Penentuan Metode
Metode yang akan digunakan dalam penelitian ini adalah Algoritma C4.5.
Berikut ini tahapan proses pemodelan dalam penelitian ini:
1. Choosing the appropriate Data Mining taks
27
Pada tahap ini memilih jenis data mining yang digunakan. Pada
penelitian untuk prediksi kinerja karyawan maka dipilih jenis data mining
yang akan digunakan adalah klasifikasi.
2. Choosing the Data Mining Algorithm
Setelah pemilihan jenis data mining yang akan digunakan yaitu
klasifikasi, maka selanjutnya menentukan algoritma klasifikasi yang akan
digunakan. Pada penelitian ini algoritma yang dipilih adalah Algoritma
C4.5.
3. Employing the Data Mining Algorithm
Tahapan ini dilakukan untuk pengolahan data dengan algoritma
yang telah dipilih yaitu dengan menggunakan Algoritma C4.5.
4. Evaluation
Dalam tahap ini dilakukan evaluasi dan menafsirkan pola yang
didapatkan dari hasil algoritma yang dipakai untuk mengetahui aturan,
kehandalan, dan lain-lain. Evaluasi dilakukan dengan menerapkan pola
yang didapat dari proses sebelumya terhadap data testing yang disediakan.
Evaluasi dilakukan dengan confusion matrix dan kurva ROC. Tahapan ini
secara detail akan dibahas pada tahapan selanjutnya yaitu BAB IV.
5. Using the discovered knowledge
Pada tahap ini menggunakan pengetahuan yang diperoleh dari
proses data mining untuk penerapan pada aplikasi atau lainya. Pengetahuan
klasifikasi untuk memprediksi penilaian kinerja karyawan “Kompetensi”
dan yang “Tidak”. Pembahasan tahap ini akan dijabarkan pada BAB IV.
28
3.6 Kerangka Pemikiran
Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran
sebagai pedoman yang dilakukan secara konsisten. Unutk menyelesaikan
masalahan penelitian ini penulis menggunakan metode Algoritma c4.5. Pengujian
metode ini dilakukan dengan cara cross validation, confusion matrix dan kurva
ROC. Untuk pengembangannya dan pengujian metode ini digunakan aplikasi
RapidMiner. Berikut adalah kerangka pemikiran yang dilakukan.
Gambar 3.3 Kerangka Pemikiran
Identifikasi Masalah
Hasil keputusan penilaian karyawan belum dapat dinilai tingkat keakuratannya
Metode
C4.5
Pengembangan
Aplikasi RapidMiner
Implementasi
Karyawan berkompeten dan tidak berkompeten
Pengukuran
Confusion Matrix KurvaROC
29
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian
Data awal merupakan data yang diperoleh dari hasil penilaian leader,
supervisor bagian masing-masing dan HRD kepada karyawan yang masih dalam
cakupan management teknikal yaitu Quality Assurance, Casting Engineering,
Patten Conservation dan Inspection. Data yang sudah dinilai oleh leader, supervisor
dan HRD tadi lalu dijumlahkan dan dijadikan satu data sesuai dengan kriteria-
kriteria yang ada (lampiran 1).
Beberapa tahap pengolahan data awal tersebut yaitu : select data dan split
validation.
4.1.1 Select Data
Pada tahap ini dilakukan pemilihan variabel data yang akan dianalisa,
karena sering ditemukan bahwa tidak semua data dibutuhkan untuk dilakukan
proses data mining. Pemilihan variabel tersebut dilakukan dengan memperhatikan
tujuan penulisan, sehingga diperoleh beberapa variabel yang akan digunakan
menjadi variabel input.
Dari 84 data yang ada dengan variabel sebanyak 19, sebanyak 16 variabel
yang diambil saja. Data hasil seleksi akan digunakan dalam proses data mining.
Berikut adalah penjelasan variabel sebagai berikut :
30
Tabel 4.1 Pemilihan Data
Variabel Indikator Detail Penggunaan
Nama X -
NIK X -
Bagian X -
Kp1( Pengetahuan) V Nilai Model
Kp2 (Ketrampilan V Nilai Model
Kp3 (Pemahaman) V Nilai Model
Sk1 (Tanggung Jawab) V Nilai Model
Sk2 (Kerjasama) V Nilai Model
Sk3 (Kerajinan) V Nilai Model
Sk4 ( Disiplin V Nilai Model
Sk5 (Kejujuran) V Nilai Model
Kt1 (Kecermatan) V Nilai Model
Kt2 (Kebersihan) V Nilai Model
Kt3 (Kecekatam) V Nilai Model
Kt4 (Tugas Khusus) V Nilai Model
Kt5( Sumbang Saran) V Nilai Model
Kt6 (Kesadaran Pembiayaan) V Nilai Model
Kt7 (Citra Perusahaan) V Nilai Model
Hasil V Label Target
Pada tabek variabel diatas akan digunakan dan tidak digunakan dalam
penelitian ini. Indikator “V” menandakan bahwa variabel tersebut digunakan,
sedangkan indikator “X” menandakan variabel tersebut dieliminasi pada tahap
pengolahan data awal. Pengeliminasian beberapa variabel tersebut berdasarkan
nilai model yang relatif sama dan tidak mempengaruhi hasil dari proses penilaian.
4.1.2 Split Validation
Split Validation merupakan teknik validasi yang membagi data menjadi dua
bagian secara acak, sebagian data training (80%) dan sebagian data testing (20%).
31
Pembagian data menjadi data training dan data testing menggunakan teknik
sampling random sistematik (systematic random sampling). Cara penggunaan
teknik ini melakukan perandoman atau pengundian hanya dilakukan satu kali, yakni
ketika menentukan unsur pertama dari sampling yang akan diambil. Penentuan
unsur sampling selanjutnya ditempuh dengan cara memanfaatkan interval sample.
Interval sampel adalah angka yang menunjukkan jarak antara nomor-nomor urut
yang terdapat dalam kerangka sampling yang akan dijadikan patokan dalam
memilih unsur-unsur sampling kedua dan seterusnya hingga unsur ke-n. Interval
sampel dilambangkan dengan huruf k.
Interval sampel atau biasanya disebut juga sampling rasio diperoleh dengan
cara membagi ukuran populasi dengan ukuran sampel yang dikehendaki (N/n).
Hasil perhitungan untuk mengambil data testing adalah sebagai berikut:
Jumlah populasi (N) = 84
Jumlah data testing = 20% x 83 = 17
Jumlah sampel (n) = 17
Interval Sampling (k) = N/n = 83/ 17 = 5
Unsur pertama yang diambil untuk data testing (s) = 1
Unsur kedua = s + k
Unsur ketiga = s + 2k
Unsur keempat = s + 3k, dan seterusnya hingga unsur ke-n.
32
Dari hasil diatas diperoleh data testing sebanyak 17 data, maka sisanya akan
dijadikan data training sebanyak 67 data karyawan.
Gambar 4.1 Data Training
Gambar 4.2 Data Testing
4.1.3 Proces Validasi Menggunakan RapidMiner
Berikut ini merupakan tahapan-tahapan dalam melakukan penerapan
algoritma C4.5 memakai tool RapidMiner Studio 9.0.
A. Proses Import Data
1. Langkah pertama yaitu membuka aplikasi RapidMiner Studio 9.0, dan akan
muncul loading tampilan awal seperti berikut :
33
Gambar 4.3 Tampilan Awal RapidMiner Studio 9.0
2. Setelah loading selesai lalu akan muncul tampilan menu utama, kemudian
pilih Blank pada start a new project untuk melakukan proses pengolahan
data.
Gambar 4.4 Menu Utama New Project
3. Selanjutnya pada menu operators cari read excel pada kolom pencariannya,
setelah itu geser/tarik read excel kedalam lembar Process.
34
Gambar 4.5 Proses Read Excel
4. Kemudian klik Import Configuration Wizard untuk mengambil dataset
dengan format data exel yang terdapat pada computer.
Gambar 4.6 Proses Import Data Wizard
5. Mengelola Data Training, setelah muncul dataset yang dituju kemudian
pilih pada Sheet berapa data yang diinginkan, lalu next.
35
Gambar 4.7 Import Data Training
6. Pilih hasil keputusan sebagai binominal dan label, sedangkan yang lainnya
sebagai Polinominal dan Atribut. Setalah itu klik Finish.
Gambar 4.8 Data Hasil Keputusan Sebagai Label
36
B. Proses Validation.
1. Klik sembarang di lembar Process, lalu klik menu Edit pilih Insert Building
Block kemudian pilih Nominal Cross Validation lalu klik OK.
Gambar 4.9 Process Validation menggunakan Data Training
2. Setelah muncul Validation pada Process, geser Validation ke kanan lalu
sambungkan kabel Input ke Read Exel satu kabel, Read Exel ke Validation
satu kabel dan Validation ke res empat kabel. Kemudian klik Run.
37
Gambar 4.10 Process Validation
4.2 Pembahasan
4.2.1 Hasil Validasi Menggunakan RapidMiner
Langkah ini akan membandingakan hasil validasi dari data training dan
data testing dengan melihat hasil dari Confusion Matrix dan ROC / AUC (Area
Under Cover).
A. Confusion Matrix
1. Pengukuran Accuracy Dari Data Training
Perhitungan akurasi data training dari 67 data, 30 diklasifikasi prediksi
kompetensi dan ternyata kompetensi, 9 data diprediksi kompetensi tetapi ternyata
tidak kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan
sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai acuracy sebesar
75.00% +/- 12.92% .
38
Gambar 4.11 Pengukuran Accuracy Data Training
2. Pengukuran Precision Dari Data Training
Perhitungan akurasi berdasarkan data precision, 30 diklasifikasi prediksi
kompetensi dan ternyata kompetensi, 9 data diprediksi kompetensi tetapi ternyata
tidak kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan
sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai precision
sebesar 79.33% dan positive class : Tidak.
Gambar 4.12 Pengukuran Precision Data Training
3. Pengukuran recall Dari Data Training
Hasil pengukuran data recall dengan 30 diklasifikasi prediksi kompetensi
dan ternyata kompetensi, 9 data diprediksi kompetensi tetapi ternyata tidak
39
kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan
sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai recall sebesar
71.67% +/- 21.15 %.
Gambar 4.13 Pengukuran recall Data Training
4. Pengukuran Accuracy Dari Data Testing
Perhitungan akurasi data testing yang berjumlah 17 data, 10 data
diklasifikasi prediksi kompetensi dan ternyata kompetensi, 3 data diprediksi
kompetensi tetapi ternyata tidak kompetensi. 1 data diprediksi tidak kompetensi
ternyata kompetensi dan sebanyak 3 data sesuai diprediksi tidak kompetensi,
dengan nilai acuracy sebesar 70.00 % +/- 40.00%.
Gambar 4.14 Pengukuran Accuracy Data Testing
40
5. Pengukuran Precision Dari Data Testing
Perhitungan akurasi berdasarkan data precision, 10 data diklasifikasi
prediksi kompetensi dan ternyata kompetensi, 3 data diprediksi kompetensi tetapi
ternyata tidak kompetensi. 1 data diprediksi tidak kompetensi ternyata
kompetensi dan sebanyak 3 data sesuai diprediksi tidak kompetensi, dengan nilai
precision sebesar 75.00 %.
Gambar 4.15 Pengukuran Precision Dari Data Testing
6. Pengukuran recall Dari Data Testing
Hasil pengukuran data recall dengan 10 data diklasifikasi prediksi
kompetensi dan ternyata kompetensi, 3 data diprediksi kompetensi tetapi ternyata
tidak kompetensi, 1 data diprediksi tidak kompetensi ternyata kompetensi dan
sebanyak 3 data sesuai diprediksi tidak kompetensi, dengan nilai recall sebesar
50.00%.
41
Gambar 4.16 Pengukuran recall Dari Data Testing
B. ROC / AUC (Area Under Cover)
Hasil perhitungan divisualisaikan dengan kurva ROC (Receiver Operating
Characteristic) atau AUC (Area Under Curve) optimistic. ROC memiliki tingkat
diagnose yaitu:
a. Akurasi bernilai 0.90 – 1.00 = excellent classification
b. Akurasi bernilai 0.80 – 0.90 = good classification
c. Akurasi bernilai 0.70 – 0.80 = fair classification
d. Akurasi bernilai 0.60 – 0.70 = poor classification
e. Akurasi bernilai 0.50 – 0.60 = failure
1. Kurva ROC/AUC Dari Data Training
Nilai dari kurva ROC (Receiver Operating Characteristic) dari data training
diketahui dari AUC (Area Under Curve) optimistic dengan hasil sebesar 0.900 +/-
0.128 (mikro average: 0.00) serta dengan positive class “TIDAK”, itu berarti hasil
klasifikasi penelitian ini masuk kedalam tingkat diagnose excellent classification.
42
Gambar 4.17 Hasil Kurva ROC/AUC Data Training
Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi
prediksi penilaian karyawan dengan menggunakan data training dibawah ini .
Gambar 4.18 Hasil Pohon Keputusan Data Training
Berdasarkan hasil decision tree dari data training, maka diperoleh rule
untuk klasifikasi prediksi uji kualitas sebagai berikut:
43
Tabel 4.2 Rule Decision Tree Data Trainig
Rule Keterangan Rule
R1 Jika Kt2 ≤ 2.500, Kp3 > 2.500 maka kompetensi
R2
Jika Kt2 ≤ 2.500, Kp3 ≤ 2.500 maka kompetensi, Kt ≤ 3.500 maka
tidak kompetensi
R3
Jika Kt2 ≤ 2.500, Kp3 ≤ 2.500 maka kompetensi, Kt > 3.500 maka
kompetensi
R4 Jika Kt2 > 2.500, Sk1 > 2.500, Kt1 > 2.500 maka kompetensi.
R5 Jika Kt2 > 2.500, Sk1 > 2.500, Kt1 ≤ 2.500 maka tidak kompetensi.
R6 Jika Kt2 > 2.500, Sk1 ≤ 2.500, Kt4 ≤ 2.500 maka tidak kompetensi.
R7 Jika Kt2 > 2.500, Sk1 ≤ 2.500, Kt4 > 2.500 maka kompetensi.
2. Kurva ROC/AUC Dari Data Testing
Nilai dari kurva ROC (Receiver Operating Characteristic) dari data testing
diketahui dari AUC (Area Under Curve) optimistic dengan hasil sebesar 0.750
dengan +/-0.250 (mikro average: 0.750) serta dengan positive class “TIDAK”, itu
berarti hasil klasifikasi penelitian ini masuk kedalam tingkat diagnose fair
classification.
44
Gambar 4.19 Hasil Kurva ROC/AUC Data Testing
Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi
prediksi penilaian karyawan dengan menggunakan data testing dibawah ini .
Gambar 4.20 Hasil Pohon Keputusan Data Testing
Berdasarkan decision tree maka diperoleh rule untuk klasifikasi prediksi uji
kualitas sebagai berikut:
45
Tabel 4.3 Rule Decision Tree Data Testing
Rule Keterangan Rule
R1 Jika Kp1 > 2.500, Kt1 > 2.500 maka Kompetensi.
R2 Jika Kp1 > 2.500, Kt1 ≤ 2.500 maka Tidak Kompetensi.
R3 Jika Kp1 ≤ 2.500 maka Tidak Kompetensi.
4.2.2 Perhitungan Jumlah Kasus Data Keseluruhan, Data Training dan Data
Testing
Data keseluruhan yang digunakan pada penelitian ini sejumlah 84 kasus,
kemudian dilakukan pembagian data menjadi data training sebanyak 67 kasus dan
data testing sebanyak 17 kasus. Berikut hasil perhitungan kasus pada data
keseluruhan.
Tabel 4.4 Jumlah Nilai Atribut Keseluruhan
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi(S2)
TOTAL 84 35 49
1 Kp1 1 0
Keterampilan 2 29 23 6
3 52 12 40
4 3 0 3
5 0 0 0
84 35 49
2 Kp2 1 6 5 1
Pengetahuan 2 45 22 23
3 33 8 25
4 0 0 0
5 0 0 0
84 35 49
46
3 Kp3 1 5 5 0
Pemahaman 2 45 26 19
3 34 4 30
4 0 0 0
5 0 0 0
84 35 49
4 Sk1 1 0 0 0
Kerjasama 2 32 25 7
3 43 10 33
4 9 0 9
5 0 0 0
84 35 49
5 Sk2 1 0 0 0
Tanggung Jawab 2 25 21 4
3 53 14 39
4 6 0 6
5 0 0 0
84 35 49
6 Sk3 1 0 0 0
Kerajinan 2 30 23 7
3 49 12 37
4 5 0 5
5 0 0 0
84 35 49
7 Sk4 1 16 15 1
Kejujuran 2 39 15 24
3 29 5 24
4 0 0 0
5 0 0 0
84 35 49
8 Sk5 1 17 15 2
Disiplin 2 6 2 4
3 59 18 41
4 2 0 2
5 0 0 0
84 35 49
9 Kt1 1 0 0 0
Kebersihan 2 32 26 6
3 47 9 38
47
4 5 0 5
5 0 0 0
84 35 49
10 Kt2 1 0 0 0
Kecermatan 2 30 25 5
3 52 10 42
4 2 0 2
5 0 0 0
84 35 49
11 Kt3 1 18 15 3
Kecekatan 2 19 9 10
3 38 9 29
4 9 2 7
5 0 0 0
84 35 49
12 Kt4 1 0 0 0
Sumbang Saran 2 34 22 12
3 46 13 33
4 4 0 4
5 0 0 0
84 35 49
13 Kt5 1 0 0 0
Tugas Khusus 2 82 35 47
3 2 0 2
4 0 0 0
5 0 0 0
84 35 49
14 Kt6 1 17 15 2
Citra Perusahaan 2 37 11 26
3 27 9 18
4 3 0 3
5 0 0 0
84 35 49
15 Kt7 1 17 15 2
Kesadaran
Pembiayaan 2 29 9 20
3 37 11 26
4 1 0 1
5 0 0 0
84 35 49
48
Tabel 4.4 memperlihatkan semua kasus pada data keseluruhan berjumlah 84
dengan keputusan TIDAK sebanyak 35 dan keputusan TERIMA sebanyak 49.
Data keseluruhan yang dibagi menjadi data training dan data testing
dihitung kembali jumlah kasusnya, Tabel 4.5 di bawah ini adalah jumlah kasus pada
data training dan data ini akan dijadikan sebagai data sekunder dalam pembuatan
pohon keputusan penilianan karyawan.
Tabel 4.5 Jumlah Kasus Data Training
NO ATRIBUTE VALUE JUMLAH
KASUS (S) TIDAK
(S1) Kompetensi(S2)
TOTAL 67 29 38
1 Kp1 1 0 0 0
Keterampilan 2 25 19 6
3 40 10 30
4 2 0 2
5 0 0 0
67 29 38
2 Kp2 1 6 5 1
Pengetahuan 2 34 18 16
3 27 6 21
4 0 0 0
5 0 0 0
67 29 38
3 Kp3 1 5 5 0
Pemahaman 2 35 21 14
3 27 3 24
4 0 0 0
5 0 0 0
67 29 38
4 Sk1 1 0 0 0
Kerjasama 2 26 21 5
49
3 36 8 28
4 5 0 5
5 0 0 0
67 29 38
5 Sk2 1 0 0 0
Tanggung Jawab 2 21 18 3
3 43 11 32
4 3 0 3
5 0 0 0
67 29 38
6 Sk3 1 0 0 0
Kerajinan 2 26 20 6
3 37 9 28
4 4 0 4
5 0 0 0
67 29 38
7 Sk4 1 14 13 1
Kejujuran 2 31 12 19
3 22 4 18
4 0 0 0
5 0 0 0
67 29 38
8 Sk5 1 15 13 2
Disiplin 2 4 1 3
3 47 15 32
4 1 0 1
5 0 0 0
67 29 38
9 Kt1 1 0 0 0
Kebersihan 2 26 21 5
3 37 8 29
4 4 0 4
5 0 0 0
67 29 38
10 Kt2 1 0 0 0
Kecermatan 2 25 21 4
3 41 8 33
4 1 0 1
5 0 0 0
50
67 29 38
11 Kt3 1 16 13 3
Kecekatan 2 13 7 6
3 31 7 24
4 7 2 5
5 0 0 0
67 29 38
12 Kt4 1 0 0 0
Sumbang Saran 2 26 19 7
3 38 10 28
4 3 0 3
5 0 0 0
67 29 38
13 Kt5 1 0 0 0
Tugas Khusus 2 66 29 37
3 1 0 1
4 0 0 0
5 0 0 0
67 29 38
14 Kt6 1 15 13 2
Citra Perusahaan 2 31 9 22
3 19 7 12
4 2 0 2
5 0 0 0
67 29 38
15 Kt7 1 15 13 2
Kesadaran
Pembiayaan 2 24 8 16
3 27 8 19
4 1 0 1
5 0 0 0
67 29 38
Tabel 4.6 di bawah ini adalah jumlah kasus pada data testing, yaitu :
51
Tabel 4. 6 Jumlah Kasus Data Testing
NO ATRIBUTE VALUE JUMLAH
KASUS (S) TIDAK
(S1) Kompetensi(S2)
TOTAL 17 6 11
1 Kp1 1 0 0 0
Keterampilan 2 4 4 0
3 12 2 10
4 1 0 1
5 0 0 0
17 6 11
2 Kp2 1 0 0 0
Pengetahuan 2 11 4 7
3 6 2 4
4 0 0 0
5 0 0 0
17 6 11
3 Kp3 1 0 0 0
Pemahaman 2 10 5 5
3 7 1 6
4 0 0 0
5 0 0 0
17 6 11
4 Sk1 1 0 0 0
Kerjasama 2 6 4 2
3 7 2 5
4 4 0 4
5 0 0 0
17 6 11
5 Sk2 1 0 0 0
Tanggung Jawab 2 4 3 1
3 10 3 7
4 3 0 3
5 0 0 0
17 6 11
6 Sk3 1 0 0 0
Kerajinan 2 4 3 1
3 12 3 9
52
4 1 0 1
5 0 0 0
17 6 11
7 Sk4 1 2 2 0
Kejujuran 2 8 3 5
3 7 1 6
4 0 0 0
5 0 0 0
17 6 11
8 Sk5 1 2 2 0
Disiplin 2 2 1 1
3 12 3 9
4 1 0 1
5 0 0 0
17 6 11
9 Kt1 1 0 0 0
Kebersihan 2 6 5 1
3 10 1 9
4 1 0 1
5 0 0 0
17 6 11
10 Kt2 1 0 0 0
Kecermatan 2 5 4 1
3 11 2 9
4 1 0 1
5 0 0 0
17 6 11
11 Kt3 1 2 2 0
Kecekatan 2 6 2 4
3 7 2 5
4 2 0 2
5 0 0 0
17 6 11
12 Kt4 1 0 0 0
Sumbang Saran 2 8 3 5
3 8 3 5
4 1 0 1
5 0 0 0
17 6 11
53
13 Kt5 1 0 0 0
Tugas Khusus 2 16 6 10
3 1 0 1
4 0
5 0 0 0
17 6 11
14 Kt6 1 2 2
Citra Perusahaan 2 6 2 4
3 8 2 6
4 1 0 1
5 0 0 0
17 6 11
15 Kt7 1 2 2
Kesadaran
Pembiayaan 2 5 1 4
3 10 3 7
4 0 0 0
5 0 0 0
17 6 11
Berdasarkan hasil pengelompokkan dan pengolahan data di atas, dapat
dijelaskan sebagai berikut:
Total data keseluruhan sejumlah 84 kasus yang kemudian digunakan untuk
data training sebanyak 67 kasus dan untuk data testing sebanyak 17 kasus, pada
data keseluruhan jumlah data keahlian kinerja karyawan dengan keputusan TIDAK
sebanyak 35 kasus dan keputusan KOMPETENSI sebanyak 49 kasus.
Pada data training keputusan TIDAK berjumlah 29 kasus dan keputusan
KOMPETENSI berjumlah 38 kasus, sedangkan pada data testing keputusan
TIDAK berjumlah 6 kasus dan keputusan KOMPETEMSI berjumlah 11 kasus.
Keputusan yang telah dihasilkan dapat disimpulkan bahwa pada penelitian ini lebih
banyak keputusan KOMPETENSI daripada keputusan TIDAK.
54
4.2.3 Pemodelan Menggunakan Algoritma C4.5
Dalam penelitian klasifikasi data keahlian karayawan dengan menggunakan
algoritma C4.5, pohon keputusan dibuat berdasarkan hasil perhitungan entropy dan
gain, setelah pohon keputusan terbentuk, langkah selanjutnya mencari rule
berdasarkan cabang pohon keputusan. Berikut akan dibahas langkah-langkah dalam
klasifikasi data keahlian karyawan jadi menggunakan algoritma C4.5 secara manual
dan analisa memakai tools RapidMiner.
Berdasarkan jumlah kasus pada data training untuk keputusan TIDAK
berjumlah 29 kasus dan keputusan KOMPETENSI berjumlah 38 kasus, dan
jumlah TOTAL kasus adalah 67. Setelah diketahui semua kasus yang perlu
dihitung, langkah selanjutnya menghitung Entropy dan Gain dari semua nilai kasus
yang dibagi berdasarkan atribut-atribut yang ditentukan.
A. Node 1 (Root) Atribut Total
Proses perhitungan klasifikasi keahlian karyawan menggunakan Algoritma
C4.5 adalah sebagai berikut :
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah kasus untuk
keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan perhitungan
gain untuk setiap atribut.
Tabel 4.7 Perhitungan Node 1 (Root)
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO GAIN RATIO
TOTAL 67 29 38 0.986944498
1 Kp1 1 0 0 0 0 0.205942529 0.182867279
55
Keterampilan 2 25 19 6 0.795040279 0.530683955
3 40 10 30 0.811278124 0.444275281
4 2 0 2 0 0.151226543
5 0 0 0 0
67 29 38 1.126185779
2 Kp2 1 6 5 1 0.650022422
0.114575203
0.311742689
0.085711525
Pengetahuan 2 34 18 16 0.997502546 0.496616356
3 27 6 21 0.764204507 0.52839471
4 0 0 0 0
5 0 0 0 0
67 29 38 1.336753755
3 Kp3 1 5 5 0 0
0.276925904
0.279415007
0.21348202
Pemahaman 2 35 21 14 0.970950594 0.489376359
3 27 3 24 0.503258335 0.52839471
4 0 0 0 0 0
5 0 0 0 0 0
67 29 38 1.297186077
4 Sk1 1 0 0
0.302250639
0
0.298821784
Kerjasama 2 26 21 5 0.706274089 0.529953527
3 36 8 28 0.764204507 0.481521057
4 5 5 0 0
5 0 0 0
67 29 38 1.011474583
5 Sk2 1 0 0
0.274992782
0
0.294031742
Tanggung
Jawab 2 21 18 3 0.591672779 0.524615032
3 43 11 32 0.820363643 0.410633593
4 3 0 3 0 0
5 0 0 0
67 29 38 0.935248625
6 Sk3 1 0 0
0.242502596
0
0.241772185
Kerajinan 2 26 20 6 0.779349837 0.529953527
3 37 9 28 0.800392208 0.473067545
4 4 0 4 0 0
5 0 0 0
67 29 38 1.003021072
7 Sk4 1 14 13 1 0
0.316813775
0.471974325
0.209257311 Kejujuran 2 31 12 19 0.962900415 0.5144579
3 22 4 18 0.684038436 0.527559203
4 0 0 0
56
5 0 0 0
67 29 38 1.513991427
8 Sk5 1 15 13 2 0
0.304744057
0.48340267
0.280878399
Disiplin 2 4 1 3 0.811278124 0.242751593
3 47 15 32 0.903453555 0.35881367
4 1 0 1 0 0
5 0 0 0
67 29 38 1.084967934
9 Kt1 1 0 0
0.296922827
0
0.296028504
Kebersihan 2 26 21 5 0.706274089 0.529953527
3 37 8 29 0.753197991 0.473067545
4 4 0 4 0 0
5 0 0 0
67 29 38 1.003021072
10 Kt2 1 0 0 0 0
0.314521138
0
0.326176598
Kecermatan 2 25 21 4 0.634309555 0.530683955
3 41 8 33 0.712064055 0.433582457
4 1 0 1 0 0
5 0 0 0
67 29 38 0.964266412
11 Kt3 1 16 13 3 0
0.437183931
0.493394434
0.29804088
Kecekatan 2 13 7 6 0.995727452 0.459006614
3 31 7 24 0.770629069 0.5144579
4 7 2 5 0 0
5 0 0 0
67 29 38 1.466858947
12 Kt4 1 0 0
0.189252674
0
0.190397818
Sumbang
Saran 2 26 19 7 0.840358672 0.529953527
3 38 10 28 0.831474388 0.464031996
4 3 0 3 0 0
5 0 0 0
67 29 38 0.993985522
13 Kt5 1 0 0
0.012335715
0
0.110228979
Tugas
Khusus 2 66 29 37 0.989375583 0.021371264
3 1 0 1 0 0.090538645
4 0 0 0
5 0 0 0
67 29 38 0.111909909
57
14 Kt6 1 15 13 2 0
0.315558628
0.48340267
0.208501651
Citra
Perusahaan 2 31 9 22 0.869137581 0.5144579
3 19 7 12 0.949452015 0.515598088
4 2 0 2 0 0
5 0 0 0
67 29 38 1.513458658
15 Kt7 1 15 13 2 0
0.304699128
0.48340267
0.197555084
Kesadaran
Pembiayaan 2 24 8 16 0.918295834 0.530552844
3 27 8 19 0.876716289 0.52839471
4 1 0 1 0 0
5 0 0 0
67 29 38
1.542350225
Dari Tabel 4.7 memperlihatkan bahwa pada baris total diketahui jumlah kasus (S)
adalah 67, jumlah keputusan tidak (S1) adalah 29, dan jumlah keputusan terima (S2)
adalah 38. Perhitungan entropy total pada Tabel 4.7 dapat dihitung dengan
menggunakan persamaan sebagai berikut :
Entropy (Total) = (29
67*log2(
29
67))+(
38
67* log2 (
38
67))
Entropy (Total) = 0.986944498
Sementara itu, nilai information gain pada baris daya listrik terpasang
dihitung dengan menggunakan persamaan sebagai berikut :
Gain (Total, Keterampilan)
= Entropy(Total) - ∑|𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛|
|𝑇𝑜𝑡𝑎𝑙|
𝑛
𝑖=1 *Entropy (Keterampilan)
Gain (Keterampilan) = 0.986944498– ((25
67*0.795040279) + (
40
67*0.811278124) +
(2
67*0))
58
Gain (Keteramoilan) = 0.205942529
Kemudian nilai split info pada baris daya listrik terpasang dihitung dengan
persamaan berkut :
𝑆𝑝𝑙𝑖𝑡 𝑖𝑛𝑓𝑜(Keterampilan) = (−(25
67*(log2(
25
67)) +(-(
40
67*(log2(
40
67)) +
(-(2
67*(log2 (
2
67)) = 1.126185779
Setelah split info diketahui langkah terakhir adalah menghitung gain ratio
dengan persamaan sebagai berikut :
𝐺𝑎𝑖𝑛𝑅𝑎𝑡𝑖𝑜(𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛) =𝐺𝑎𝑖𝑛(𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛)
𝑆𝑝𝑙𝑖𝑡𝑖𝑛𝑓𝑜(Keterampilan)=
0.205942529
1.126185779 = 0.182867279
Untuk perhitungan pada atribut-atribut berikutnya sama seperti perhitungan pada
atribut Keterampilan (Kp1). Sehingga diperoleh hasil perhitungan yang ditunjukkan
pada Tabel 4.7. Dari tabel tersebut dapat diketahui bahwa atribut dengan gain ratio
tertinggi adalah Kecermatan (Kt2), yaitu sebesar 0.326176598 dengan demikian
Kecermatan (Kt2) bisa menjadi node akar. Ada tiga nilai atribut dari fasilitas buang
air besar yaitu nilai 2, nilai 3, nilai 4. Dari ketiga nilai tersebut masih memerlukan
perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat digambarkan pohon
keputusan seperti Gambar 4.21.
59
Gambar 4.21 Pohon Keputusan Note 1
B. Node 1.1 Kt2 (Kecermatan) nilai > 2,50
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah
kasus untuk keputusan kompetensi, dan entropy dari semua kasus. Setelah itu,
lakukan perhitungan gain untuk setiap atribut.
Tabel 4.8 Perhitungan Node 1.1
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO
GAIN RATIO
TOTAL 42 8 34 0.70247
1 Kp1 1 0 0 0 0
0.08061
0.079914
Keterampilan 2 9 4 5 0.99108 0.476227
3 31 4 27 0.55478 0.323375
4 2 0 2 0 0.209158
5 0 0 0 0
42 8 34 1.00876
2 Kp2 1 0 0 0 0
0.01514
0
0.015169
Pengetahuan 2 20 5 15 0.81128 0.509709
3 22 3 19 0.57464 0.488654
4 0 0 0 0 0
5 0 0 0 0 0
42 8 34 0.998364
3 Kp3 1 0 0 0 0
0.08395
0
0.086217
Pemahaman 2 17 6 11 0.93667 0.528155
3 25 2 23 0.40218 0.445513
4 0 0 0 0 0
5 0 0 0 0 0
42 8 34 0.973668
4 Sk1 1 0 0 0 0
0.12878
0
0.119544
Kerjasama 2 7 4 3 0.98523 0.430827
3 31 4 27 0.55478 0.323375
4 4 0 4 0 0.323078
5 0 0 0 0 0
42 8 34 1.07728
60
5 Sk2 1 0 0 0 0
0.03069
0
0.057803
Tanggung
Jawab 2 1 0 1 0 0.128389
3 38 8 30 0.74249 0.130638
4 3 0 3 0 0.271954
5 0 0 0 0 0
42 8 34 0.530981
6 Sk3 1 0 0 0 0
0.02271
0
0.025678
Kerajinan 2 5 1 4 0.72193 0.365523
3 34 7 27 0.73354 0.246787
4 3 0 3 0 0.271954
5 0 0 0 0 0
42 8 34 0.884264
7 Sk4 1 0 0 0 0
0.02939
0
0.029588
Kejujuran 2 23 6 17 0.82806 0.475747
3 19 2 17 0.48546 0.5177
4 0 0 0 0 0
5 0 0 0 0 0
42 8 34 0.993447
8 Sk5 1 0 0 0 0
0.02269
0
0.061122
Disiplin 2 3 0 3 0 0.271954
3 39 8 31 0.73207 0.099278
4 0 0 0 0 0
5 0 0 0 0 0
42 8 34 0.371232
9 Kt1 1 0 0 0 0
0.08607
0
0.10571
Kebersihan 2 3 2 1 0.9183 0.271954
3 35 6 29 0.66096 0.219195
4 4 0 4 0 0.323078
5 0 0 0 0 0
42 8 34 0.814227
10 Kt3 1 1 0 1 0 0.06595 0.128389 0.046601
Kecekatan 2 10 4 6 0.97095 0.49295
3 26 3 23 0.51595 0.428305
4 5 1 4 0.72193 0.365523
5 0 0 0 0 0
42 8 34 1.415166
11 Kt4 1 0 0 0.08544 0 0.078037
Sumbang
Saran 2 9 4 5 0.99108 0.476227
3 30 4 26 0.56651 0.346733
4 3 0 3 0 0.271954
5 0 0 0 0 0
42 8 34 1.094914
12 Kt5 1 0 0 0 0 0.00736 0 0.045319
Tugas Khusus 2 41 8 33 0.71206 0.033938
3 1 0 1 0 0.128389
4 0 0 0 0 0
5 0 0 0 0 0
42 8 34 0.162326
13 Kt6 1 0 0 0 0 0.0261 0 0.022023
Citra
Perusahaan 2 25 4 21 0.63431 0.445513
3 15 4 11 0.83664 0.53051
4 2 0 2 0 0.209158
5 0 0 0 0 0
42 8 34 1.18518
14 Kt7 1 0 0 0 0
0.01023
0
0.009067
Kesadaran
Pembiayaan 2 18 3 15 0.65002 0.523882
3 23 5 18 0.75538 0.475747
4 1 0 1 0 0.128389
5 0 0 0 0 0
42 8 34 1.128018
61
Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi
adalah Sk1 (Kerjasama), yaitu sebesar 0.119544 dengan nilai tersebut bisa
dipastikan menjadi node cabang. Ada 2 nilai atribut Sk1 yaitu > 2,5 dan ≤2,5. Dari
kedua nilai tersebut masih memerlukan perhitungan lebih lanjut. Dan hasil
perhitungan tersebut dapat digambarkan pohon keputusan seperti Gambar 4.22.
Gambar 4.22 Pohon Keputusan Note 1.1
C. Node 1.2 Kt2 (Kecermatan) nilai ≤ 2,50
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah
kasus untuk keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan
perhitungan gain untuk setiap atribut.
Tabel 4.9 Perhitungan Node 1.2
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO
GAIN RATIO
TOTAL 25 21 4 0.63431
1 Kp1 1 0 0 0 0 0.08786 0
0.093199 Keterampilan 2 16 15 1 0.33729 0.412068
3 9 6 3 0.9183 0.530615
62
4 0 0 0 0 0
5 0 0 0 0
25 21 4 0.942683
2 Kp2 1 6 5 1 0.65002 0.07622 0.494134
0.053417
Pengetahuan 2 14 13 1 0.37123 0.468441
3 5 3 2 0.97095 0.464386
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 1.426961
3 Kp3 1 5 5 0 0 0.16629 0.464386
0.151572
Pemahaman 2 18 15 3 0.65002 0.34123
3 2 1 1 0 0.291508
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 1.097125
4 Sk1 1 0 0 0 0 0.12097 0
0.127201
Kerjasama 2 19 17 2 0.48546 0.300906
3 5 4 1 0.72193 0.464386
4 1 0 1 0 0.185754
5 0 0 0 0 0
25 21 4 0.951046
5 Sk2 1 0 0 0 0 0.06492 0
0.08993
Tanggung
Jawab 2 20 18 2 0.469 0.257542
3 5 3 2 0.97095 0.464386
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 0.721928
6 Sk3 1 0 0 0 0 0.09319 0
0.146912
Kerajinan 2 21 19 2 0.45372 0.211293
3 4 2 2 1 0.423017
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 0.63431
7 Sk4 1 14 13 1 0.37123 0.05661 0.468441
0.041581
Kejujuran 2 8 6 2 0.81128 0.526034
3 3 2 1 0.9183 0.367067
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 1.361542
8 Sk5 1 15 13 2 0.56651 0.12046 0.442179
0.089917
Disiplin 2 1 1 0 0 0.185754
3 8 7 1 0.54356 0.526034
4 1 0 1 0 0.185754
5 0 0 0 0 0
25 21 4 1.339722
9 Kt1 1 0 0 0 0 0.02106 0
0.052358
Kebersihan 2 23 19 4 0.66658 0.110671
3 2 2 0 0 0.291508
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 0.402179
10 Kt3 1 15 13 2 0.56651 0.07002 0.442179 0.044736
Kecekatan 2 3 3 0 0 0.367067
3 5 4 1 0.72193 0.464386
4 2 1 1 1 0.291508
5 0 0 0 0 0
25 21 4 1.565141
11 Kt4 1 0 0 0 0 0.01936 0 0.021407
Sumbang
Saran 2 17 15 2 0.52256 0.378347
3 8 6 2 0.81128 0.526034
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 0.904381
12 Kt5 1 0 0 0 0 0 0 0
Tugas
Khusus 2 25 21 4 0.63431 0
3 0 0 0 0 0
4 0 0 0 0 0
5 0 0 0 0 0
63
25 21 4 0
13 Kt6 1 15 13 2 0.56651 0.00859 0.442179 0.006322
Citra
Perusahaan 2 6 5 1 0.65002 0.494134
3 4 3 1 0.81128 0.423017
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 1.359331
14 Kt7 1 15 13 2 0.56651 0.00859 0.442179 0.006322
Kesadaran
Pembiayaan 2 6 5 1 0.65002 0.494134
3 4 3 1 0.81128 0.423017
4 0 0 0 0 0
5 0 0 0 0 0
25 21 4 1.359331
Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi
adalah Kp3 (Pemahaman), yaitu sebesar 0.151572 dengan nilai tersebut bisa
dipastikan menjadi node cabang. Ada 2 nilai atribut Kp3 yaitu > 2,5 dan ≤2,5. Dari
kedua nilai tersebut masih memerlukan perhitungan lebih lanjut. Dan hasil
perhitungan tersebut dapat digambarkan pohon keputusan seperti Gambar 4.23.
Gambar 4.23 Pohon Keputusan Note 1.2
64
D. Node 1.1.1 Sk1 (Kerjasama) nilai > 2,50
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah
kasus untuk keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan
perhitungan gain untuk setiap atribut.
Tabel 4.10 Perhitungan Node 1.1.1
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO
GAIN RATIO
TOTAL 41 8 33 0.71206
1 Kp1 1 0 0 0 0
0.12934
0
0.118361
Keterampilan 2 7 4 3 0.98523 0.4354
3 30 4 26 0.56651 0.329752
4 4 0 4 0 0.327566
5 0 0 0 0 0
41 8 33 1.092718
2 Kp2 1 0 0 0 0
0.00869
0
0.009009
Pengetahuan 2 16 4 12 0.81128 0.529776
3 25 4 21 0.63431 0.43518
4 0 0 0 0 0
5 0 0 0 0 0
41 8 33 0.964957
3 Sk2 1 0 0 0 0
0.047
0
0.063951
Tanggung
Jawab 2 2 1 1 1 0.212564
3 35 7 28 0.72193 0.194864
4 4 0 4 0 0.327566
5 0 0 0 0 0
41 8 33 0.734993
4 Sk3 1 0 0 0 0
0.10755
0
0.094266
Kerajinan 2 8 4 4 1 0.46001
3 29 4 25 0.57879 0.353355
4 4 0 4 0 0.327566
5 0 0 0 0 0
41 8 33 1.140931
5 Sk4 1 0 0 0 0
0.0266
0
0.026892
Kejujuran 2 23 6 17 0.82806 0.467848
3 18 2 16 0.50326 0.521397
4 0 0 0 0 0
5 0 0 0 0 0
41 8 33 0.989245
6 Sk5 1 0 0 0 0
0.0239
0
0.053738
Disiplin 2 2 0 2 0 0.212564
3 38 8 30 0.74249 0.101603
4 1 0 1 0 0.130672
5 0 0 0 0 0
41 8 33 0.444839
7 Kt1 1 0 0 0 0
0.12439
0
0.122379
Kebersihan 2 7 4 3 0.98523 0.4354
3 31 4 27 0.55478 0.304976
4 3 0 3 0 0.276043
5 0 0 0 0 0
41 8 33 1.016419
8 Kt3 1 1 0 1 0
0.01646
0
0.014747
Kecekatan 2 4 1 3 0.81128 0.327566
3 29 5 24 0.6632 0.353355
4 7 2 5 0.86312 0.4354
5 0 0 0 0 0
65
41 8 33 1.116321
9 Kt4 1 0 0 0 0
0.02542
0
0.02646
Sumbang
Saran 2 6 1 5 0.65002 0.405745
3 32 7 25 0.75788 0.279065
4 3 0 3 0 0.276043
5 0 0 0 0 0
41 8 33 0.960853
10 Kt5 1 0 0 0 0
0.00774
0
0.046812
Tugas
Khusus 2 40 8 32 0.72193 0.034755
3 1 0 1 0 0.130672
4 0 0 0 0 0
5 0 0 0 0 0
41 8 33 0.165427
11 Kt6 1 0 0 0 0
0.02145
0
0.018579
Citra
Perusahaan 2 26 6 20 0.77935 0.416705
3 13 2 11 0.61938 0.525426
4 2 0 2 0 0.212564
5 0 0 0 0 0
41 8 33 1.154695
12 Kt7 1 0 0 0 0
0.03752
0
0.033085
Kesadaran
Pembiayaan 2 22 6 16 0.84535 0.481918
3 18 2 16 0.50326 0.521397
4 1 0 1 0 0.130672
5 0 0 0 0 0
41 8 33 1.133987
Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi
adalah Kt1 (Kebersiahan), yaitu sebesar 0.12238 dengan nilai tersebut bisa
dipastikan menjadi node cabang. Ada 2 nilai atribut Kp3 yaitu > 2,5 dan ≤2,5. Dari
kedua nilai tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga
tidak memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat
digambarkan pohon keputusan seperti Gambar 4.24.
66
Gambar 4.24 Pohon Keputusan Note 1.1.1
E. Node 1.1 Sk1 (Kerjasama) nilai ≤ 2,50
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah
kasus untuk keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan
perhitungan gain untuk setiap atribut.
Tabel 4.11 Perhitungan Node 1.1.1.1
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO
GAIN RATIO
TOTAL 26 21 5 0.70627
1 Kp1 1 0 0 0 0
0.00663
0
0.00745
Keterampilan 2 18 15 3 0.65002 0.367279
3 8 6 2 0.81128 0.523212
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0.890492
2 Kp2 1 6 5 1 0.65002
0.0272
0.488187
0.023861
Pengetahuan 2 18 14 4 0.7642 0.367279
3 2 2 0 0 0.284649
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.140116
3 Sk2 1 0 0 0 0
0.08626
0
0.102647
Tanggung
Jawab 2 19 17 2 0.48546 0.330682
3 7 4 3 0.98523 0.509677
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0.840359
4 Sk3 1 0 0 0 0 0.06419
0
0.072087 Kerajinan 2 18 16 2 0.50326 0.367279
3 8 5 3 0.95443 0.523212
67
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0.890492
5 Sk4 1 14 13 1 0.37123
0.10291
0.480892
0.072494
Kejujuran 2 8 6 2 0.81128 0.523212
3 4 2 2 1 0.415452
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.419556
6 Sk5 1 15 13 2 0.56651
0.11491
0.457817
0.090319
Disiplin 2 2 1 1 0 0.284649
3 9 7 2 0.7642 0.529794
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.27226
7 Kt1 1 0 0 0 0
0.08626
0
0.102647
Kebersihan 2 19 17 2 0.48546 0.330682
3 7 4 3 0.98523 0.509677
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0.840359
8 Kt3 1 15 13 2 0.56651
0.06157
0.457817
0.048394
Kecekatan 2 9 6 3 0.9183 0.529794
3 2 2 0 0 0.284649
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.27226
9 Kt4 1 0 0 0 0
0.11474
0
0.147224
Sumbang
Saran 2 20 18 2 0.469 0.291163
3 6 3 3 1 0.488187
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0.77935
10 Kt5 1 26 21 5 0.70627
0
0
0
Tugas
Khusus 2 0 0 0 0 0
3 0 0 0 0 0
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 0
11 Kt6 1 15 13 2 0.56651
0.04272
0.457817
0.030437
Citra
Perusahaan 2 5 3 2 0.97095 0.457406
3 6 5 1 0.65002 0.488187
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.40341
12 Kt7 1 15 13 2 0.56651
0.06157
0.457817
0.048394
Kesadaran
Pembiayaan 2 2 2 0 0 0.284649
3 9 6 3 0.9183 0.529794
4 0 0 0 0 0
5 0 0 0 0 0
26 21 5 1.27226
Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi
adalah Kt4 (Sumbang Saran), yaitu sebesar 0.14722 dengan nilai tersebut bisa
dipastikan menjadi node cabang. Ada 2 nilai atribut Kt4 yaitu > 2,5 dan ≤2,5. Dari
kedua nilai tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga
68
tidak memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat
digambarkan pohon keputusan seperti Gambar 4.25.
Gambar 4.25 Pohon Keputusan Note 1.1.1.1
F. Node 1.2.1 Kp3 (Pemahaman) nilai ≤ 2,50
Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah
kasus untuk keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan
perhitungan gain untuk setiap atribut.
Tabel 4.12 Perhitungan Node 1.2.1
NO ATRIBUTE VALUE JUMLAH KASUS
(S)
TIDAK (S1)
Kompetensi (S2)
ENTROPY
GAIN TOTAL
SPLIT INFO
GAIN RATIO
TOTAL 40 26 14 0.93407
1 Kp1 1 0 0 0 0
0.07579
0
0.077044
Keterampilan 2 23 18 5 0.75538 0.459061
3 17 8 9 0.9975 0.524648
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 0.983708
2 Kp2 1 6 5 1 0.65002
0.02097
0.410545
0.018691
Pengetahuan 2 29 18 11 0.95755 0.336362
3 5 3 2 0.97095 0.375
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 1.121906
69
3 Sk2 1 0 0 0 0
0.12712
0
0.102973
Tanggung
Jawab 2 20 16 4 0.72193 0.5
3 18 10 8 0.99108 0.518401
4 2 0 2 0 0.216096
5 0 0 0 0 0
40 26 14 1.234498
4 Sk3 1 0 0 0 0
0.06337
0
0.066396
Kerajinan 2 25 19 6 0.79504 0.423795
3 15 7 8 0.99679 0.530639
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 0.954434
5 Sk4 1 15 13 2 0.56651
0.11746
0.530639 0.080933
Kejujuran 2 19 11 8 0.98194 0.51015
3 6 2 4 0.9183 0.410545
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 1.451334
6 Sk5 1 15 13 2 0.56651
0.12325
0.530639
0.09124
Disiplin 2 4 1 3 0.81128 0.332193
3 21 12 9 0.98523 0.488046
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 1.350877
7 Kt3 1 16 14 2 0.54356
0.20424
0.528771 0.113441
Kecekatan 2 13 8 5 0.96124 0.526984
3 8 4 4 1 0.464386
4 3 0 3 0 0.280272
5 0 0 0 0 0
40 26 14 1.800413
8 Kt5 1 0 0 0 0
0
0 0
Tugas
Khusus 2 40 26 14 0.93407 0
3 0 0 0 0 0
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 0
9 Kt6 1 15 13 2 0.56651
0.11526
0.530639
0.073012
Citra
Perusahaan 2 13 8 5 0.96124 0.526984
3 12 5 7 0.97987 0.52109
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 1.578712
10 Kt7 1 15 13 2 0.56651
0.16006
0.530639 0.101756
Kesadaran
Pembiayaan 2 11 8 3 0.84535 0.512187
3 14 5 9 0.94029 0.530101
4 0 0 0 0 0
5 0 0 0 0 0
40 26 14 1.572926
Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi
adalah Kt3 (Kecekatan), yaitu sebesar 0.11344 dengan nilai tersebut bisa dipastikan
menjadi node cabang. Ada 2 nilai atribut Kt3 yaitu > 3,5 dan ≤3,5. Dari kedua nilai
tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga tidak
70
memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat
digambarkan pohon keputusan seperti Gambar 4.25.
Gambar 4.26 Pohon Keputusan Note 1.2.1
4.2.4 Akurasi Prediksi
Pada tahap ini akan dilakukan proses klasifikasi dengan RapidMiner
menggunakan algoritma decision tree C4.5 pada memprediksi keahlian kinerja
karyawan untuk membandingkan data training dengan data testing yang sudah
diketahui rule-rulenya. Berikut adalahnya langkah-langkahnya :
Pada tampilan process masukan operator Read Excel masukan masing-
masing data training dan data testing, selanjutnya masukan operator Decision Tree,
Apply Model, dan Performance dan sambungkan kabel seperti gambar dibawah ini.
71
Gambar 4.27 Proses Akurasi Data Training Data Testing
Gambar 4.28 Hasil Akurasi Data accuracy
Hasil pengukuran data accuracy yang diperoleh dari data testing mencapai
82.35%. Dari data tersebut diketahui prediksi Kompetensi dengan true
Kompetensi mencapai 9 pipa dan true Tidak Kompetensi sebanyak 1 pipa, dengan
pencapaian class precision 90.00%. Sedangkan untuk prediksi Tidak Kompetensi
dengan true Kompetensi sebanyak 2 pipa dan untuk true Tidak Kompetensi
mencapai 5 pipa dengan pencapaian class precision 71.42%. Untuk class recall
72
dengan true Kompetensi mencapai 81.82% sedangkan untuk class recall dengan
true Tidak Kompetensi mencapai 83.33%.
Berikut hasil data data testing dan data training pada RapidMiner dapat
dilihat pada gambar di bawah ini.
Gambar 4.29 Hasil Prediksi RapidMiner
Hasil penerapan data testing terhadap data training sebagai berikut :
Jumlah data testing : 17
Jumlah data yang diprediksi benar : 15
Jumlah data yang diprediksi salah : 2
73
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan dari hasil penelitian yang dilakukan di PT Yanmar Indonesia,
maka penulis dapat menarik kesimpulan sebagai berikut:
1. Evaluasi hasil klasifikasi dalam prediksi kompetensi menggunakan data
training dengan Confusion Matrix tingkat akurasi sebesar 75.00% dan data
testing tingkat akurasi sebesar 70.00 %. Jika melihat dengan kurva ROC
menggunakan data training dengan akurasi Exellent Clasification sebesar
0.900 dan data testing dengan akurasi Fair Clasification sebesar 0.750.
5.2 Saran
Berdasarkan hasil penelitian agar penelitian ini terus berkembang, berikut
saran-saran yang dapat dijadikan pertimbangan untuk menyempurnakan penelitian
selanjutnya antara lain:
1. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan
metode lain maupun komparasi seperti Naïve Bayes, Neural Network dan
lain sebagainya agar memperoleh perbandingan dengan tingkat akurasi
yang paling tinggi dalam membuat kualifikasi prediksi kompetensi
karyawan.
2. Perlu adanya aplikasi yang dikhususkan untuk memprediksi keahlian
karyawan supaya mempermudah pengimputan, pencarian data karyawan
dan lebih akuratnya data penilaian yang didapat.
74
DAFTAR PUSTAKA
A.A. Anwar Prabu Mangkunegara, (2013), Manajemen Sumber Daya Manusia Perusahaan. Bandung: PT. Remaja Rosda Karya.
Asri Laksmi Riani,M (2011). Perspeksi Kompensasi. Surakarta : Yuma Pustaka
Eko, Widodo Suparno. (2015). Manajemen Pengembangan Sumber Daya Manusia. Yogyakarta: PUSTAKA PELAJAR
Fahmi. (2014) Pengantar Manajemen Keuangan. Bandung : Alfabeta
F Larose, D.T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. John Willey & Sons, Inc.
Hasibuan, S.P. Malayu, (2012). Manajemen Sumber Daya Manusia. Jakarta: PT.Bumi Aksara.
Munir, R. (2016). Matematika Diskrit. Bandung: Informatika Bandung.
Oktaviana, A. R. (2016). Penerapan Data Mining Klasifikasi Pola Nasabah Menggunakan Algoritma C4.5 Pada Bank Bri Batang. Batang.
Santosa, B. (2007). Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta.
Sedarmayanti. (2011). Manajemen Sumber Daya Manusia, Reformasi Birokrasi dan Manajemen Pegawai Negeri sipil (ceteakan kelima) Bandung :PT Refika Aditama
Sunge, A. S. (2018). Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 ( Studi Kasus : Pt Hankook Tire Indonesia ), 2018(Sentika), 23–24.
Suyanto. (2017). Data Mining Untuk Klasifikasi dan Klasifikasi Data. SpringerReference. Bandung: http//doi.org/10.107/SpringerReference_5414
75
Vulandari, R. T. (2017). Data Mining Teori dan Aplikasi RapidMiner. Yogyakarta: Penerbit Gava Media.
Wahyuni, S. (2017). Implementation of Data Mining to Analyze Drug Cases Using C4.5 Decision Tree. IOP Conf. Series: Journal of Physics: Conf. Series 970 (2018) 012030
Wicaksana, I Wayan Simri, D. (2013). Belajar Data Mining Dengan RapidMiner. (pp. 41–42). Jakarta. Retrieved from https://kupdf.net/download/buku-data-mining-libre_58fb8553dc0d60713b959e9c_pdf#
76
LAMPIRAN
Lampiran 1
SKOR DAN DISTRIBUSI RATING
Kelompok Kerja : Operator
No Nama NIK Bagian Kemampuan Sikap Kontribusi
Keterangan Kp1 Kp2 Kp3 Sk1 SK2 Sk3 Sk4 Sk5 Kt1 Kt2 Kt3 Kt4 Kt5 Kt6 Kt7
1 Agung Widodo 13041 Casting
Engineering
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3 Kompetensi
2 Nurlatif 13053 Casting
Engineering
3
3
3
4
4
4
3
3
4
3
3
4
3
4
4 Kompetensi
3 Fajar S. 14196 Casting
Engineering
2
2
2
3
3
2
2
3
2
2
3
3
2
3
3 Tidak
4 Fathdli Aziz 15257 Casting
Engineering
3
2
2
2
3
3
2
2
3
3
2
3
2
3
3 Kompetensi
5 M Kamil 13028 QA
4
3
3
4
4
4
3
3
4
4
3
4
2
3
3 Kompetensi
6 Firman M 13045 QA
3
3
3
4
4
4
3
3
4
4
3
4
2
3
3 Kompetensi
7 Fuji Rahayu 13089 QA
3
3
3
3
3
3
3
3
3
3
3
3
2
2
3 Kompetensi
8 M Safik 14148 QA
3
3
3
4
3
3
3
3
4
3
3
3
2
2
3 Kompetensi
9 M Ridho 14175 QA
3
3
3
3
3
3
3
3
3
3
3
3
2
2
3 Kompetensi
10 Ani Yunike F 15208 QA
3
3
3
3
3
3
3
3
3
3
3
3
2
2
3 Kompetensi
11 Sholid Danar W. 17498 QA
2
3
3
2
3
3
3
3
3
3
3
3
2
2
3 Tidak
12 Dede Setiyadi 17547 QA
2
2
2
2
3
3
3
3
3
3
2
3
2
2
3 Tidak
77
13 Dhika Varhana 17546 QA
2
2
2
2
3
3
3
3
3
3
2
3
2
2
3 Kompetensi
14 Gunawan 13034 Inspection
3
3
3
4
4
4
3
3
4
3
3
4
2
3
3 Tidak
15 M . Firdaus 13070 Inspection
3
2
2
2
2
2
2
3
2
3
2
2
2
2
2 Kompetensi
16 Muhadin 14137 Inspection
3
2
2
3
3
2
2
3
3
3
3
3
2
3
3 Kompetensi
17 Yogi Ari Prabowo 14179 Inspection
3
3
3
3
3
3
3
3
3
3
3
3
2
3
3 Tidak
18 Wawan Susanto 15233 Inspection
3
2
2
2
2
2
3
3
2
2
2
2
2
2
2 Tidak
19 Sutanto 15303 Inspection
3
2
2
2
2
2
2
1
2
2
1
2
2
1
1 Tidak
20 Idi Suryadi 13030 Inspection
3
2
3
4
4
3
3
3
3
3
3
3
2
3
3 Kompetensi
21 Iwan Kurniawan 15242 Inspection
3
2
2
3
3
3
2
3
3
3
3
3
2
3
3 Kompetensi
22 Ikhwan Ansori 15300 Inspection
3
2
2
3
3
3
2
3
3
3
3
3
2
4
3 Kompetensi
23 Dede Nur A 13082 Inspection
3
3
3
4
3
4
3
4
2
2
3
3
2
3
3 Kompetensi
24 Firman 14172 Inspection
2
2
2
3
3
2
3
3
3
3
3
3
2
3
3 Kompetensi
25 Ainur Rohman 14195 Inspection
3
3
3
3
3
3
3
3
3
3
3
3
2
3
3 Kompetensi
26 Feri Irmawan 15299 Inspection
3
2
2
2
3
3
2
3
3
3
2
2
2
3
3 Tidak
27 Darmanto 15295 Inspection
3
2
2
2
3
3
2
3
3
3
2
2
2
3
3 Tidak
28 Khaerul Anwar 15302 Inspection
3
3
2
2
2
2
2
2
2
2
2
3
2
3
3 Tidak
29 A Mushonnif 15254 Inspection
3
3
2
3
3
3
2
2
3
3
2
3
2
3
3 Kompetensi
30 Casmono 15281 Inspection
3
3
3
3
3
3
2
3
3
3
2
3
2
3
3 Kompetensi
31 Ibnu Khamdun 15290 Inspection
3
3
3
2
2
2
2
3
2
2
3
3
2
3
3 Tidak
78
32 Ahmad Mushonnif 15254 Inspection
3
3
3
3
3
3
2
3
3
3
3
3
2
4
3 Kompetensi
33 Imam Ismail 15400 Inspection
2
2
2
3
3
3
2
3
2
2
3
3
2
3
3 Tidak
34 Anjar Probowo 15405 Inspection
2
2
2
3
3
2
2
3
3
3
3
3
2
3
3 Kompetensi
35 Eka Maulana 16448 Inspection
4
2
2
4
3
3
3
4
3
3
3
3
2
3
3 Kompetensi
36 Munawar Abdul G. 16450 Inspection
3
2
2
2
3
3
2
3
3
3
2
2
2
3
3 Tidak
37 MuhammadGunawan 16451 Inspection
2
2
2
2
3
3
2
3
3
3
2
2
2
3
3 Tidak
38 Ady Falistyo 16453 Inspection
3
2
2
2
2
2
2
2
2
2
2
3
2
3
3 Tidak
39 Muhamad Sulaeman 17515 Inspection
3
2
2
3
3
3
2
2
3
3
2
3
2
3
3 Kompetensi
40 Andrianto Nugroho 17541 Inspection
3
2
2
3
3
3
2
2
3
3
2
3
2
3
3 Kompetensi
41 Septiadi Nugroho 13084 Inspection
4
3
3
3
3
3
3
3
3
3
3
2
2
2
2 Kompetensi
42 Muhajir 13085 Inspection
3
3
2
3
2
3
2
3
3
3
3
2
2
2
2 Tidak
43 Harin Nugroho 14132 Inspection
3
3
3
3
3
3
2
3
3
3
3
2
2
2
2 Kompetensi
44 Tirwan 15296 Inspection
3
3
3
3
3
3
2
3
3
3
1
3
2
2
2 Kompetensi
45 Rasta Kustanto 15297 Inspection
3
2
2
3
3
3
2
3
2
3
2
2
2
2
2 Tidak
46 Eli Waluya 15246 Inspection
3
2
2
2
2
3
2
3
2
2
2
2
2
2
2 Tidak
47 Eko Sarwoko 15284 Inspection
3
2
3
3
3
3
2
3
3
3
3
3
2
2
2 Kompetensi
48 Eka Syarif H 15285 Inspection
3
2
3
3
3
3
2
3
3
3
3
3
2
2
2 Kompetensi
49 M Rizman 15243 Inspection
3
3
2
3
3
3
2
3
2
3
2
2
2
2
2 Tidak
50 Ade Windarto 13043 Inspection
3
3
3
3
3
3
3
3
3
3
3
3
2
2
2 Kompetensi
79
51 Yan Afrianto 13083 Inspection
3
3
2
3
2
2
3
3
3
2
3
3
2
2
2 Tidak
52 Hendy Apriandi 14126 Inspection
3
3
3
3
3
3
3
3
3
3
3
2
2
2
2 Kompetensi
53 Abdul Wahid 14183 Inspection
3
2
3
3
3
3
3
3
3
3
4
2
2
2
2 Kompetensi
54 Andik Purnomo 15301 Inspection
3
2
3
3
3
3
3
3
3
3
3
3
2
2
2 Kompetensi
55 Ibnu Solihin 15308 Inspection
3
2
2
3
3
2
3
3
2
3
4
3
2
2
2 Kompetensi
56 Tovik Nur Cahyo 15228 Inspection
3
2
3
3
3
3
3
3
3
3
4
3
2
2
2 Kompetensi
57 Ricky Setianto 15253 Inspection
3
3
2
3
3
3
2
3
2
2
4
3
2
2
2 Kompetensi
58 Dwi Maryanto 15289 Inspection
3
3
3
3
3
3
3
3
3
2
2
2
2
2
2 Kompetensi
59 M. Ikbal 15294 Inspection
3
2
2
3
3
3
2
3
3
3
4
3
2
2
2 Kompetensi
60 Purnomo Wibowo 15395 Inspection
3
3
3
3
3
3
2
3
3
3
3
3
2
2
2 Kompetensi
61 Agung Purbo Wibowo
15396 Inspection
3
3
2
3
3
2
2
3
3
2
3
3
2
2
2 Tidak
62 Sandi Ahmadi 16451 Inspection
3
3
3
3
3
3
2
3
3
3
3
2
2
2
2 Kompetensi
63 Gusman Mustaqim 16452 Inspection
3
2
3
3
3
3
2
3
3
3
4
2
2
2
2 Kompetensi
64 Agus Peloni 16454 Inspection
2
2
2
3
3
3
2
3
3
3
3
3
2
2
2 Tidak
65 Ginanjar Fatur R. 17492 Inspection
2
2
2
3
3
2
2
3
2
3
4
3
2
2
2 Tidak
66 Syamsul Rizal 17514 Inspection
2
2
3
3
3
3
2
3
3
3
4
3
2
2
2 Kompetensi
67 Nasrullah 17540 Inspection
2
2
2
3
3
3
2
3
2
2
4
3
2
2
2 Tidak
68 Riyanto 17566 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
69 Endang 17567 Inspection
2
1
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
80
70 Dianto 17568 Inspection
2
1
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
71 Abdul Jabar 17569 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
72 Ngudianto 17570 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
73 Beby Rahmad Aprianto
17571 Inspection
2
2
1
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
74 Nizar Aminudin 17572 Inspection
2
2
1
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
75 Iwan Indra Kusuma 17573 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
76 Angga Suhardi 17574 Inspection
2
2
1
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
77 Anggiat 17575 Inspection
2
1
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
78 Prihatno 17576 Inspection
2
1
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
79 Nur Handiq 17577 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
80 Andi Suranto 17578 Inspection
2
2
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
81 Mokhamad Solikhun 17579 Inspection
2
1
2
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
82 Muhamad Parhan 17580 Inspection
2
1
1
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
83 Dziky Dzikrullah 17581 Inspection
2
2
1
2
2
2
1
1
2
2
1
2
2
1
1 Tidak
Catatan Kp1 Pengetahuan Sk1 Tanggung Jawab Kt1 Kecermatan Kt6 Kesadaran Pembiayaan
Kp2 Keterampilan Sk2 Kerjasama Kt2 Kebersihan Kt7 Citra Perusahaan
Kp3 Pemahaman Sk3 Kerajinan Kt3 Kecekatan
Sk4 Disiplin Kt4 Tugas Khusus
Sk5 Kejujuran Kt5 Sumbangan
81
DAFTAR RIWAYAT HIDUP
DATA DIRI
Nama : Mustafa Kamil
Tempat, tanggal lahir : Jakarta, 13 Juli 1994
Jenis Kelamin : Laki-laki
Agama : Islam
Status Pernikahan : Belum Menikah
Nama Ayah : Alzubir Efendi
Nama Ibu : Tati Sundari
Alamat : Kp. Cikarang Girang Rt 02/01 Desa Jayamulya Kec.Serang
Baru Kab. Bekasi
RIWAYAT PENDIDIKAN
1. SDN Cibarusah Jaya 03 Tahun 2000-2004
2. SDN Cilangkap 05 Petang Tahun 2004-2007
3. SMPN 196 Jakarta Tahun 2007-2008
4. SMPN 04 Cibarusah Tahun 2008-2010
5. SMK 1 Cibarusah Tahun 2010-2013
6. STT Pelita Bangsa Tahun 2014-2018
82