PENERAPAN ALGORITMA C4.5 UNTUK MEMPREDIKSI …

PENERAPAN ALGORITMA C4.5

UNTUK MEMPREDIKSI KEAHLIAN KARYAWAN

(STUDI KASUS PT.YANMAR INDONESIA)

SKRIPSI

Oleh:

MUSTAFA KAMIL

311410561

PROGRAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

PENERAPAN ALGORITMA C4.5

UNTUK MEMPREDIKSI KEAHLIAN KARYAWAN

(STUDI KASUS PT.YANMAR INDONESIA)

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan

Program Strata Satu (S1) pada Program Studi Teknik Informatika

Oleh:

MUSTAFA KAMIL

311410561

PROGRAM STUDI TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

iii

iii

PERNYATAAN KEASLIAN PENELITIAN

Saya yang bertandatangan dibawah ini menyatakan bahwa, skripsi ini merupakan

karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah

diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi

pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga tidak terdapat

karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain,

kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar

pustaka.

Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah

menjadi tanggungjawab saya pribadi.

Bekasi, 08 Desember 2018

Materai 6.000

Mustafa Kamil

NIM: 311410561

iv

KATA PENGANTAR

Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah

melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang

berjudul “PENERAPAN ALGORITMA C4.5 UNTUK MEMPREDIKSI

KEAHLIAN KARYAWAN (Studi Kasus Di PT. Yanmar Indonesia)”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom)

pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan

terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah

selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan

terima kasih yang sebesar-besarnya kepada:

a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa

b. Bapak Aswan S. Sunge, M.Kom selaku Ketua Program Studi Teknik

Informatika STT Pelita Bangsa.

c. Bapak Aswan S. Sunge, M.Kom selaku Pembimbing Utama yang telah banyak

memberikan arahan dan bimbingan kepada penulis dalam penyusunan Skripsi

ini.

d. Seluruh Dosen STT Pelita Bangsa yang telah membekali dengan wawasan dan

ilmu di bidang teknik informatika.

e. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya

kepada penulis selama perjalanan studi jenjang Strata 1.

f. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang

telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat

menyelesaikan studi jenjang Strata 1.

g. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan semangat

dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.

v

Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat

dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi

khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa

khususnya dan Indonesia pada umumnya.

Bekasi, 08 Desember 2018

Mustafa Kamil

NIM: 311410561

vi

DAFTAR ISI

PERSETUJUAN .................................................... Error! Bookmark not defined.

PENGESAHAN ..................................................... Error! Bookmark not defined.

PERNYATAAN KEASLIAN PENELITIAN ........................................................ ii

KATA PENGANTAR ........................................................................................... iv

DAFTAR ISI .......................................................................................................... vi

DAFTAR TABEL .................................................................................................. ix

DAFTAR GAMBAR .............................................................................................. x

ABSTRACT ............................................................................................................ xii

ABSTRAK ........................................................................................................... xiii

BAB I PENDAHULUAN ....................................................................................... 1

Latar Belakang ......................................................................................... 1

Identifikasi Masalah ................................................................................. 2

Batasan Masalah ....................................................................................... 3

Rumusan Masalah .................................................................................... 3

Tujuan dan Manfaat .................................................................................. 3

1.5.1 Tujuan ............................................................................................... 3

1.5.2 Manfaat ............................................................................................. 3

1.6 Sistematika Penulisan ............................................................................... 4

BAB II LANDASAN TEORI ................................................................................. 6

vii

2.1 Kajian Penelitian ...................................................................................... 6

2.2 Pengertian Karyawan ............................................................................... 7

2.2.1 Pengertian Pegawai ........................................................................... 7

2.2.2 Pengertian Kinerja Karyawan ........................................................... 7

2.2.3 Kriteria Kinerja Karyawan ................................................................ 8

2.3 Data Msining .......................................................................................... 10

2.3.1 Bagian Metode Data Mining ........................................................... 12

2.4 Pohon Keputusan (Decision tree) ........................................................... 15

2.5 Algoritma C4.5 ....................................................................................... 17

2.6 RapidMiner ............................................................................................. 19

BAB III METODE PENELITIAN........................................................................ 22

3.1 Objek Penelitian ..................................................................................... 22

3.1.1 Sejarah Tempat Penelitian............................................................... 22

3.1.2 Struktur Organisasi ......................................................................... 23

3.1.3 Visi Perusahaan ............................................................................... 23

3.2 Metodologi Penelitian ............................................................................ 24

3.3 Pengumpulan data .................................................................................. 25

3.4 Pengolahan Data Awal ........................................................................... 26

3.5 Penentuan Metode .................................................................................. 26

3.6 Kerangka Pemikiran ............................................................................... 28

BAB IV HASIL DAN PEMBAHASAN .............................................................. 29

viii

4.1 Hasil Penelitian ....................................................................................... 29

4.1.1 Select Data ...................................................................................... 29

4.1.2 Split Validation ............................................................................... 30

4.1.3 Proces Validasi Menggunakan RapidMiner.................................... 32

4.2 Pembahasan ............................................................................................ 37

4.2.1 Hasil Validasi Menggunakan RapidMiner ..................................... 37

4.2.2 Perhitungan Jumlah Kasus Data Keseluruhan, Data Training dan

Data Testing .................................................................................................. 45

4.2.3 Pemodelan Menggunakan Algoritma C4.5 ..................................... 54

4.2.4 Akurasi Prediksi .............................................................................. 70

BAB V PENUTUP ................................................................................................ 73

5.1 Kesimpulan ............................................................................................. 73

5.2 Saran ....................................................................................................... 73

DAFTAR PUSTAKA ........................................................................................... 74

LAMPIRAN .......................................................................................................... 76

ix

DAFTAR TABEL

Tabel 3.1 Kriteria Penelitian Karyawan ................................................................ 26

Tabel 4.1 Pemilihan Data ...................................................................................... 30

Tabel 4.2 Rule Decision Tree Data Training ........................................................ 43

Tabel 4.3 Rule Decision Tree Data Testing .......................................................... 45

Tabel 4.4 Jumlah Nilai Atribut Keseluruhan ........................................................ 45

Tabel 4.5 Jumlah Kasus Data Training ................................................................ 48

Tabel 4.6 Jumlah Kasus Data Testing .................................................................. 51

Tabel 4.7 Perhitungan Note 1 (Root) .................................................................... 54

Tabel 4.8 Perhitungan Note 1.1 ............................................................................. 59

Tabel 4.9 Perhitungan Note 1.2 ............................................................................. 61

Tabel 4.10 Perhitungan Note 1.1.1 ........................................................................ 64

Tabel 4.11 Perhitungan Note 1.1.1.1 ..................................................................... 66

Tabel 4.12 Perhitungan Note 1.2.1 ........................................................................ 68

x

DAFTAR GAMBAR

Gambar 2.1 Tahapan Data Mining ........................................................................ 11

Gambar 2.2 Bentuk Decision Tree Secara Umum ................................................ 16

Gambar 3.1 Strukrtur Organisasi Objek Penilitian ............................................... 23

Gambar 3.2 Tahapan Penilitian ............................................................................. 24

Gambar 3.3 Kerangka Pemikiran .......................................................................... 28

Gambar 4.1 Data Training ................................................................................... 32

Gambar 4.2 Data Testing ...................................................................................... 32

Gambar 4.3 Tampilan Awal RapidMiner ............................................................. 33

Gambar 4.4 Menu Utama New Project ................................................................. 33

Gambar 4.5 Proses Read Excel ............................................................................. 34

Gambar 4.6 Proses Import Data Wizard ............................................................... 34

Gambar 4.7 Import Data Training ......................................................................... 35

Gambar 4.8 Data Hasil Keputusan Sebagai Label ................................................ 35

Gambar 4.9 Proces Validation Menggunakan Data Training ............................... 36

Gambar 4.10 Proces Validation ............................................................................ 37

Gambar 4.11 Pengukuran Accuracy Data Training .............................................. 38

Gambar 4.12 Pengukuran Precision Data Training ............................................. 38

Gambar 4.13 Pengukuran recall Data Training .................................................. 39

Gambar 4.14 Pengukuran Accuracy Data Testing ................................................ 39

Gambar 4.15 Pengukuran Precision Data Testing ................................................ 40

Gambar 4.16 Pengukuran recall Data Testing ..................................................... 41

Gambar 4.17 Hasil Kurva ROC/AUC Data Training ........................................... 42

Gambar 4.18 Hasil Pohon Keputusan Data Training .......................................... 42

xi

Gambar 4.19 Hasil Kurva ROC/AUC Data Testing ............................................ 44

Gambar 4.20 Hasil Pohon Keputusan Data Testing ............................................. 44

Gambar 4.21 Pohon Keputusan Node 1 ................................................................ 59

Gambar 4.22 Pohon Keputusan Node 1.1 ............................................................. 61

Gambar 4.23 Pohon Keputusan Node 1.2 ............................................................. 63

Gambar 4.24 Pohon Keputusan Node 1.1.1 ......................................................... 66

Gambar 4.25 Pohon Keputusan Node 1.1.1.1 ....................................................... 68

Gambar 4.26 Pohon Keputusan Node 1.2.1 .......................................................... 70

Gambar 4.27 Proses Akurasi Data Training Dan Testing .................................... 71

Gambar 4.28 Hasil Akurasi Data accuracy .......................................................... 71

Gambar 4.29 Hasil Prediksi RapidMiner .............................................................. 72

xii

ABSTRACT

Application of C4.5 To Predict Employee Performance Expertise (Case Study: PT Yanmar Indonesia).

Advisor 1: Aswan S. Sunge, M.Kom.

Advisor 2: Dr.Ir. Supriyanto, M.P

The activity of evaluating employee performance has become a common thing, especially in large companies. This is done to evaluate the performance of the employee. However, employee performance evaluation will also have an impact on being a source of concern, commotion, or frustration for employees. Because it is due to the results of the assessment of the company sometimes assessed as not objective and not transparent what criteria are involved in the assessment of employees. Therefore we need classification techniques and data mining predictions in solving these problems. The classification used in data mining is Decision Tree because it is a technique that is widely used and produces output with existing rules, with it can present employee performance appraisal data. In this study using C4.5 Algorithm to produce classification rules for employee performance appraisal. After testing, it was obtained accuracy with the decision tree evaluated by confusion matrix resulting in an accuracy rate of 77.67%, while the evaluation with the ROC curve with an accuracy of Excellent Clasification was 0.947.

Keywords: Employee Skills, Data Mining, Decision Tree, C4.5 Algorithm

xiii

ABSTRAK

Penerapan C4.5 Untuk Memprediksi Keahlian Kinerja Karyawan (Studi Kasus : PT Yanmar Indonesia).

Pembimbing 1 : Aswan S. Sunge, M.Kom

Pembimbing 2 : Dr. Ir. Supriyanto, M.P

Kegiatan penilaian kinerja karyawan sudah menjadi hal umum khususnya di perusahaan besar. Hal ini di laksanakan untuk mengevaluasi kinerja si karyawan. Namun Penilaian kinerja karyawan juga akan berdampak menjadi sumber kerisauan, keributan, atau frustasi bagi karyawan. Karena disebabkan hasil penilaian dari perusahaan terkadang dinilai tidak obyektif dan tidak transparannya kriteria – kriteria apa saja yang dilibatkan dalam penilian karyawan. Oleh karena itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan masalah tersebut. Klasifikasi yang digunakan dalam data mining adalah Decision Tree dikarenakan merupakan teknik yang banyak digunakan dan menghasilkan output dengan aturan yang ada, dengan hal tersebut dapat menyajikan data penilaian kinerja karyawan. Dalam penelitian ini menggunakan Algoritma C4.5 untuk menghasilkan aturan klasifikasi penilaian kinerja karyawan. Setelah dilakukan pengujian, diperoleh akurasi dengan decision tree yang dievaluasi dengan confusion matrix menghasilkan tingkat akurasi sebesar 77.67%, sedangkan evaluasi dengan kurva ROC dengan akurasi Excellent Clasification sebesar 0.947.

Kata Kunci: Keahlian Karyawan, Data Mining, Decision Tree, Algoritma C4.5

xiv

1

BAB I

PENDAHULUAN

Latar Belakang

Sumber Daya Manusia merupakan aset terpenting dalam suatu perusahaan,

karena Sumber Daya Manusia menentukan keberhasilan suatu perusahaan. Sumber

Daya Manusia di perusahaan perlu dikelola secara profesional agar terwujud

keseimbangan antara kebutuhan karyawan dengan tuntutan dan kemampuan

perusahaan. Pandangan terhadap Sumber Daya Manusia dapat dilihat secara

individu maupun secara kelompok, hal tersebut dikarenakan perilaku manusia

mempunyai sifat dan karakteristik yang berbeda-beda.

Setiap perusahaan selalu mengharapkan karyawannya mempunyai prestasi,

karena dengan memiliki karyawan yang berprestasi akan memberikan sumbangan

yang optimal bagi perusahaan. Selain itu, dengan memiliki karyawan yang

berprestasi perusahaan dapat meningkatkan kinerja perusahaan.

Kegiatan penilaian kinerja karyawan sudah menjadi hal umum khususnya

di perusahaan besar. Hal ini di laksanakan untuk mengevaluasi kinerja si karyawan.

Selain itu penilaian kinerja karyawan juga mendorong para karyawan untuk

meningkatkan kuantitas dan kualitas kerjanya demi perusahaan. Perusahaan juga

akan memberikan apresiasi terhadap karyawan yang penilaian kinerjanya

berprestasi supaya dapat memacu kinerja karyawan yang lainnya.

Selain bermanfaat bagi perusahaan, penilaian kinerja karyawan juga akan

berdampak menjadi sumber kerisauan, keributan, atau frustasi bagi karyawan. Hal

tersebut disebabkan hasil penilaian dari perusahaan terkadang dinilai tidak obyektif

2

karena tidak transparannya kriteria – kriteria apa saja yang dilibatkan dalam

penilian karyawan, sehingga memunculkan anggapan bahwa data dapat

dimanipulasi dan hasil dari penilaiannya tidak adil. Hal itu bisa terjadi karena

sulitnya mengambil keputusan dengan kriteria yang banyak tanpa adanya

otomatisasi penggalian data. Perusahan akan mendapatkan dampaknya yaitu tidak

akan mendapatkan sumber daya manusia yang kompetitif karena data dengan

kenyataan yang di lapangan sangat berbeda mengenai kinerja karyawannya. Salah

satu solusi caranya dengan mengembangkan metode penelitian baru yang dapat

menambah keakuratan hasil keputusan yaitu penggunaan data mining.

Menimbang dari latar belakang masalah diatas maka penulis mengambil

penelitian skripsi ini dengan judul “Penerapan Data Mining Untuk Memprediksi

Keahlian Karyawan Dengan Metode Algoritma C4.5 (Studi Kasus PT. Yanmar

Indonesia)”.

Identifikasi Masalah

Berdasarkan latar belakang masalah yang penulis kemukakan diatas, maka

dapat diidentifikasikan masalah sebagai berikut:

1. Hasil Penilaian dinilai kurang obyektif di karenakan tidak transparannya

kriteria dan proses yang digunakan untuk melakukan penilaian karyawan.

2. Hasil keputusan penilaian karyawan belum dapat dinilai tingkat

keakuratannya.

3. Belum adanya suatu metode dalam melihat penilaian karyawan.

4. Belum adanya akurasi dan prediksi dalam melihat suatu keakuratan dalam

penilaian karyawan.

3

5. Masih menggunakan sistem penilaian manual terutama dalam melihat suatu

keputusan menilai karyawan.

Batasan Masalah

Berdasar pada latar belakang yang sudah dikemukakan, maka rumusan

masalah pada penelitian ini adalah

1. Bagaimana melihat akurasi akurasi dan prediksi dalam penilaian karyawan

dengan metode klasifikasi data mining dengan algoritma c4.5.

Rumusan Masalah

Pembahasan penelitian ini dibatasi agar tidak menyimpang dari apa yang

telah dirumuskan, batasan masalah pada penelitian ini sebagai berikut.

1. Bagaimana melihat suatu prediksi dan akurasi untuk penilaian karyawan.

Dengan prediksi penilaian karyawan dengan Algoritma C4.5.

Tujuan dan Manfaat

1.5.1 Tujuan

Tujuan yang ingin dicapai dalam penelitian ini adalah

1. Menganalisa pencapaian kinerja karyawan dengan menggali data-data yang

akurat untuk menjadi acuan dalam penetapan keputusan.

2. Untuk memprediksi hasil penilaian karyawan.

1.5.2 Manfaat

Manfaat yang diperoleh dari penelitian ini adalah

1. Mempermudah perusahaan dalam hal mengambil keputusan untuk

menentukan karyawan yang memiliki keahlian dan yang tidak secara

obyektif berdasarkan kriteria-kriteria yang sesuai dan transparan.

4

2. Menghindari manipulasi data maupun cara yang subyektif dari pengambilan

keputusan agar karyawan juga merasa keputusan yang di peroleh sudah

sesuai aktual.

3. Penelitian ini dapat dijadikan perbandingan bagi penelitian lain yang

berkaitan dengan pengambilan keputusan.

1.6 Sistematika Penulisan

Penelitian ini terbagi menjadi lima bab, dimana masing–masing bab terdiri

dari beberapa sub–sub bab untuk menghasilkan pembahasan secara

sistematis. Adapun lima bab tersebut ialah :

BAB I : PENDAHULUAN

Pada bab ini ingin mengemukakan gambaran tentang latar belakang,

maksud dan tujuan, rumusan masalah, batasan masalah, metode

pengumpulan data dan sistematika penulisan

BAB II : TINJAUAN PUSTAKA

Pada bab ini ingin menjelaskan tentang teori-teori yang didapat dari

sumber-sumber yang relevan untuk digunakan sebagai panduan dalam

penelitian serta penyusunan skripsi.

BAB III : METODE PENELITIAN

Pada bab ini akan menjelaskan tentang tahap penelitian, data yang

digunakan, pemodelan data, data prepocessing dan analisis cluster.

5

BAB IV : HASIL DAN PEMBAHASAN

Pada bab ini akan menjelaskan tentang implementasi algoritma serta

pembahasan dari penelitian yang dilakukan.

BAB V : PENUTUP

Pada bab ini akan memberikan kesimpulan dan saran dari keseluruhan

penelitian yang telah di bahas.

6

BAB II

LANDASAN TEORI

2.1 Kajian Penelitian

Berikut merupakan penelitian terdahulu yang masih berkaitan dengan metode

maupun akurasi menggunakan algoritma C4.5 adalah

1. Uji Akurasi Klasifikasi Dan Validasi Data Pada Pengguna Metode

Membersif Function Dan Algoritma C4.5 Dalam Penelitian Penerimaan

Beasiswa (Budiman, A. S, & Parandani, X. A. 2018)

Penelitian ini bertujuan untuk menguji dan memastikan validasi data dalam

penilain penerimaan beasiswa dengan menggunakan dua metode yaitu

Membersif Function dan Algoritma C4.5.

2. Implementation of Data Mining to Analyze Drug Cases Using C4.5

Decision Tree. (Wahyuni, S. 2018)

Penelitian ini bertujuan untuk menganalisa data tahanan yang melakukan

tindakan narkoba supaya di peroleh informasi serta meminimalkan tindak

pidana narkoba.

3. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 (Studi Kasus

: PT HANKOOK Tire Indonesia). (Sunge, A. S. 2018).

Penelitian ini bertujuan untuk memprediksi dalam melihat kompetensi

karyawan dan dihasilkan akurasi yang tepat.

4. Perbandingan Akurasi Algoritma C4.5 dan CART dalam Memprediksi

Kategori Indeks Prestasi Mahasiswa. (Alverina. D, dkk. 2018)

7

Penelitian ini bertujuan untuk membandingkan prediksi dalam penilaian

akurasi indek prestasi mahasiswa dengan menggunakan Algoritma C4.5 dan

CART.

2.2 Pengertian Karyawan

Menurut Hasibuan (2012), Karyawan adalah orang penjual jasa (pikiran

atau tenaga) dan mendapat kompensasi yang besarnya telah ditetapkan terlebih

dahulu.

Karyawan merupakan terjemahan dari kata “performance” yang memiliki

arti sebagai sebuah hasil kerja seorang pegawai atau pekerja, sebuah proses

manajemen yang mana hasil kerja tersebut harus memiliki sebuah bukti konkret

yang juga dapat diukur (Sedarmayanti, 2011).

2.2.1 Pengertian Pegawai

Menurut Musanef (2009:5) pegawai adalah orang-orang yang melakukan

pekerjaan dengan mendapat imbalan jasa berupa gaji dan tunjangan dari pemerintah

atau badan swasta.

A.W.Widjaja (2006:113) penyebut pegawai merupakan tenaga kerja

manusia jasmaniah maupun rohaniah (mental dan pikiran) yang senantiasa

dibutuhkan dan oleh karena itu menjadi salah satu modal pokok dalam usaha kerja

sama untuk mencapai tujuan tertentu (organisasi).

2.2.2 Pengertian Kinerja Karyawan

Istilah kinerja berasal dari kata Job Performance prestasi kerja atau prestasi

sesungguhnya yang dicapai oleh seseorang. Pengertian Kinerja adalah hasil kerja

8

secara kualitas dan kuantitas yang dicapai oleh seorang pegawai dalam

melaksanakan tugasnya sesuai dengan tanggung jawab yang diberikan padanya

Mangkunegara (2013).

Kinerja menurut Fahmi (2014) adalah hasil yang diperoleh oleh suatu

organisasi baik organisasi tersebut bersifat profit oriented dan non profit oriented

yang dihasilkan selama satu periode waktu.

Menurut Simanjuntak (2005) dalam Widodo (2015) Kinerja adalah

tingkatan pencapaian hasil atas pelaksanaan tugas tertentu. Simanjuntak juga

mengartikan kinerja individu sebagai tingkat pencapaian atau hasil kerja seseorang

dari sasaran yang harus dilaksanakan dalam kurun waktu tertentu.

2.2.3 Kriteria Kinerja Karyawan

Kriteria kinerja adalah dimensi-dimensi pengevaluasian kinerja seseorang

pemegang jabatan, suatu tim, dan suatu unit kerja. Secara bersama-sama dimensi

itu merupakan harapan kinerja yang berusaha dipenuhi individu dan tim guna

mencapai strategi organisasi.

Menurut Schuler dan Jackson 2004 (dalam Harsuko 2011) bahwa ada 3 jenis

dasar kriteria kinerja yaitu:

1. Kriteria berdasarkan sifat memusatkan diri pada karakteristik pribadi

seseorang karyawan. Loyalitas, keandalan, kemampuan berkomunikasi, dan

keterampilan memimpin merupakan sifat-sifat yang sering dinilai selama

proses penilaian. Jenis kriteria ini memusatkan diri pada bagaimana

9

seseorang, bukan apa yang dicapai atau tidak dicapai seseorang dalam

pekerjaanya.

2. Kriteria berdasarkan perilaku terfokus pada bgaimana pekerjaan

dilaksanakan. Kriteria semacam ini penting sekali bagi pekerjaan yang

membutuhkan hubungan antar personal. Sebagai contoh apakah SDMnya

ramah atau menyenangkan.

3. Kriteria berdasarkan hasil, kriteria ini semakin populer dengan makin

ditekanya produktivitas dan daya saing internasional. Kreteria ini berfokus

pada apa yang telah dicapai atau dihasilkan ketimbang bagaimana sesuatu

dicapai atau dihasilkan.

Menurut Bernandin & Russell (2001 dalam Riani 2011) kriteria yang

digunakan untuk menilai kinerja karyawan adalah sebagai berikut:

1. Quantity of Work (kuantitas kerja): jumlah kerja yang dilakukan dalam

suatu periode yang ditentukan.

2. Quality of Work (kualitas kerja): kualitas kerja yang dicapai berdasarkan

syarat-syarat kesesuaian dan ditentukan.

3. Job Knowledge (pengetahuan pekerjaan): luasnya pengetahuan mengenai

pekerjaan dan keterampilannya.

4. Creativeness (kreativitas): keaslian gagasan-gagasan yang dimunculkan dan

tindakan-tindakan untuk menyelesaikan persoalan-persoalan yang timbul.

5. Cooperation (kerja sama): kesedian untuk bekerjasama dengan orang lain

atau sesama anggota organisasi.

10

6. Dependability (ketergantungan): kesadaran untuk mendapatkan

kepercayaan dalam hal kehadiran dan penyelesaian kerja.

7. Initiative (inisiatif): semangat untuk melaksanakan tugas-tugas baru dan

dalam memperbesar tanggung jawabnya.

8. Personal Qualities (kualitas personal): menyangkut kepribadian,

kepemimpinan, keramah-tamahan dan integritas pribadi.

2.3 Data Mining

Data mining adalah serangkaian proses untuk menggali nilai tambah berupa

informasi yang selama ini tidak diketahui secara manual dari suatu basis data.

Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola

yang penting atau menarik dari data yang terdapat pada basis data. Data mining

terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data

yang besar sehingga sering disebut knowledge discovery database (KDD)

(Vulandari, 2017:1).

Menurut Clifton (dalam Suyanto,2017:1) terdapat dalam bukunya “Data

Mining Untuk Klasifikasi Dan Klastering Data”, data mining merupakan gabungan

sejumlah disiplin ilmu komputer, yang didefinisikan sebagai proses penemuan

pola-pola baru dari kumpulan-kumpulan data sangat besar, meliputi metode-metode

yang merupakan irisan dari artifical intelligence, machine learning, statistics dan

databases system.

Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa

tahap proses yang diilustrasikan pada gambar di bawah ini. Tahap-tahap tersebut

11

bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge

base. (Larose, 2005)

Gambar 2.1 Tahapan Data Mining

Sumber : Han,dkk, 2012.

Tahap-tahap data mining adalah sebagai berikut:

a) Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilang-kan noise dan data yang

tidak konsisten atau data tidak relevan.

b) Integrasi data (data integration)

Integrasi data merupakan penggabungan data dari berbagai database ke

dalam satu database baru.

c) Seleksi data (data selection)

12

Data yang ada pada database sering kali tidak semuanya dipakai, oleh

karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari

database.

d) Transformasi data (data transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk diproses

dalam data mining.

e) Proses mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan

pengetahuan berharga dan tersembunyi dari data. Beberapa metode yang

dapat digunakan berdasarkan pengelompokan data mining yaitu Estimation,

Prediction, Classification, Clustering, Association.

f) Evaluasi pola (pattern evaluation)

Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang

ditemukan.

g) Presentasi pengetahuan (knowledge presentation)

Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang

digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

2.3.1 Bagian Metode Data Mining

Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas yang

dapat dilakukan, yaitu:

1. Estimation (Estimasi)

13

Algoritma estimasi mirip dengan algoritma klasifikasi, tapi variabel target

adalah berupa bilangan numerik (kontinyu) dan bukan kategorikal (nominal atau

diskrit).

Estimasi nilai dari variabel target ditentukan berdasarkan nilai dari varibel

prediktor (atribut).

Algoritma estimasi yang biasa digunakan adalah : Linear Regression, Neural

Network, Support Vector Machine

2. Prediction / Forecasting (Prediksi)

Algoritma prediksi/forecasting sama dengan algoritma estimasi di mana

label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan

data rentet waktu (data time series).

Istilah prediksi kadang digunakan juga untuk klasifikasi, tidak hanya untuk

prediksi time series, karena sifatnya yang bisa menghasilkan class berdasarkan

berbagai atribut yang disediakan.

Algoritma prediksi yang biasa digunakan adalah : Linear Regression, Neural

Network, Support Vector Machine.

3. Classification (Klasifikasi)

Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang

telah didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan

memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan

hasilnya untuk memberikan sejumlah aturan. Salah satu contoh yang mudah dan

popular adalah dengan Decision tree yaitu salah satu metode klasifikasi yang paling

14

populer karena mudah untuk diinterpretasi. Decision tree adalah model prediksi

menggunakan struktur pohon atau struktur berhirarki.

Algoritma klasifikasi yang biasa digunakan adalah : Naive Bayes, K-Nearest

Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis,dll

4. Clustering (Klastering)

Digunakan untuk menganalisis pengelompokkan berbeda terhadap data, mirip

dengan klasifikasi, namun pengelompokkan belum didefinisikan sebelum

dijalankannya tool data mining. Biasanya menggunkan metode neural network atau

statistik. Clustering membagi item menjadi kelompok-kelompok berdasarkan yang

ditemukan tool data mining.

Algoritma clustering yang biasa digunakan adalah : K-Means, K-Medoids,

Self-Organizing Map (SOM), Fuzzy C-Means

5. Association (Asosiasi)

Digunakan untuk mengenali kelakuan dari kejadian-kejadian khusus atau

proses dimana hubungan asosiasi muncul pada setiap kejadian. Salah satu

contohnya adalah Market Basket Analysis, yaitu salah sati metode asosiasi yang

menganalisa kemungkinan pelanggan untuk membeli beberapa item secara

bersamaan.

Algoritma association rule diantaranya adalah : A priori algorithm, FP-Growth

algorithm, GRI algorithm.

15

2.4 Pohon Keputusan (Decision tree)

Vulandari (2017:15) menyimpulkan bahwa “Pohon dalam analisis

pemecahan masalah pengambilan keputusan adalah pemetaan mengenai alternatif-

alternatif pemecahan masalah yang dapat diambil dari masalah tersebut. Pohon

tersebut juga memperlihatkan faktor-faktor kemungkinan/ probabilitas yang akan

mempengaruhi alternatif-alternatif keputusan tersebut, disertai dengan estimasi

hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut”.

Decision tree adalah struktur flowchart yang menyerupai tree (pohon),

dimana setiap simpul internal menandakan suatu tes pada atribut, setiap cabang

merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau

distribusi kelas. Alur pada decision tree di telusuri dari simpul akar ke simpul daun

yang memegang prediksi. (Han, J., & Kamber, M. dalam Dennis, dkk :2013)

Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya

untuk mem-breakdown proses pengambilan keputusan yang kompleks menjadi

lebih simpel sehingga pengambil keputusan akan lebih menginterprestasikan solusi

dari permasalahan.

16

Gambar 2.2 Bentuk Decision Tree Secara Umum

Sumber : (Han, J., & Kamber, M. dalam Dennis, dkk :2013)

Pohon keputusan mempunyai tiga pendekatan klasik :

1. Pohon Klasifikasi, digunakan ketika hasil prediksi adalah keanggotaan kelas

(misalnya, Algoritma C4.5)

2. Pohon Regresi, digunakan ketika hasil prediksi dianggap sebagai bilangan

real (misalnya : harga minyak, nilai kendaraan)

3. CART (C & RT) yaitu klasifikasi dan pohon regresi.

Pohon keputusan banyak sekali perkembangan tetapi yang sering dipakai

adalah ID3 dan C4.5. Keduanya mempunyai prinsip yang sama dikarenakan

17

Algoritma C4.5 merupakan pengembangan dari ID3, tetapi mempunyai perbedaan

utama yaitu :

1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat

menangani data training dengan nilai yang hilang atau data yang kosong.

2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk

3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio

2.5 Algoritma C4.5

Algoritma adalah urutan logis langkah-langkah penyelesaian masalah yang

disusun secara sistematis (Munir, 2016)

Algoritma C4.5 adalah suatu deretan algoritma untuk permasalahan

klasifikasi di dalam sebuah mesin dan himpunan data. Algoritma C4.5

diperkenalkan oleh Quinlan (1996) sebagai versi pembenahan dari ID3. Dalam ID3,

induksi decision tree hanya dapat digunakan pada fitur kategorikal (nimonal),

sedangkan tipe numerik (ratio) tidak bisa digunakan. Perubahan yang membedakan

algoritma C4.5 dan ID3 adalah dapat menangani fitur dengan numerik , melakukan

pemotongan (pruning) decision tree, dan penurunan (deriving) rule set. Algoritma

C4.5 juga menggunakan kriteria gain dan menentukan fitur yang menjadi pemecah

node pada pohon yang diinduksi (Oktaviana, 2016)

Menurut Dennis, dkk (2013) terdapat dalam bukunya “Belajar Data Mining

Dengan Rapid Miner”, Algoritma C4.5 dapat menangani data numerik dan diskret.

Algoritma C.45 menggunakan rasio perolehan (gain ratio).

18

Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio

untuk diperbaharui information gain maka dengan rumus : (Aswan, 2018)

Dimana :

S = Ruang/Data Sample yang dipergunakan untuk data training.

A = Atribut

Gain(S,A) = information gain pada atribut A

SplitInfo(S,A) = split information pada atribut A

Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai

atribut test untuk simpul. Pendekatan ini menerapkan normalisasi pada information

gain dengan menggunakan apa yang disebut dengan split information, dengan

rumus :

Dimana:

S = Ruang (data) sample yang digunakan untuk training.

A = Atribut.

Si = Jumlah sample untuk atribut i

19

Pada saat membangun pohon keputusan, mungkin adanya data yang noise

maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk

mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih

mudah dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode

dalam melakukan pemakasan pohon keputusan yaitu:

A. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree

agar tidak sampai lebih jauh dalam pemangkas data training. Rumus

Prepruning :

Dimana :

r = nilai perbandingan error rate

n = total sample

z = Φ-1(c)

c= confidence level

B. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang

beberapa cabang subtree setelah selesai dibangun. Metode ini sebagai bagian

standard untuk Algoritma C4.5.

2.6 RapidMiner

RapidMiner sebelumnya bernama YALE (Yet Another Learning

Environment), dimana versi awalnya mulai dikembangkan pada tahun 2001 oleh

RalfKlinkenberg, Ingo Mierswa, dan Simon Fischer di Artificial Intelligence Unit

dari University of Dortmund. RapidMiner didistribusikan di bawah lisensi AGPL

20

(GNU Affero General Public License) versi 3. Hingga saat ini telah ribuan aplikasi

yang dikembangkan mengunakan RapidMiner di lebih dari 40 negara. RapidMiner

sebagai software open source untuk data mining tidak perlu diragukan lagi karena

software ini sudah terkemuka di dunia. RapidMiner menempati peringkat pertama

sebagai Software data mining pada polling oleh KDnuggets, sebuah portal data-

mining pada 2010-2011.

RapidMiner menyediakan GUI (Graphic User Interface) untuk merancang

sebuah pipeline analitis. GUI ini akan menghasilkan file XML )Extensible Markup

Language) yang mendefenisikan proses analitis keingginan pengguna untuk

diterpkan ke data. File ini kemudian dibaca oleh RapidMiner untuk menjalankan

analis secara otomatis.

RapidMiner memiliki beberapa sifat sebagai berikut: (Wicaksana, I Wayan

Simri, 2013)

a) Ditulis dengan bahasa pemrograman Java sehingga dapat dijalankan di

berbagai sistem operasi.

b) Proses penemuan pengetahuan dimodelkan sebagai operator trees

c) Representasi XML internal untuk memastikan format standar pertukaran

data.

d) Bahasa scripting memungkinkan untuk eksperimen skala besar dan

otomatisasi eksperimen.

e) Konsep multi-layer untuk menjamin tampilan data yang efisien dan

menjamin penanganan data.

21

f) Memiliki GUI, command line mode, dan Java API yang dapat dipanggil dari

program lain.

Beberapa Fitur dari RapidMiner, antara lain:

a) Banyaknya algoritma data mining, seperti decision treee dan self-

organization map.

b) Bentuk grafis yang canggih, seperti tumpang tindih diagram histogram, tree

chart dan 3D Scatter plots.

c) Banyaknya variasi plugin, seperti text plugin untuk melakukan analisis teks.

d) Menyediakan prosedur data mining dan machine learning termasuk: ETL

(extraction, transformation,loading), data preprocessing, visualisasi,

modelling dan evaluasi

e) Proses data mining tersusun atas operator-operator yang nestable,

dideskripsikan dengan XML, dan dibuat dengan GUI

f) Mengintegrasikan proyek data mining Weka dan statistika R

22

BAB III

METODE PENELITIAN

3.1 Objek Penelitian

3.1.1 Sejarah Tempat Penelitian

PT Yanmar Indonesia adalah perusahaan jepang yang tergabung kedalam

yanmar group yang resmi didirikan pada 30 Januari 2012 yang dipimpin oleh

direktur YOSHIHIRO TAMAZAKI. Produk yang diproduksinya yaitu part mesin

diesel untuk tipe mesin kecil dan mesin besar.

Sedangkan Pada tahun 1912 PT Yanmar pusat yang berpusat di jepang

didirikan oleh YAMAOKA HATSUDOKI KOSAKUSHO. Memulai produksinya

dengan mesin gas/gas engines. Pada tahun 1921 nama YANMAR diadopsi sebagai

brand. Pada tahun 1930 A 2-cycle, vertical diesel engine model (5Hp) diluncurkan.

Pada 23 desember 1933 HB model, Mesin Diesel tipe kecil yg paling laku di dunia

(5-6Hp), diluncurkan. Pada 1955 Diesel dianugerahi Medali Emas oleh Asosiasi

Penemu Jerman. Pada 1957 Menerima penghargaan Merrit –Jerman.

Taman Batu Jepang mengenang Dr. Rudolf Diesel, disumbangkan ke kota

Augsburg, Jerman. Pada 1968 Dianugerahi Hadiah Deming. Pada 1983 L35 ultra

compact air cooled diesel engine model (3.5 Hp) diluncurkan. Pada 1995 BIWA

PLANT dibuka di Jepang. Pada 2006 Pencapaian Produksi TN series sebanyak 5

juta unit produksi. Pada 2012 menjadi peringatan ke-100th.bagi Yanmar Grup.

23

3.1.2 Struktur Organisasi

Strukrtur organisasi pada PT. Yanmar Indonesia dapat dilihat sebagai

berikut :

Gambar 3.1 Strukrtur Organisasi Objek Penilitian

3.1.3 Visi Perusahaan

Pernyataan Visi Perusahaan PT Yanmar Indonesia :

Kami hidup bersama dan saling terkait dengan alam

Menanggung pilar utama kehidupan

Dalam bidang produksi pangan dan pemanfaatan energi

Memecahkan permasalahan pelanggan

Menjadi perusahaan yang terhubung dengan masa depan

Serta mewujudkan kehidupan yang lebih makmur

24

3.2 Metodologi Penelitian

Pada tahap ini, data yang digunakan adalah data PT. Yanmar Indonesia di

Cikarang. Data tersebut akan diolah menggunakan metode Algoritma C4.5 dapat

digunakan sebagai rules untuk memprediksi penilaian kinerja karyawan. Dalam

penelitian ini akan dilakukan beberapa langkah atau tahapan penelitian.

Gambar 3.2 Tahap Penilitian

Penjelasan :

1. Pengumpulan data

Tahapan ini menerangkan tentang darimana sumber data dalam penelitian

ini didapatkan dan menemukan informasi yang bisa digunakan untuk

penelitian.

2. Pengolahan Data Awal

Tahapan ini menerangkan tentang tahap awal dalam data mining.

Pengolahan awal data meliputi proses input data keformat yang dibutuhkan.

3. Metode yang diusulkan

Tahapan ini dijelaskan pemilihan dan penggunaan metode algoritma C4.5

pada penelitian.

Pengumpulan data

Pengolahan data awal

Metode yang diusulkan

Pengujian/ Validasi hasil

25

4. Pengujian dan Validasi hasil

Tahapan ini menjelaskan tentang pengujian, hasil pengujian akan di validasi

dan kemudian di evaluasi. Penjelasan mengenai hal ini akan di paparkan

pada BAB IV.

3.3 Pengumpulan data

3.3.1 Sumber Data

Dalam penelitian ini penulis hanya menggunakan metode pengumpulan

data yang diperoleh langsung dari sumber objek penelitian. Dalam hal ini penulis

mendapatkan data dari management teknikal di PT Yanmar Indonesia. Data yang

digunakan dalam penelitian ini adalah data sekunder. Jumlah data yang ada

berjumlah 84 data, data yang ada terdiri berbagai bagian management teknikal yaitu

Quality Assurance, Casting Engineering, Patten Conservation dan Inspection.

3.3.2 Variabel Data

Variabel yang terdapat pada data penelitian ini meliputi variabel input dan

variabel output atau target.

1. Variabel input

Variabel input dinyatakan sebagai data penilaian karayawan. Berikut ini

adalah variabel input yang terdapat pada penilaian kinerja karyawan yang

akan digunakan untuk mengklasifikasi yaitu sebagai berikut:

26

Tabel 3.1 Kriteria Penilaian Karyawan

Kode Kemampuan Kode Sikap Kode Kontribusi

Kp1 Pengetahuan Sk1 Tanggung Jawab Kt1 Kecermatan

Kp2 Ketrampilan Sk2 Kerjasama Kt2 Kebersihan

Kp3 Pemahaman Sk3 Kerajinan Kt3 Kecekatan

Sk4 Disiplin Kt4 Tugas Khusus

Sk5 Kejujuran Kt5 Sumbang Saran

Kt6 Kesadaran Pembiayaan

Kt7 Citra Perusahaan

2. Variabel Target

Variabel target dinyatakan sebagai hasil dari penelitian yang dilakukan

terhadap variabel input. Sedangkan variabel target dari penelitian ini adalah

atribut “Hasil” yang berisikan label “Kompetensi” dan “Tidak”.

3.4 Pengolahan Data Awal

Pada tahap ini menjelaskan tentang tahap awal data mining. Data yang telah

didapatkan akan diolah keformat yang dibutuhkan, pengelompokkan dan penentuan

atribut data. Dalam melakukan pengolahan data awal, akan dilakukan beberapa

tahapan agar pada akhirnya akan didapatkan data yang bisa digunakan pada tahap

selanjutnya. Tahapan tersebut antara lain: select data dan split validation.

3.5 Penentuan Metode

Metode yang akan digunakan dalam penelitian ini adalah Algoritma C4.5.

Berikut ini tahapan proses pemodelan dalam penelitian ini:

1. Choosing the appropriate Data Mining taks

27

Pada tahap ini memilih jenis data mining yang digunakan. Pada

penelitian untuk prediksi kinerja karyawan maka dipilih jenis data mining

yang akan digunakan adalah klasifikasi.

2. Choosing the Data Mining Algorithm

Setelah pemilihan jenis data mining yang akan digunakan yaitu

klasifikasi, maka selanjutnya menentukan algoritma klasifikasi yang akan

digunakan. Pada penelitian ini algoritma yang dipilih adalah Algoritma

C4.5.

3. Employing the Data Mining Algorithm

Tahapan ini dilakukan untuk pengolahan data dengan algoritma

yang telah dipilih yaitu dengan menggunakan Algoritma C4.5.

4. Evaluation

Dalam tahap ini dilakukan evaluasi dan menafsirkan pola yang

didapatkan dari hasil algoritma yang dipakai untuk mengetahui aturan,

kehandalan, dan lain-lain. Evaluasi dilakukan dengan menerapkan pola

yang didapat dari proses sebelumya terhadap data testing yang disediakan.

Evaluasi dilakukan dengan confusion matrix dan kurva ROC. Tahapan ini

secara detail akan dibahas pada tahapan selanjutnya yaitu BAB IV.

5. Using the discovered knowledge

Pada tahap ini menggunakan pengetahuan yang diperoleh dari

proses data mining untuk penerapan pada aplikasi atau lainya. Pengetahuan

klasifikasi untuk memprediksi penilaian kinerja karyawan “Kompetensi”

dan yang “Tidak”. Pembahasan tahap ini akan dijabarkan pada BAB IV.

28

3.6 Kerangka Pemikiran

Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran

sebagai pedoman yang dilakukan secara konsisten. Unutk menyelesaikan

masalahan penelitian ini penulis menggunakan metode Algoritma c4.5. Pengujian

metode ini dilakukan dengan cara cross validation, confusion matrix dan kurva

ROC. Untuk pengembangannya dan pengujian metode ini digunakan aplikasi

RapidMiner. Berikut adalah kerangka pemikiran yang dilakukan.

Gambar 3.3 Kerangka Pemikiran

Identifikasi Masalah

Hasil keputusan penilaian karyawan belum dapat dinilai tingkat keakuratannya

Metode

C4.5

Pengembangan

Aplikasi RapidMiner

Implementasi

Karyawan berkompeten dan tidak berkompeten

Pengukuran

Confusion Matrix KurvaROC

29

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian

Data awal merupakan data yang diperoleh dari hasil penilaian leader,

supervisor bagian masing-masing dan HRD kepada karyawan yang masih dalam

cakupan management teknikal yaitu Quality Assurance, Casting Engineering,

Patten Conservation dan Inspection. Data yang sudah dinilai oleh leader, supervisor

dan HRD tadi lalu dijumlahkan dan dijadikan satu data sesuai dengan kriteria-

kriteria yang ada (lampiran 1).

Beberapa tahap pengolahan data awal tersebut yaitu : select data dan split

validation.

4.1.1 Select Data

Pada tahap ini dilakukan pemilihan variabel data yang akan dianalisa,

karena sering ditemukan bahwa tidak semua data dibutuhkan untuk dilakukan

proses data mining. Pemilihan variabel tersebut dilakukan dengan memperhatikan

tujuan penulisan, sehingga diperoleh beberapa variabel yang akan digunakan

menjadi variabel input.

Dari 84 data yang ada dengan variabel sebanyak 19, sebanyak 16 variabel

yang diambil saja. Data hasil seleksi akan digunakan dalam proses data mining.

Berikut adalah penjelasan variabel sebagai berikut :

30

Tabel 4.1 Pemilihan Data

Variabel Indikator Detail Penggunaan

Nama X -

NIK X -

Bagian X -

Kp1( Pengetahuan) V Nilai Model

Kp2 (Ketrampilan V Nilai Model

Kp3 (Pemahaman) V Nilai Model

Sk1 (Tanggung Jawab) V Nilai Model

Sk2 (Kerjasama) V Nilai Model

Sk3 (Kerajinan) V Nilai Model

Sk4 ( Disiplin V Nilai Model

Sk5 (Kejujuran) V Nilai Model

Kt1 (Kecermatan) V Nilai Model

Kt2 (Kebersihan) V Nilai Model

Kt3 (Kecekatam) V Nilai Model

Kt4 (Tugas Khusus) V Nilai Model

Kt5( Sumbang Saran) V Nilai Model

Kt6 (Kesadaran Pembiayaan) V Nilai Model

Kt7 (Citra Perusahaan) V Nilai Model

Hasil V Label Target

Pada tabek variabel diatas akan digunakan dan tidak digunakan dalam

penelitian ini. Indikator “V” menandakan bahwa variabel tersebut digunakan,

sedangkan indikator “X” menandakan variabel tersebut dieliminasi pada tahap

pengolahan data awal. Pengeliminasian beberapa variabel tersebut berdasarkan

nilai model yang relatif sama dan tidak mempengaruhi hasil dari proses penilaian.

4.1.2 Split Validation

Split Validation merupakan teknik validasi yang membagi data menjadi dua

bagian secara acak, sebagian data training (80%) dan sebagian data testing (20%).

31

Pembagian data menjadi data training dan data testing menggunakan teknik

sampling random sistematik (systematic random sampling). Cara penggunaan

teknik ini melakukan perandoman atau pengundian hanya dilakukan satu kali, yakni

ketika menentukan unsur pertama dari sampling yang akan diambil. Penentuan

unsur sampling selanjutnya ditempuh dengan cara memanfaatkan interval sample.

Interval sampel adalah angka yang menunjukkan jarak antara nomor-nomor urut

yang terdapat dalam kerangka sampling yang akan dijadikan patokan dalam

memilih unsur-unsur sampling kedua dan seterusnya hingga unsur ke-n. Interval

sampel dilambangkan dengan huruf k.

Interval sampel atau biasanya disebut juga sampling rasio diperoleh dengan

cara membagi ukuran populasi dengan ukuran sampel yang dikehendaki (N/n).

Hasil perhitungan untuk mengambil data testing adalah sebagai berikut:

Jumlah populasi (N) = 84

Jumlah data testing = 20% x 83 = 17

Jumlah sampel (n) = 17

Interval Sampling (k) = N/n = 83/ 17 = 5

Unsur pertama yang diambil untuk data testing (s) = 1

Unsur kedua = s + k

Unsur ketiga = s + 2k

Unsur keempat = s + 3k, dan seterusnya hingga unsur ke-n.

32

Dari hasil diatas diperoleh data testing sebanyak 17 data, maka sisanya akan

dijadikan data training sebanyak 67 data karyawan.

Gambar 4.1 Data Training

Gambar 4.2 Data Testing

4.1.3 Proces Validasi Menggunakan RapidMiner

Berikut ini merupakan tahapan-tahapan dalam melakukan penerapan

algoritma C4.5 memakai tool RapidMiner Studio 9.0.

A. Proses Import Data

1. Langkah pertama yaitu membuka aplikasi RapidMiner Studio 9.0, dan akan

muncul loading tampilan awal seperti berikut :

33

Gambar 4.3 Tampilan Awal RapidMiner Studio 9.0

2. Setelah loading selesai lalu akan muncul tampilan menu utama, kemudian

pilih Blank pada start a new project untuk melakukan proses pengolahan

data.

Gambar 4.4 Menu Utama New Project

3. Selanjutnya pada menu operators cari read excel pada kolom pencariannya,

setelah itu geser/tarik read excel kedalam lembar Process.

34

Gambar 4.5 Proses Read Excel

4. Kemudian klik Import Configuration Wizard untuk mengambil dataset

dengan format data exel yang terdapat pada computer.

Gambar 4.6 Proses Import Data Wizard

5. Mengelola Data Training, setelah muncul dataset yang dituju kemudian

pilih pada Sheet berapa data yang diinginkan, lalu next.

35

Gambar 4.7 Import Data Training

6. Pilih hasil keputusan sebagai binominal dan label, sedangkan yang lainnya

sebagai Polinominal dan Atribut. Setalah itu klik Finish.

Gambar 4.8 Data Hasil Keputusan Sebagai Label

36

B. Proses Validation.

1. Klik sembarang di lembar Process, lalu klik menu Edit pilih Insert Building

Block kemudian pilih Nominal Cross Validation lalu klik OK.

Gambar 4.9 Process Validation menggunakan Data Training

2. Setelah muncul Validation pada Process, geser Validation ke kanan lalu

sambungkan kabel Input ke Read Exel satu kabel, Read Exel ke Validation

satu kabel dan Validation ke res empat kabel. Kemudian klik Run.

37

Gambar 4.10 Process Validation

4.2 Pembahasan

4.2.1 Hasil Validasi Menggunakan RapidMiner

Langkah ini akan membandingakan hasil validasi dari data training dan

data testing dengan melihat hasil dari Confusion Matrix dan ROC / AUC (Area

Under Cover).

A. Confusion Matrix

1. Pengukuran Accuracy Dari Data Training

Perhitungan akurasi data training dari 67 data, 30 diklasifikasi prediksi

kompetensi dan ternyata kompetensi, 9 data diprediksi kompetensi tetapi ternyata

tidak kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan

sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai acuracy sebesar

75.00% +/- 12.92% .

38

Gambar 4.11 Pengukuran Accuracy Data Training

2. Pengukuran Precision Dari Data Training

Perhitungan akurasi berdasarkan data precision, 30 diklasifikasi prediksi


tidak kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan

sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai precision

sebesar 79.33% dan positive class : Tidak.

Gambar 4.12 Pengukuran Precision Data Training

3. Pengukuran recall Dari Data Training

Hasil pengukuran data recall dengan 30 diklasifikasi prediksi kompetensi

dan ternyata kompetensi, 9 data diprediksi kompetensi tetapi ternyata tidak

39

kompetensi. 8 data diprediksi tidak kompetensi ternyata kompetensi dan

sebanyak 20 data sesuai diprediksi tidak kompetensi, dengan nilai recall sebesar

71.67% +/- 21.15 %.

Gambar 4.13 Pengukuran recall Data Training

4. Pengukuran Accuracy Dari Data Testing

Perhitungan akurasi data testing yang berjumlah 17 data, 10 data

diklasifikasi prediksi kompetensi dan ternyata kompetensi, 3 data diprediksi

kompetensi tetapi ternyata tidak kompetensi. 1 data diprediksi tidak kompetensi

ternyata kompetensi dan sebanyak 3 data sesuai diprediksi tidak kompetensi,

dengan nilai acuracy sebesar 70.00 % +/- 40.00%.

Gambar 4.14 Pengukuran Accuracy Data Testing

40

5. Pengukuran Precision Dari Data Testing

Perhitungan akurasi berdasarkan data precision, 10 data diklasifikasi

prediksi kompetensi dan ternyata kompetensi, 3 data diprediksi kompetensi tetapi

ternyata tidak kompetensi. 1 data diprediksi tidak kompetensi ternyata

kompetensi dan sebanyak 3 data sesuai diprediksi tidak kompetensi, dengan nilai

precision sebesar 75.00 %.

Gambar 4.15 Pengukuran Precision Dari Data Testing

6. Pengukuran recall Dari Data Testing

Hasil pengukuran data recall dengan 10 data diklasifikasi prediksi


tidak kompetensi, 1 data diprediksi tidak kompetensi ternyata kompetensi dan

sebanyak 3 data sesuai diprediksi tidak kompetensi, dengan nilai recall sebesar

50.00%.

41

Gambar 4.16 Pengukuran recall Dari Data Testing

B. ROC / AUC (Area Under Cover)

Hasil perhitungan divisualisaikan dengan kurva ROC (Receiver Operating

Characteristic) atau AUC (Area Under Curve) optimistic. ROC memiliki tingkat

diagnose yaitu:

a. Akurasi bernilai 0.90 – 1.00 = excellent classification

b. Akurasi bernilai 0.80 – 0.90 = good classification

c. Akurasi bernilai 0.70 – 0.80 = fair classification

d. Akurasi bernilai 0.60 – 0.70 = poor classification

e. Akurasi bernilai 0.50 – 0.60 = failure

1. Kurva ROC/AUC Dari Data Training

Nilai dari kurva ROC (Receiver Operating Characteristic) dari data training

diketahui dari AUC (Area Under Curve) optimistic dengan hasil sebesar 0.900 +/-

0.128 (mikro average: 0.00) serta dengan positive class “TIDAK”, itu berarti hasil

klasifikasi penelitian ini masuk kedalam tingkat diagnose excellent classification.

42

Gambar 4.17 Hasil Kurva ROC/AUC Data Training

Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi

prediksi penilaian karyawan dengan menggunakan data training dibawah ini .

Gambar 4.18 Hasil Pohon Keputusan Data Training

Berdasarkan hasil decision tree dari data training, maka diperoleh rule

untuk klasifikasi prediksi uji kualitas sebagai berikut:

43

Tabel 4.2 Rule Decision Tree Data Trainig

Rule Keterangan Rule

R1 Jika Kt2 ≤ 2.500, Kp3 > 2.500 maka kompetensi

R2

Jika Kt2 ≤ 2.500, Kp3 ≤ 2.500 maka kompetensi, Kt ≤ 3.500 maka

tidak kompetensi

R3

Jika Kt2 ≤ 2.500, Kp3 ≤ 2.500 maka kompetensi, Kt > 3.500 maka

kompetensi

R4 Jika Kt2 > 2.500, Sk1 > 2.500, Kt1 > 2.500 maka kompetensi.

R5 Jika Kt2 > 2.500, Sk1 > 2.500, Kt1 ≤ 2.500 maka tidak kompetensi.

R6 Jika Kt2 > 2.500, Sk1 ≤ 2.500, Kt4 ≤ 2.500 maka tidak kompetensi.

R7 Jika Kt2 > 2.500, Sk1 ≤ 2.500, Kt4 > 2.500 maka kompetensi.

2. Kurva ROC/AUC Dari Data Testing

Nilai dari kurva ROC (Receiver Operating Characteristic) dari data testing

diketahui dari AUC (Area Under Curve) optimistic dengan hasil sebesar 0.750

dengan +/-0.250 (mikro average: 0.750) serta dengan positive class “TIDAK”, itu

berarti hasil klasifikasi penelitian ini masuk kedalam tingkat diagnose fair

classification.

44

Gambar 4.19 Hasil Kurva ROC/AUC Data Testing

Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi

prediksi penilaian karyawan dengan menggunakan data testing dibawah ini .

Gambar 4.20 Hasil Pohon Keputusan Data Testing

Berdasarkan decision tree maka diperoleh rule untuk klasifikasi prediksi uji

kualitas sebagai berikut:

45

Tabel 4.3 Rule Decision Tree Data Testing

Rule Keterangan Rule

R1 Jika Kp1 > 2.500, Kt1 > 2.500 maka Kompetensi.

R2 Jika Kp1 > 2.500, Kt1 ≤ 2.500 maka Tidak Kompetensi.

R3 Jika Kp1 ≤ 2.500 maka Tidak Kompetensi.

4.2.2 Perhitungan Jumlah Kasus Data Keseluruhan, Data Training dan Data

Testing

Data keseluruhan yang digunakan pada penelitian ini sejumlah 84 kasus,

kemudian dilakukan pembagian data menjadi data training sebanyak 67 kasus dan

data testing sebanyak 17 kasus. Berikut hasil perhitungan kasus pada data

keseluruhan.

Tabel 4.4 Jumlah Nilai Atribut Keseluruhan

NO ATRIBUTE VALUE JUMLAH KASUS

(S)

TIDAK (S1)

Kompetensi(S2)

TOTAL 84 35 49

1 Kp1 1 0

Keterampilan 2 29 23 6

3 52 12 40

4 3 0 3

5 0 0 0

84 35 49

2 Kp2 1 6 5 1

Pengetahuan 2 45 22 23

3 33 8 25

4 0 0 0

5 0 0 0

84 35 49

46

3 Kp3 1 5 5 0

Pemahaman 2 45 26 19

3 34 4 30

4 0 0 0

5 0 0 0

84 35 49

4 Sk1 1 0 0 0

Kerjasama 2 32 25 7

3 43 10 33

4 9 0 9

5 0 0 0

84 35 49

5 Sk2 1 0 0 0

Tanggung Jawab 2 25 21 4

3 53 14 39

4 6 0 6

5 0 0 0

84 35 49

6 Sk3 1 0 0 0

Kerajinan 2 30 23 7

3 49 12 37

4 5 0 5

5 0 0 0

84 35 49

7 Sk4 1 16 15 1

Kejujuran 2 39 15 24

3 29 5 24

4 0 0 0

5 0 0 0

84 35 49

8 Sk5 1 17 15 2

Disiplin 2 6 2 4

3 59 18 41

4 2 0 2

5 0 0 0

84 35 49

9 Kt1 1 0 0 0

Kebersihan 2 32 26 6

3 47 9 38

47

4 5 0 5

5 0 0 0

84 35 49

10 Kt2 1 0 0 0

Kecermatan 2 30 25 5

3 52 10 42

4 2 0 2

5 0 0 0

84 35 49

11 Kt3 1 18 15 3

Kecekatan 2 19 9 10

3 38 9 29

4 9 2 7

5 0 0 0

84 35 49

12 Kt4 1 0 0 0

Sumbang Saran 2 34 22 12

3 46 13 33

4 4 0 4

5 0 0 0

84 35 49

13 Kt5 1 0 0 0

Tugas Khusus 2 82 35 47

3 2 0 2

4 0 0 0

5 0 0 0

84 35 49

14 Kt6 1 17 15 2

Citra Perusahaan 2 37 11 26

3 27 9 18

4 3 0 3

5 0 0 0

84 35 49

15 Kt7 1 17 15 2

Kesadaran

Pembiayaan 2 29 9 20

3 37 11 26

4 1 0 1

5 0 0 0

84 35 49

48

Tabel 4.4 memperlihatkan semua kasus pada data keseluruhan berjumlah 84

dengan keputusan TIDAK sebanyak 35 dan keputusan TERIMA sebanyak 49.

Data keseluruhan yang dibagi menjadi data training dan data testing

dihitung kembali jumlah kasusnya, Tabel 4.5 di bawah ini adalah jumlah kasus pada

data training dan data ini akan dijadikan sebagai data sekunder dalam pembuatan

pohon keputusan penilianan karyawan.

Tabel 4.5 Jumlah Kasus Data Training

NO ATRIBUTE VALUE JUMLAH

KASUS (S) TIDAK

(S1) Kompetensi(S2)

TOTAL 67 29 38

1 Kp1 1 0 0 0


3 40 10 30

4 2 0 2

5 0 0 0

67 29 38

2 Kp2 1 6 5 1


3 27 6 21

4 0 0 0

5 0 0 0

67 29 38

3 Kp3 1 5 5 0

Pemahaman 2 35 21 14

3 27 3 24

4 0 0 0

5 0 0 0

67 29 38

4 Sk1 1 0 0 0

Kerjasama 2 26 21 5

49

3 36 8 28

4 5 0 5

5 0 0 0

67 29 38

5 Sk2 1 0 0 0


3 43 11 32

4 3 0 3

5 0 0 0

67 29 38

6 Sk3 1 0 0 0

Kerajinan 2 26 20 6

3 37 9 28

4 4 0 4

5 0 0 0

67 29 38

7 Sk4 1 14 13 1

Kejujuran 2 31 12 19

3 22 4 18

4 0 0 0

5 0 0 0

67 29 38

8 Sk5 1 15 13 2

Disiplin 2 4 1 3

3 47 15 32

4 1 0 1

5 0 0 0

67 29 38

9 Kt1 1 0 0 0

Kebersihan 2 26 21 5

3 37 8 29

4 4 0 4

5 0 0 0

67 29 38

10 Kt2 1 0 0 0

Kecermatan 2 25 21 4

3 41 8 33

4 1 0 1

5 0 0 0

50

67 29 38

11 Kt3 1 16 13 3

Kecekatan 2 13 7 6

3 31 7 24

4 7 2 5

5 0 0 0

67 29 38

12 Kt4 1 0 0 0


3 38 10 28

4 3 0 3

5 0 0 0

67 29 38

13 Kt5 1 0 0 0


3 1 0 1

4 0 0 0

5 0 0 0

67 29 38

14 Kt6 1 15 13 2


3 19 7 12

4 2 0 2

5 0 0 0

67 29 38

15 Kt7 1 15 13 2

Kesadaran

Pembiayaan 2 24 8 16

3 27 8 19

4 1 0 1

5 0 0 0

67 29 38

Tabel 4.6 di bawah ini adalah jumlah kasus pada data testing, yaitu :

51

Tabel 4. 6 Jumlah Kasus Data Testing

NO ATRIBUTE VALUE JUMLAH

KASUS (S) TIDAK

(S1) Kompetensi(S2)

TOTAL 17 6 11

1 Kp1 1 0 0 0


3 12 2 10

4 1 0 1

5 0 0 0

17 6 11

2 Kp2 1 0 0 0


3 6 2 4

4 0 0 0

5 0 0 0

17 6 11

3 Kp3 1 0 0 0

Pemahaman 2 10 5 5

3 7 1 6

4 0 0 0

5 0 0 0

17 6 11

4 Sk1 1 0 0 0

Kerjasama 2 6 4 2

3 7 2 5

4 4 0 4

5 0 0 0

17 6 11

5 Sk2 1 0 0 0


3 10 3 7

4 3 0 3

5 0 0 0

17 6 11

6 Sk3 1 0 0 0

Kerajinan 2 4 3 1

3 12 3 9

52

4 1 0 1

5 0 0 0

17 6 11

7 Sk4 1 2 2 0

Kejujuran 2 8 3 5

3 7 1 6

4 0 0 0

5 0 0 0

17 6 11

8 Sk5 1 2 2 0

Disiplin 2 2 1 1

3 12 3 9

4 1 0 1

5 0 0 0

17 6 11

9 Kt1 1 0 0 0

Kebersihan 2 6 5 1

3 10 1 9

4 1 0 1

5 0 0 0

17 6 11

10 Kt2 1 0 0 0

Kecermatan 2 5 4 1

3 11 2 9

4 1 0 1

5 0 0 0

17 6 11

11 Kt3 1 2 2 0

Kecekatan 2 6 2 4

3 7 2 5

4 2 0 2

5 0 0 0

17 6 11

12 Kt4 1 0 0 0


3 8 3 5

4 1 0 1

5 0 0 0

17 6 11

53

13 Kt5 1 0 0 0


3 1 0 1

4 0

5 0 0 0

17 6 11

14 Kt6 1 2 2


3 8 2 6

4 1 0 1

5 0 0 0

17 6 11

15 Kt7 1 2 2

Kesadaran

Pembiayaan 2 5 1 4

3 10 3 7

4 0 0 0

5 0 0 0

17 6 11

Berdasarkan hasil pengelompokkan dan pengolahan data di atas, dapat

dijelaskan sebagai berikut:

Total data keseluruhan sejumlah 84 kasus yang kemudian digunakan untuk

data training sebanyak 67 kasus dan untuk data testing sebanyak 17 kasus, pada

data keseluruhan jumlah data keahlian kinerja karyawan dengan keputusan TIDAK

sebanyak 35 kasus dan keputusan KOMPETENSI sebanyak 49 kasus.

Pada data training keputusan TIDAK berjumlah 29 kasus dan keputusan

KOMPETENSI berjumlah 38 kasus, sedangkan pada data testing keputusan

TIDAK berjumlah 6 kasus dan keputusan KOMPETEMSI berjumlah 11 kasus.

Keputusan yang telah dihasilkan dapat disimpulkan bahwa pada penelitian ini lebih

banyak keputusan KOMPETENSI daripada keputusan TIDAK.

54

4.2.3 Pemodelan Menggunakan Algoritma C4.5

Dalam penelitian klasifikasi data keahlian karayawan dengan menggunakan

algoritma C4.5, pohon keputusan dibuat berdasarkan hasil perhitungan entropy dan

gain, setelah pohon keputusan terbentuk, langkah selanjutnya mencari rule

berdasarkan cabang pohon keputusan. Berikut akan dibahas langkah-langkah dalam

klasifikasi data keahlian karyawan jadi menggunakan algoritma C4.5 secara manual

dan analisa memakai tools RapidMiner.

Berdasarkan jumlah kasus pada data training untuk keputusan TIDAK

berjumlah 29 kasus dan keputusan KOMPETENSI berjumlah 38 kasus, dan

jumlah TOTAL kasus adalah 67. Setelah diketahui semua kasus yang perlu

dihitung, langkah selanjutnya menghitung Entropy dan Gain dari semua nilai kasus

yang dibagi berdasarkan atribut-atribut yang ditentukan.

A. Node 1 (Root) Atribut Total

Proses perhitungan klasifikasi keahlian karyawan menggunakan Algoritma

C4.5 adalah sebagai berikut :

Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah kasus untuk

keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan perhitungan

gain untuk setiap atribut.

Tabel 4.7 Perhitungan Node 1 (Root)


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO GAIN RATIO

TOTAL 67 29 38 0.986944498

1 Kp1 1 0 0 0 0 0.205942529 0.182867279

55

Keterampilan 2 25 19 6 0.795040279 0.530683955

3 40 10 30 0.811278124 0.444275281

4 2 0 2 0 0.151226543

5 0 0 0 0

67 29 38 1.126185779

2 Kp2 1 6 5 1 0.650022422

0.114575203

0.311742689

0.085711525

Pengetahuan 2 34 18 16 0.997502546 0.496616356

3 27 6 21 0.764204507 0.52839471

4 0 0 0 0

5 0 0 0 0

67 29 38 1.336753755

3 Kp3 1 5 5 0 0

0.276925904

0.279415007

0.21348202

Pemahaman 2 35 21 14 0.970950594 0.489376359

3 27 3 24 0.503258335 0.52839471

4 0 0 0 0 0

5 0 0 0 0 0

67 29 38 1.297186077

4 Sk1 1 0 0

0.302250639

0

0.298821784

Kerjasama 2 26 21 5 0.706274089 0.529953527

3 36 8 28 0.764204507 0.481521057

4 5 5 0 0

5 0 0 0

67 29 38 1.011474583

5 Sk2 1 0 0

0.274992782

0

0.294031742

Tanggung

Jawab 2 21 18 3 0.591672779 0.524615032

3 43 11 32 0.820363643 0.410633593

4 3 0 3 0 0

5 0 0 0

67 29 38 0.935248625

6 Sk3 1 0 0

0.242502596

0

0.241772185

Kerajinan 2 26 20 6 0.779349837 0.529953527

3 37 9 28 0.800392208 0.473067545

4 4 0 4 0 0

5 0 0 0

67 29 38 1.003021072

7 Sk4 1 14 13 1 0

0.316813775

0.471974325

0.209257311 Kejujuran 2 31 12 19 0.962900415 0.5144579

3 22 4 18 0.684038436 0.527559203

4 0 0 0

56

5 0 0 0

67 29 38 1.513991427

8 Sk5 1 15 13 2 0

0.304744057

0.48340267

0.280878399

Disiplin 2 4 1 3 0.811278124 0.242751593

3 47 15 32 0.903453555 0.35881367

4 1 0 1 0 0

5 0 0 0

67 29 38 1.084967934

9 Kt1 1 0 0

0.296922827

0

0.296028504

Kebersihan 2 26 21 5 0.706274089 0.529953527

3 37 8 29 0.753197991 0.473067545

4 4 0 4 0 0

5 0 0 0

67 29 38 1.003021072

10 Kt2 1 0 0 0 0

0.314521138

0

0.326176598

Kecermatan 2 25 21 4 0.634309555 0.530683955

3 41 8 33 0.712064055 0.433582457

4 1 0 1 0 0

5 0 0 0

67 29 38 0.964266412

11 Kt3 1 16 13 3 0

0.437183931

0.493394434

0.29804088

Kecekatan 2 13 7 6 0.995727452 0.459006614

3 31 7 24 0.770629069 0.5144579

4 7 2 5 0 0

5 0 0 0

67 29 38 1.466858947

12 Kt4 1 0 0

0.189252674

0

0.190397818

Sumbang

Saran 2 26 19 7 0.840358672 0.529953527

3 38 10 28 0.831474388 0.464031996

4 3 0 3 0 0

5 0 0 0

67 29 38 0.993985522

13 Kt5 1 0 0

0.012335715

0

0.110228979

Tugas

Khusus 2 66 29 37 0.989375583 0.021371264

3 1 0 1 0 0.090538645

4 0 0 0

5 0 0 0

67 29 38 0.111909909

57

14 Kt6 1 15 13 2 0

0.315558628

0.48340267

0.208501651

Citra

Perusahaan 2 31 9 22 0.869137581 0.5144579

3 19 7 12 0.949452015 0.515598088

4 2 0 2 0 0

5 0 0 0

67 29 38 1.513458658

15 Kt7 1 15 13 2 0

0.304699128

0.48340267

0.197555084

Kesadaran

Pembiayaan 2 24 8 16 0.918295834 0.530552844

3 27 8 19 0.876716289 0.52839471

4 1 0 1 0 0

5 0 0 0

67 29 38

1.542350225

Dari Tabel 4.7 memperlihatkan bahwa pada baris total diketahui jumlah kasus (S)

adalah 67, jumlah keputusan tidak (S1) adalah 29, dan jumlah keputusan terima (S2)

adalah 38. Perhitungan entropy total pada Tabel 4.7 dapat dihitung dengan

menggunakan persamaan sebagai berikut :

Entropy (Total) = (29

67*log2(

29

67))+(

38

67* log2 (

38

67))

Entropy (Total) = 0.986944498

Sementara itu, nilai information gain pada baris daya listrik terpasang

dihitung dengan menggunakan persamaan sebagai berikut :

Gain (Total, Keterampilan)

= Entropy(Total) - ∑|𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛|

|𝑇𝑜𝑡𝑎𝑙|

𝑛

𝑖=1 *Entropy (Keterampilan)

Gain (Keterampilan) = 0.986944498– ((25

67*0.795040279) + (

40

67*0.811278124) +

(2

67*0))

58

Gain (Keteramoilan) = 0.205942529

Kemudian nilai split info pada baris daya listrik terpasang dihitung dengan

persamaan berkut :

𝑆𝑝𝑙𝑖𝑡 𝑖𝑛𝑓𝑜(Keterampilan) = (−(25

67*(log2(

25

67)) +(-(

40

67*(log2(

40

67)) +

(-(2

67*(log2 (

2

67)) = 1.126185779

Setelah split info diketahui langkah terakhir adalah menghitung gain ratio

dengan persamaan sebagai berikut :

𝐺𝑎𝑖𝑛𝑅𝑎𝑡𝑖𝑜(𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛) =𝐺𝑎𝑖𝑛(𝐾𝑒𝑡𝑒𝑟𝑎𝑚𝑝𝑖𝑙𝑎𝑛)

𝑆𝑝𝑙𝑖𝑡𝑖𝑛𝑓𝑜(Keterampilan)=

0.205942529

1.126185779 = 0.182867279

Untuk perhitungan pada atribut-atribut berikutnya sama seperti perhitungan pada

atribut Keterampilan (Kp1). Sehingga diperoleh hasil perhitungan yang ditunjukkan

pada Tabel 4.7. Dari tabel tersebut dapat diketahui bahwa atribut dengan gain ratio

tertinggi adalah Kecermatan (Kt2), yaitu sebesar 0.326176598 dengan demikian

Kecermatan (Kt2) bisa menjadi node akar. Ada tiga nilai atribut dari fasilitas buang

air besar yaitu nilai 2, nilai 3, nilai 4. Dari ketiga nilai tersebut masih memerlukan

perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat digambarkan pohon

keputusan seperti Gambar 4.21.

59

Gambar 4.21 Pohon Keputusan Note 1

B. Node 1.1 Kt2 (Kecermatan) nilai > 2,50

Menghitung jumlah kasus, jumlah kasus untuk keputusan tidak, jumlah

kasus untuk keputusan kompetensi, dan entropy dari semua kasus. Setelah itu,

lakukan perhitungan gain untuk setiap atribut.

Tabel 4.8 Perhitungan Node 1.1


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO

GAIN RATIO

TOTAL 42 8 34 0.70247

1 Kp1 1 0 0 0 0

0.08061

0.079914

Keterampilan 2 9 4 5 0.99108 0.476227

3 31 4 27 0.55478 0.323375

4 2 0 2 0 0.209158

5 0 0 0 0

42 8 34 1.00876

2 Kp2 1 0 0 0 0

0.01514

0

0.015169

Pengetahuan 2 20 5 15 0.81128 0.509709

3 22 3 19 0.57464 0.488654

4 0 0 0 0 0

5 0 0 0 0 0

42 8 34 0.998364

3 Kp3 1 0 0 0 0

0.08395

0

0.086217

Pemahaman 2 17 6 11 0.93667 0.528155

3 25 2 23 0.40218 0.445513

4 0 0 0 0 0

5 0 0 0 0 0

42 8 34 0.973668

4 Sk1 1 0 0 0 0

0.12878

0

0.119544

Kerjasama 2 7 4 3 0.98523 0.430827

3 31 4 27 0.55478 0.323375

4 4 0 4 0 0.323078

5 0 0 0 0 0

42 8 34 1.07728

60

5 Sk2 1 0 0 0 0

0.03069

0

0.057803

Tanggung

Jawab 2 1 0 1 0 0.128389

3 38 8 30 0.74249 0.130638

4 3 0 3 0 0.271954

5 0 0 0 0 0

42 8 34 0.530981

6 Sk3 1 0 0 0 0

0.02271

0

0.025678

Kerajinan 2 5 1 4 0.72193 0.365523

3 34 7 27 0.73354 0.246787

4 3 0 3 0 0.271954

5 0 0 0 0 0

42 8 34 0.884264

7 Sk4 1 0 0 0 0

0.02939

0

0.029588

Kejujuran 2 23 6 17 0.82806 0.475747

3 19 2 17 0.48546 0.5177

4 0 0 0 0 0

5 0 0 0 0 0

42 8 34 0.993447

8 Sk5 1 0 0 0 0

0.02269

0

0.061122

Disiplin 2 3 0 3 0 0.271954

3 39 8 31 0.73207 0.099278

4 0 0 0 0 0

5 0 0 0 0 0

42 8 34 0.371232

9 Kt1 1 0 0 0 0

0.08607

0

0.10571

Kebersihan 2 3 2 1 0.9183 0.271954

3 35 6 29 0.66096 0.219195

4 4 0 4 0 0.323078

5 0 0 0 0 0

42 8 34 0.814227

10 Kt3 1 1 0 1 0 0.06595 0.128389 0.046601

Kecekatan 2 10 4 6 0.97095 0.49295

3 26 3 23 0.51595 0.428305

4 5 1 4 0.72193 0.365523

5 0 0 0 0 0

42 8 34 1.415166

11 Kt4 1 0 0 0.08544 0 0.078037

Sumbang

Saran 2 9 4 5 0.99108 0.476227

3 30 4 26 0.56651 0.346733

4 3 0 3 0 0.271954

5 0 0 0 0 0

42 8 34 1.094914

12 Kt5 1 0 0 0 0 0.00736 0 0.045319

Tugas Khusus 2 41 8 33 0.71206 0.033938

3 1 0 1 0 0.128389

4 0 0 0 0 0

5 0 0 0 0 0

42 8 34 0.162326

13 Kt6 1 0 0 0 0 0.0261 0 0.022023

Citra

Perusahaan 2 25 4 21 0.63431 0.445513

3 15 4 11 0.83664 0.53051

4 2 0 2 0 0.209158

5 0 0 0 0 0

42 8 34 1.18518

14 Kt7 1 0 0 0 0

0.01023

0

0.009067

Kesadaran

Pembiayaan 2 18 3 15 0.65002 0.523882

3 23 5 18 0.75538 0.475747

4 1 0 1 0 0.128389

5 0 0 0 0 0

42 8 34 1.128018

61

Dari Tabel diatas dapat diketahui bahwa atribut dengan gain ratio tertinggi

adalah Sk1 (Kerjasama), yaitu sebesar 0.119544 dengan nilai tersebut bisa

dipastikan menjadi node cabang. Ada 2 nilai atribut Sk1 yaitu > 2,5 dan ≤2,5. Dari

kedua nilai tersebut masih memerlukan perhitungan lebih lanjut. Dan hasil

perhitungan tersebut dapat digambarkan pohon keputusan seperti Gambar 4.22.

Gambar 4.22 Pohon Keputusan Note 1.1

C. Node 1.2 Kt2 (Kecermatan) nilai ≤ 2,50


kasus untuk keputusan terima, dan entropy dari semua kasus. Setelah itu, lakukan

perhitungan gain untuk setiap atribut.

Tabel 4.9 Perhitungan Node 1.2


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO

GAIN RATIO

TOTAL 25 21 4 0.63431

1 Kp1 1 0 0 0 0 0.08786 0

0.093199 Keterampilan 2 16 15 1 0.33729 0.412068

3 9 6 3 0.9183 0.530615

62

4 0 0 0 0 0

5 0 0 0 0

25 21 4 0.942683

2 Kp2 1 6 5 1 0.65002 0.07622 0.494134

0.053417

Pengetahuan 2 14 13 1 0.37123 0.468441

3 5 3 2 0.97095 0.464386

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 1.426961

3 Kp3 1 5 5 0 0 0.16629 0.464386

0.151572

Pemahaman 2 18 15 3 0.65002 0.34123

3 2 1 1 0 0.291508

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 1.097125

4 Sk1 1 0 0 0 0 0.12097 0

0.127201

Kerjasama 2 19 17 2 0.48546 0.300906

3 5 4 1 0.72193 0.464386

4 1 0 1 0 0.185754

5 0 0 0 0 0

25 21 4 0.951046

5 Sk2 1 0 0 0 0 0.06492 0

0.08993

Tanggung

Jawab 2 20 18 2 0.469 0.257542

3 5 3 2 0.97095 0.464386

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 0.721928

6 Sk3 1 0 0 0 0 0.09319 0

0.146912

Kerajinan 2 21 19 2 0.45372 0.211293

3 4 2 2 1 0.423017

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 0.63431

7 Sk4 1 14 13 1 0.37123 0.05661 0.468441

0.041581

Kejujuran 2 8 6 2 0.81128 0.526034

3 3 2 1 0.9183 0.367067

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 1.361542

8 Sk5 1 15 13 2 0.56651 0.12046 0.442179

0.089917

Disiplin 2 1 1 0 0 0.185754

3 8 7 1 0.54356 0.526034

4 1 0 1 0 0.185754

5 0 0 0 0 0

25 21 4 1.339722

9 Kt1 1 0 0 0 0 0.02106 0

0.052358

Kebersihan 2 23 19 4 0.66658 0.110671

3 2 2 0 0 0.291508

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 0.402179

10 Kt3 1 15 13 2 0.56651 0.07002 0.442179 0.044736

Kecekatan 2 3 3 0 0 0.367067

3 5 4 1 0.72193 0.464386

4 2 1 1 1 0.291508

5 0 0 0 0 0

25 21 4 1.565141

11 Kt4 1 0 0 0 0 0.01936 0 0.021407

Sumbang

Saran 2 17 15 2 0.52256 0.378347

3 8 6 2 0.81128 0.526034

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 0.904381

12 Kt5 1 0 0 0 0 0 0 0

Tugas

Khusus 2 25 21 4 0.63431 0

3 0 0 0 0 0

4 0 0 0 0 0

5 0 0 0 0 0

63

25 21 4 0

13 Kt6 1 15 13 2 0.56651 0.00859 0.442179 0.006322

Citra

Perusahaan 2 6 5 1 0.65002 0.494134

3 4 3 1 0.81128 0.423017

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 1.359331

14 Kt7 1 15 13 2 0.56651 0.00859 0.442179 0.006322

Kesadaran

Pembiayaan 2 6 5 1 0.65002 0.494134

3 4 3 1 0.81128 0.423017

4 0 0 0 0 0

5 0 0 0 0 0

25 21 4 1.359331


adalah Kp3 (Pemahaman), yaitu sebesar 0.151572 dengan nilai tersebut bisa

dipastikan menjadi node cabang. Ada 2 nilai atribut Kp3 yaitu > 2,5 dan ≤2,5. Dari

kedua nilai tersebut masih memerlukan perhitungan lebih lanjut. Dan hasil

perhitungan tersebut dapat digambarkan pohon keputusan seperti Gambar 4.23.

Gambar 4.23 Pohon Keputusan Note 1.2

64

D. Node 1.1.1 Sk1 (Kerjasama) nilai > 2,50




Tabel 4.10 Perhitungan Node 1.1.1


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO

GAIN RATIO

TOTAL 41 8 33 0.71206

1 Kp1 1 0 0 0 0

0.12934

0

0.118361

Keterampilan 2 7 4 3 0.98523 0.4354

3 30 4 26 0.56651 0.329752

4 4 0 4 0 0.327566

5 0 0 0 0 0

41 8 33 1.092718

2 Kp2 1 0 0 0 0

0.00869

0

0.009009

Pengetahuan 2 16 4 12 0.81128 0.529776

3 25 4 21 0.63431 0.43518

4 0 0 0 0 0

5 0 0 0 0 0

41 8 33 0.964957

3 Sk2 1 0 0 0 0

0.047

0

0.063951

Tanggung

Jawab 2 2 1 1 1 0.212564

3 35 7 28 0.72193 0.194864

4 4 0 4 0 0.327566

5 0 0 0 0 0

41 8 33 0.734993

4 Sk3 1 0 0 0 0

0.10755

0

0.094266

Kerajinan 2 8 4 4 1 0.46001

3 29 4 25 0.57879 0.353355

4 4 0 4 0 0.327566

5 0 0 0 0 0

41 8 33 1.140931

5 Sk4 1 0 0 0 0

0.0266

0

0.026892

Kejujuran 2 23 6 17 0.82806 0.467848

3 18 2 16 0.50326 0.521397

4 0 0 0 0 0

5 0 0 0 0 0

41 8 33 0.989245

6 Sk5 1 0 0 0 0

0.0239

0

0.053738

Disiplin 2 2 0 2 0 0.212564

3 38 8 30 0.74249 0.101603

4 1 0 1 0 0.130672

5 0 0 0 0 0

41 8 33 0.444839

7 Kt1 1 0 0 0 0

0.12439

0

0.122379

Kebersihan 2 7 4 3 0.98523 0.4354

3 31 4 27 0.55478 0.304976

4 3 0 3 0 0.276043

5 0 0 0 0 0

41 8 33 1.016419

8 Kt3 1 1 0 1 0

0.01646

0

0.014747

Kecekatan 2 4 1 3 0.81128 0.327566

3 29 5 24 0.6632 0.353355

4 7 2 5 0.86312 0.4354

5 0 0 0 0 0

65

41 8 33 1.116321

9 Kt4 1 0 0 0 0

0.02542

0

0.02646

Sumbang

Saran 2 6 1 5 0.65002 0.405745

3 32 7 25 0.75788 0.279065

4 3 0 3 0 0.276043

5 0 0 0 0 0

41 8 33 0.960853

10 Kt5 1 0 0 0 0

0.00774

0

0.046812

Tugas

Khusus 2 40 8 32 0.72193 0.034755

3 1 0 1 0 0.130672

4 0 0 0 0 0

5 0 0 0 0 0

41 8 33 0.165427

11 Kt6 1 0 0 0 0

0.02145

0

0.018579

Citra

Perusahaan 2 26 6 20 0.77935 0.416705

3 13 2 11 0.61938 0.525426

4 2 0 2 0 0.212564

5 0 0 0 0 0

41 8 33 1.154695

12 Kt7 1 0 0 0 0

0.03752

0

0.033085

Kesadaran

Pembiayaan 2 22 6 16 0.84535 0.481918

3 18 2 16 0.50326 0.521397

4 1 0 1 0 0.130672

5 0 0 0 0 0

41 8 33 1.133987


adalah Kt1 (Kebersiahan), yaitu sebesar 0.12238 dengan nilai tersebut bisa

dipastikan menjadi node cabang. Ada 2 nilai atribut Kp3 yaitu > 2,5 dan ≤2,5. Dari

kedua nilai tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga

tidak memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat

digambarkan pohon keputusan seperti Gambar 4.24.

66

Gambar 4.24 Pohon Keputusan Note 1.1.1

E. Node 1.1 Sk1 (Kerjasama) nilai ≤ 2,50




Tabel 4.11 Perhitungan Node 1.1.1.1


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO

GAIN RATIO

TOTAL 26 21 5 0.70627

1 Kp1 1 0 0 0 0

0.00663

0

0.00745

Keterampilan 2 18 15 3 0.65002 0.367279

3 8 6 2 0.81128 0.523212

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0.890492

2 Kp2 1 6 5 1 0.65002

0.0272

0.488187

0.023861

Pengetahuan 2 18 14 4 0.7642 0.367279

3 2 2 0 0 0.284649

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.140116

3 Sk2 1 0 0 0 0

0.08626

0

0.102647

Tanggung

Jawab 2 19 17 2 0.48546 0.330682

3 7 4 3 0.98523 0.509677

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0.840359

4 Sk3 1 0 0 0 0 0.06419

0

0.072087 Kerajinan 2 18 16 2 0.50326 0.367279

3 8 5 3 0.95443 0.523212

67

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0.890492

5 Sk4 1 14 13 1 0.37123

0.10291

0.480892

0.072494

Kejujuran 2 8 6 2 0.81128 0.523212

3 4 2 2 1 0.415452

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.419556

6 Sk5 1 15 13 2 0.56651

0.11491

0.457817

0.090319

Disiplin 2 2 1 1 0 0.284649

3 9 7 2 0.7642 0.529794

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.27226

7 Kt1 1 0 0 0 0

0.08626

0

0.102647

Kebersihan 2 19 17 2 0.48546 0.330682

3 7 4 3 0.98523 0.509677

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0.840359

8 Kt3 1 15 13 2 0.56651

0.06157

0.457817

0.048394

Kecekatan 2 9 6 3 0.9183 0.529794

3 2 2 0 0 0.284649

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.27226

9 Kt4 1 0 0 0 0

0.11474

0

0.147224

Sumbang

Saran 2 20 18 2 0.469 0.291163

3 6 3 3 1 0.488187

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0.77935

10 Kt5 1 26 21 5 0.70627

0

0

0

Tugas

Khusus 2 0 0 0 0 0

3 0 0 0 0 0

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 0

11 Kt6 1 15 13 2 0.56651

0.04272

0.457817

0.030437

Citra

Perusahaan 2 5 3 2 0.97095 0.457406

3 6 5 1 0.65002 0.488187

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.40341

12 Kt7 1 15 13 2 0.56651

0.06157

0.457817

0.048394

Kesadaran

Pembiayaan 2 2 2 0 0 0.284649

3 9 6 3 0.9183 0.529794

4 0 0 0 0 0

5 0 0 0 0 0

26 21 5 1.27226


adalah Kt4 (Sumbang Saran), yaitu sebesar 0.14722 dengan nilai tersebut bisa

dipastikan menjadi node cabang. Ada 2 nilai atribut Kt4 yaitu > 2,5 dan ≤2,5. Dari

kedua nilai tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga

68

tidak memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat


Gambar 4.25 Pohon Keputusan Note 1.1.1.1

F. Node 1.2.1 Kp3 (Pemahaman) nilai ≤ 2,50




Tabel 4.12 Perhitungan Node 1.2.1


(S)

TIDAK (S1)

Kompetensi (S2)

ENTROPY

GAIN TOTAL

SPLIT INFO

GAIN RATIO

TOTAL 40 26 14 0.93407

1 Kp1 1 0 0 0 0

0.07579

0

0.077044

Keterampilan 2 23 18 5 0.75538 0.459061

3 17 8 9 0.9975 0.524648

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 0.983708

2 Kp2 1 6 5 1 0.65002

0.02097

0.410545

0.018691

Pengetahuan 2 29 18 11 0.95755 0.336362

3 5 3 2 0.97095 0.375

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 1.121906

69

3 Sk2 1 0 0 0 0

0.12712

0

0.102973

Tanggung

Jawab 2 20 16 4 0.72193 0.5

3 18 10 8 0.99108 0.518401

4 2 0 2 0 0.216096

5 0 0 0 0 0

40 26 14 1.234498

4 Sk3 1 0 0 0 0

0.06337

0

0.066396

Kerajinan 2 25 19 6 0.79504 0.423795

3 15 7 8 0.99679 0.530639

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 0.954434

5 Sk4 1 15 13 2 0.56651

0.11746

0.530639 0.080933

Kejujuran 2 19 11 8 0.98194 0.51015

3 6 2 4 0.9183 0.410545

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 1.451334

6 Sk5 1 15 13 2 0.56651

0.12325

0.530639

0.09124

Disiplin 2 4 1 3 0.81128 0.332193

3 21 12 9 0.98523 0.488046

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 1.350877

7 Kt3 1 16 14 2 0.54356

0.20424

0.528771 0.113441

Kecekatan 2 13 8 5 0.96124 0.526984

3 8 4 4 1 0.464386

4 3 0 3 0 0.280272

5 0 0 0 0 0

40 26 14 1.800413

8 Kt5 1 0 0 0 0

0

0 0

Tugas

Khusus 2 40 26 14 0.93407 0

3 0 0 0 0 0

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 0

9 Kt6 1 15 13 2 0.56651

0.11526

0.530639

0.073012

Citra

Perusahaan 2 13 8 5 0.96124 0.526984

3 12 5 7 0.97987 0.52109

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 1.578712

10 Kt7 1 15 13 2 0.56651

0.16006

0.530639 0.101756

Kesadaran

Pembiayaan 2 11 8 3 0.84535 0.512187

3 14 5 9 0.94029 0.530101

4 0 0 0 0 0

5 0 0 0 0 0

40 26 14 1.572926


adalah Kt3 (Kecekatan), yaitu sebesar 0.11344 dengan nilai tersebut bisa dipastikan

menjadi node cabang. Ada 2 nilai atribut Kt3 yaitu > 3,5 dan ≤3,5. Dari kedua nilai

tersebut sudah didapatkan hasil akhir dari pohon keputusan sehingga tidak

70

memerlukan perhitungan lebih lanjut. Dan hasil perhitungan tersebut dapat


Gambar 4.26 Pohon Keputusan Note 1.2.1

4.2.4 Akurasi Prediksi

Pada tahap ini akan dilakukan proses klasifikasi dengan RapidMiner

menggunakan algoritma decision tree C4.5 pada memprediksi keahlian kinerja

karyawan untuk membandingkan data training dengan data testing yang sudah

diketahui rule-rulenya. Berikut adalahnya langkah-langkahnya :

Pada tampilan process masukan operator Read Excel masukan masing-

masing data training dan data testing, selanjutnya masukan operator Decision Tree,

Apply Model, dan Performance dan sambungkan kabel seperti gambar dibawah ini.

71

Gambar 4.27 Proses Akurasi Data Training Data Testing

Gambar 4.28 Hasil Akurasi Data accuracy

Hasil pengukuran data accuracy yang diperoleh dari data testing mencapai

82.35%. Dari data tersebut diketahui prediksi Kompetensi dengan true

Kompetensi mencapai 9 pipa dan true Tidak Kompetensi sebanyak 1 pipa, dengan

pencapaian class precision 90.00%. Sedangkan untuk prediksi Tidak Kompetensi

dengan true Kompetensi sebanyak 2 pipa dan untuk true Tidak Kompetensi

mencapai 5 pipa dengan pencapaian class precision 71.42%. Untuk class recall

72

dengan true Kompetensi mencapai 81.82% sedangkan untuk class recall dengan

true Tidak Kompetensi mencapai 83.33%.

Berikut hasil data data testing dan data training pada RapidMiner dapat

dilihat pada gambar di bawah ini.

Gambar 4.29 Hasil Prediksi RapidMiner

Hasil penerapan data testing terhadap data training sebagai berikut :

Jumlah data testing : 17

Jumlah data yang diprediksi benar : 15

Jumlah data yang diprediksi salah : 2

73

BAB V

PENUTUP

5.1 Kesimpulan

Berdasarkan dari hasil penelitian yang dilakukan di PT Yanmar Indonesia,

maka penulis dapat menarik kesimpulan sebagai berikut:

1. Evaluasi hasil klasifikasi dalam prediksi kompetensi menggunakan data

training dengan Confusion Matrix tingkat akurasi sebesar 75.00% dan data

testing tingkat akurasi sebesar 70.00 %. Jika melihat dengan kurva ROC

menggunakan data training dengan akurasi Exellent Clasification sebesar

0.900 dan data testing dengan akurasi Fair Clasification sebesar 0.750.

5.2 Saran

Berdasarkan hasil penelitian agar penelitian ini terus berkembang, berikut

saran-saran yang dapat dijadikan pertimbangan untuk menyempurnakan penelitian

selanjutnya antara lain:

1. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan

metode lain maupun komparasi seperti Naïve Bayes, Neural Network dan

lain sebagainya agar memperoleh perbandingan dengan tingkat akurasi

yang paling tinggi dalam membuat kualifikasi prediksi kompetensi

karyawan.

2. Perlu adanya aplikasi yang dikhususkan untuk memprediksi keahlian

karyawan supaya mempermudah pengimputan, pencarian data karyawan

dan lebih akuratnya data penilaian yang didapat.

74

DAFTAR PUSTAKA

A.A. Anwar Prabu Mangkunegara, (2013), Manajemen Sumber Daya Manusia Perusahaan. Bandung: PT. Remaja Rosda Karya.

Asri Laksmi Riani,M (2011). Perspeksi Kompensasi. Surakarta : Yuma Pustaka

Eko, Widodo Suparno. (2015). Manajemen Pengembangan Sumber Daya Manusia. Yogyakarta: PUSTAKA PELAJAR

Fahmi. (2014) Pengantar Manajemen Keuangan. Bandung : Alfabeta

F Larose, D.T. (2005). Discovering Knowledge in Data: An Introduction to Data Mining. John Willey & Sons, Inc.

Hasibuan, S.P. Malayu, (2012). Manajemen Sumber Daya Manusia. Jakarta: PT.Bumi Aksara.

Munir, R. (2016). Matematika Diskrit. Bandung: Informatika Bandung.

Oktaviana, A. R. (2016). Penerapan Data Mining Klasifikasi Pola Nasabah Menggunakan Algoritma C4.5 Pada Bank Bri Batang. Batang.

Santosa, B. (2007). Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta.

Sedarmayanti. (2011). Manajemen Sumber Daya Manusia, Reformasi Birokrasi dan Manajemen Pegawai Negeri sipil (ceteakan kelima) Bandung :PT Refika Aditama

Sunge, A. S. (2018). Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 ( Studi Kasus : Pt Hankook Tire Indonesia ), 2018(Sentika), 23–24.

Suyanto. (2017). Data Mining Untuk Klasifikasi dan Klasifikasi Data. SpringerReference. Bandung: http//doi.org/10.107/SpringerReference_5414

75

Vulandari, R. T. (2017). Data Mining Teori dan Aplikasi RapidMiner. Yogyakarta: Penerbit Gava Media.

Wahyuni, S. (2017). Implementation of Data Mining to Analyze Drug Cases Using C4.5 Decision Tree. IOP Conf. Series: Journal of Physics: Conf. Series 970 (2018) 012030

Wicaksana, I Wayan Simri, D. (2013). Belajar Data Mining Dengan RapidMiner. (pp. 41–42). Jakarta. Retrieved from https://kupdf.net/download/buku-data-mining-libre_58fb8553dc0d60713b959e9c_pdf#

https://kupdf.net/download/buku-data-mining-libre_58fb8553dc0d60713b959e9c_pdf

https://kupdf.net/download/buku-data-mining-libre_58fb8553dc0d60713b959e9c_pdf

76

LAMPIRAN

Lampiran 1

SKOR DAN DISTRIBUSI RATING

Kelompok Kerja : Operator

No Nama NIK Bagian Kemampuan Sikap Kontribusi

Keterangan Kp1 Kp2 Kp3 Sk1 SK2 Sk3 Sk4 Sk5 Kt1 Kt2 Kt3 Kt4 Kt5 Kt6 Kt7

1 Agung Widodo 13041 Casting

Engineering

3

3

3

3

3

3

3

3

3

3

3

3

3

3

3 Kompetensi

2 Nurlatif 13053 Casting

Engineering

3

3

3

4

4

4

3

3

4

3

3

4

3

4

4 Kompetensi

3 Fajar S. 14196 Casting

Engineering

2

2

2

3

3

2

2

3

2

2

3

3

2

3

3 Tidak

4 Fathdli Aziz 15257 Casting

Engineering

3

2

2

2

3

3

2

2

3

3

2

3

2

3

3 Kompetensi

5 M Kamil 13028 QA

4

3

3

4

4

4

3

3

4

4

3

4

2

3

3 Kompetensi

6 Firman M 13045 QA

3

3

3

4

4

4

3

3

4

4

3

4

2

3

3 Kompetensi

7 Fuji Rahayu 13089 QA

3

3

3

3

3

3

3

3

3

3

3

3

2

2

3 Kompetensi

8 M Safik 14148 QA

3

3

3

4

3

3

3

3

4

3

3

3

2

2

3 Kompetensi

9 M Ridho 14175 QA

3

3

3

3

3

3

3

3

3

3

3

3

2

2

3 Kompetensi

10 Ani Yunike F 15208 QA

3

3

3

3

3

3

3

3

3

3

3

3

2

2

3 Kompetensi

11 Sholid Danar W. 17498 QA

2

3

3

2

3

3

3

3

3

3

3

3

2

2

3 Tidak

12 Dede Setiyadi 17547 QA

2

2

2

2

3

3

3

3

3

3

2

3

2

2

3 Tidak

77

13 Dhika Varhana 17546 QA

2

2

2

2

3

3

3

3

3

3

2

3

2

2

3 Kompetensi

14 Gunawan 13034 Inspection

3

3

3

4

4

4

3

3

4

3

3

4

2

3

3 Tidak

15 M . Firdaus 13070 Inspection

3

2

2

2

2

2

2

3

2

3

2

2

2

2

2 Kompetensi

16 Muhadin 14137 Inspection

3

2

2

3

3

2

2

3

3

3

3

3

2

3

3 Kompetensi

17 Yogi Ari Prabowo 14179 Inspection

3

3

3

3

3

3

3

3

3

3

3

3

2

3

3 Tidak

18 Wawan Susanto 15233 Inspection

3

2

2

2

2

2

3

3

2

2

2

2

2

2

2 Tidak

19 Sutanto 15303 Inspection

3

2

2

2

2

2

2

1

2

2

1

2

2

1

1 Tidak

20 Idi Suryadi 13030 Inspection

3

2

3

4

4

3

3

3

3

3

3

3

2

3

3 Kompetensi

21 Iwan Kurniawan 15242 Inspection

3

2

2

3

3

3

2

3

3

3

3

3

2

3

3 Kompetensi

22 Ikhwan Ansori 15300 Inspection

3

2

2

3

3

3

2

3

3

3

3

3

2

4

3 Kompetensi

23 Dede Nur A 13082 Inspection

3

3

3

4

3

4

3

4

2

2

3

3

2

3

3 Kompetensi

24 Firman 14172 Inspection

2

2

2

3

3

2

3

3

3

3

3

3

2

3

3 Kompetensi

25 Ainur Rohman 14195 Inspection

3

3

3

3

3

3

3

3

3

3

3

3

2

3

3 Kompetensi

26 Feri Irmawan 15299 Inspection

3

2

2

2

3

3

2

3

3

3

2

2

2

3

3 Tidak

27 Darmanto 15295 Inspection

3

2

2

2

3

3

2

3

3

3

2

2

2

3

3 Tidak

28 Khaerul Anwar 15302 Inspection

3

3

2

2

2

2

2

2

2

2

2

3

2

3

3 Tidak

29 A Mushonnif 15254 Inspection

3

3

2

3

3

3

2

2

3

3

2

3

2

3

3 Kompetensi

30 Casmono 15281 Inspection

3

3

3

3

3

3

2

3

3

3

2

3

2

3

3 Kompetensi

31 Ibnu Khamdun 15290 Inspection

3

3

3

2

2

2

2

3

2

2

3

3

2

3

3 Tidak

78

32 Ahmad Mushonnif 15254 Inspection

3

3

3

3

3

3

2

3

3

3

3

3

2

4

3 Kompetensi

33 Imam Ismail 15400 Inspection

2

2

2

3

3

3

2

3

2

2

3

3

2

3

3 Tidak

34 Anjar Probowo 15405 Inspection

2

2

2

3

3

2

2

3

3

3

3

3

2

3

3 Kompetensi

35 Eka Maulana 16448 Inspection

4

2

2

4

3

3

3

4

3

3

3

3

2

3

3 Kompetensi

36 Munawar Abdul G. 16450 Inspection

3

2

2

2

3

3

2

3

3

3

2

2

2

3

3 Tidak

37 MuhammadGunawan 16451 Inspection

2

2

2

2

3

3

2

3

3

3

2

2

2

3

3 Tidak

38 Ady Falistyo 16453 Inspection

3

2

2

2

2

2

2

2

2

2

2

3

2

3

3 Tidak

39 Muhamad Sulaeman 17515 Inspection

3

2

2

3

3

3

2

2

3

3

2

3

2

3

3 Kompetensi

40 Andrianto Nugroho 17541 Inspection

3

2

2

3

3

3

2

2

3

3

2

3

2

3

3 Kompetensi

41 Septiadi Nugroho 13084 Inspection

4

3

3

3

3

3

3

3

3

3

3

2

2

2

2 Kompetensi

42 Muhajir 13085 Inspection

3

3

2

3

2

3

2

3

3

3

3

2

2

2

2 Tidak

43 Harin Nugroho 14132 Inspection

3

3

3

3

3

3

2

3

3

3

3

2

2

2

2 Kompetensi

44 Tirwan 15296 Inspection

3

3

3

3

3

3

2

3

3

3

1

3

2

2

2 Kompetensi

45 Rasta Kustanto 15297 Inspection

3

2

2

3

3

3

2

3

2

3

2

2

2

2

2 Tidak

46 Eli Waluya 15246 Inspection

3

2

2

2

2

3

2

3

2

2

2

2

2

2

2 Tidak

47 Eko Sarwoko 15284 Inspection

3

2

3

3

3

3

2

3

3

3

3

3

2

2

2 Kompetensi

48 Eka Syarif H 15285 Inspection

3

2

3

3

3

3

2

3

3

3

3

3

2

2

2 Kompetensi

49 M Rizman 15243 Inspection

3

3

2

3

3

3

2

3

2

3

2

2

2

2

2 Tidak

50 Ade Windarto 13043 Inspection

3

3

3

3

3

3

3

3

3

3

3

3

2

2

2 Kompetensi

79

51 Yan Afrianto 13083 Inspection

3

3

2

3

2

2

3

3

3

2

3

3

2

2

2 Tidak

52 Hendy Apriandi 14126 Inspection

3

3

3

3

3

3

3

3

3

3

3

2

2

2

2 Kompetensi

53 Abdul Wahid 14183 Inspection

3

2

3

3

3

3

3

3

3

3

4

2

2

2

2 Kompetensi

54 Andik Purnomo 15301 Inspection

3

2

3

3

3

3

3

3

3

3

3

3

2

2

2 Kompetensi

55 Ibnu Solihin 15308 Inspection

3

2

2

3

3

2

3

3

2

3

4

3

2

2

2 Kompetensi

56 Tovik Nur Cahyo 15228 Inspection

3

2

3

3

3

3

3

3

3

3

4

3

2

2

2 Kompetensi

57 Ricky Setianto 15253 Inspection

3

3

2

3

3

3

2

3

2

2

4

3

2

2

2 Kompetensi

58 Dwi Maryanto 15289 Inspection

3

3

3

3

3

3

3

3

3

2

2

2

2

2

2 Kompetensi

59 M. Ikbal 15294 Inspection

3

2

2

3

3

3

2

3

3

3

4

3

2

2

2 Kompetensi

60 Purnomo Wibowo 15395 Inspection

3

3

3

3

3

3

2

3

3

3

3

3

2

2

2 Kompetensi

61 Agung Purbo Wibowo

15396 Inspection

3

3

2

3

3

2

2

3

3

2

3

3

2

2

2 Tidak

62 Sandi Ahmadi 16451 Inspection

3

3

3

3

3

3

2

3

3

3

3

2

2

2

2 Kompetensi

63 Gusman Mustaqim 16452 Inspection

3

2

3

3

3

3

2

3

3

3

4

2

2

2

2 Kompetensi

64 Agus Peloni 16454 Inspection

2

2

2

3

3

3

2

3

3

3

3

3

2

2

2 Tidak

65 Ginanjar Fatur R. 17492 Inspection

2

2

2

3

3

2

2

3

2

3

4

3

2

2

2 Tidak

66 Syamsul Rizal 17514 Inspection

2

2

3

3

3

3

2

3

3

3

4

3

2

2

2 Kompetensi

67 Nasrullah 17540 Inspection

2

2

2

3

3

3

2

3

2

2

4

3

2

2

2 Tidak

68 Riyanto 17566 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

69 Endang 17567 Inspection

2

1

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

80

70 Dianto 17568 Inspection

2

1

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

71 Abdul Jabar 17569 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

72 Ngudianto 17570 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

73 Beby Rahmad Aprianto

17571 Inspection

2

2

1

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

74 Nizar Aminudin 17572 Inspection

2

2

1

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

75 Iwan Indra Kusuma 17573 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

76 Angga Suhardi 17574 Inspection

2

2

1

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

77 Anggiat 17575 Inspection

2

1

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

78 Prihatno 17576 Inspection

2

1

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

79 Nur Handiq 17577 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

80 Andi Suranto 17578 Inspection

2

2

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

81 Mokhamad Solikhun 17579 Inspection

2

1

2

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

82 Muhamad Parhan 17580 Inspection

2

1

1

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

83 Dziky Dzikrullah 17581 Inspection

2

2

1

2

2

2

1

1

2

2

1

2

2

1

1 Tidak

Catatan Kp1 Pengetahuan Sk1 Tanggung Jawab Kt1 Kecermatan Kt6 Kesadaran Pembiayaan

Kp2 Keterampilan Sk2 Kerjasama Kt2 Kebersihan Kt7 Citra Perusahaan

Kp3 Pemahaman Sk3 Kerajinan Kt3 Kecekatan

Sk4 Disiplin Kt4 Tugas Khusus

Sk5 Kejujuran Kt5 Sumbangan

81

DAFTAR RIWAYAT HIDUP

DATA DIRI

Nama : Mustafa Kamil

Tempat, tanggal lahir : Jakarta, 13 Juli 1994

Jenis Kelamin : Laki-laki

Agama : Islam

Status Pernikahan : Belum Menikah

Nama Ayah : Alzubir Efendi

Nama Ibu : Tati Sundari

Alamat : Kp. Cikarang Girang Rt 02/01 Desa Jayamulya Kec.Serang

Baru Kab. Bekasi

RIWAYAT PENDIDIKAN

1. SDN Cibarusah Jaya 03 Tahun 2000-2004

2. SDN Cilangkap 05 Petang Tahun 2004-2007

3. SMPN 196 Jakarta Tahun 2007-2008

4. SMPN 04 Cibarusah Tahun 2008-2010

5. SMK 1 Cibarusah Tahun 2010-2013

6. STT Pelita Bangsa Tahun 2014-2018

82

Documents

PENERAPAN ALGORITMA C4.5 UNTUK MEMPREDIKSI …