UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
PRAKTIKUM 3
ANALISA CLUSTER
Definisi Cluster
Analisis cluster merupakan pengelompokan objek berdasarkan informasi yang diperoleh dari suatu
data yang menjelaskan hubungan antar objek satu dengan objek lainnya. Tujuannya untuk
mengelompokan objek yang memiliki kesamaan karakteristik dengan objek lainnya dalam satu
kelompok dan memiliki perbedaan karakteristik dengan objek kelompok lain ( Steinbach et al,
2006)
Tujuan Praktikum Cluster
1. Mahasiswa mempunyai pengetahuan dan kemampuan dasar dalam melakukan dan
menerapkan analisis Cluster
2. Mahasiswa dapat mengetahui dan memahami arti dan garis besar dari analisis Cluster
dalam data mining, mulai dari pengambilan data, pengolahan data sampai dengan tahap
pengelompokan, serta mengaplikasikannya dalam kasus yang dihadapi.
Knowledge Discovery in Database (KDD) dan Data Mining
Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika,
kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi
pengetahuan potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar.
(Turban et al, 2005 ). Knowledge discovery in database (KDD) adalah keseluruhan proses non-
trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan
bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.Istilah data mining dan Knowledge
Discovery in Database (KDD) sering kali digunakan secara bergantian untuk menjelaskan proses
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
penggalian informasi tersembunyi dalam suatu basis data yang besar. Sebenarnya kedua istilah
tersebut memiliki konsep yang berbeda, tetapi berkaitan satu sama lain. Dan salah satu tahapan
dalam keseluruhan proses KDD adalah data mining. Proses KDD secara garis besar dapat
dijelaskan sebagai berikut (Fayyad, 1996).
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap
penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk
proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data
yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan
cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti
data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan
sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data
mining sangat bervariasi. Pemilihan metode dan algoritma yang tepat sangat bergantung
pada tujuan dan proses KDD secara keseluruhan. Dalam modul ini kita menggunakan salah
satu teknik data mining yaitu cluster.
5. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk
yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari
proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola
atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada
sebelumnya.
Konsep Cluster
Dalam konteks memahami data, cluster mampu mengelompokan data dan analisis cluster
merupakan ilmu yang secara teknis dapat mengelompokan data secara otomatis. Sebagai contoh,
anak-anak dapat dengan cepat mengelompokan jenis gambar seperti gambar bangunan, tumbuhan,
hewan, dan lainnya. (Michael et al, 2006)
Ada beberapa tahapan dalam malekukan Analisis Cluster, diantaranya yaitu:
1. Tujuan Analisis Cluster
2. Desain Penelitian dalam Analisis Cluster
3. Asumsi-asumsi dalam Analisis Cluster
4. Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall fit)
5. Interpretasi terhadap Cluster.
6. Proses Validasi dan Pembuatan Profil (profiling) Cluster
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Penerapan analisis Cluster di dalam pemasaran adalah sebagai berikut :
1. Identifikasi obyek (Recognition) :
Dalam bidang image Processing , Computer Vision atau robot vision
2. Decission Support System dan data mining
• Membuat segmen pasar (segmenting the market).
• Memahami perilaku pembeli.
• Mengenali peluang produk baru
Tahap-tahap dalam Analisis Cluster
Ada beberapa tahapan dalam malekukan Analisis Cluster, diantaranya yaitu:
Tahap Pertama : Tujuan Analisis Cluster
Tujuan utama analisis Cluster adalah memisahkan suatu himpunan objek menjadi dua kelompok
atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya.
Sedangkan tujuan analisis Cluster secara khusus, antara lain:
▪ Penyederhanaan Data
Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas
observasi/objek dapat dikelompokkan untuk analisis selanjutnya.
▪ Identifikasi Hubungan (Relationship Identification)
Hubungan antar objek diidentifikasi secara empiris. Struktur analisis Cluster yang sederhana
dapat menggambarkan adanya hubungan atau kesamaan dan perbedaan yang tidak dinyatakan
sebelumnya.
▪ Pemilihan pada Pengelompokan Variabel
Tujuan analisis Cluster tidak dapat dipisahkan dengan pemilihan variabel yang digunakan
untuk menggolongkan objek ke dalam clucter-Cluster. Cluster yang terbentuk merefleksikan
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
struktur yang melekat pada data seperti yang didefinisikan oleh variabel-variabel. Pemilihan
variabel harus sesuai dengan teori dan konsep yang umum digunakan dan harus rasional.
Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian sebelumnya. Variabel-
variabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang akan
dikelompokkan dan secara spesifik harus sesuai dengan tujuan analisis Cluster.
Tahap Kedua : Desain Penelitian dalam Analisis Cluster
2 hal penting dalam tahap ini adalah pendeteksian outlier dan mengukur kesamaan.
• Pendeteksian Outliers
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outliers dapat terjadi
karena:
a. Observasi ‘menyimpang’ yang tidak mewakili populasi
b. Suatu undersampling kelompok-kelompok dalam populasi yang menyebabkan
underrepresentation kelompok-kelompok dalam sampel
Dalam kedua kasus tersebut, outliers dapat mengubah struktur sebenarnya dalam populasi
sehingga kita akan memperoleh Cluster-Cluster yang tidak sesuai dengan struktur sebenarnya
dari populasi tersebut dan tidak representatif.
• Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang sangat penting dalam analisis Cluster. Kesamaan antar
objek merupakan ukuran kedekatan antar objek. Kesamaan dapat diketahui dengan melakukan
pengukuran jarak antar setiap individu. Ukuran jarak merupakan ukuran ketidakmiripan,
dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya jarak yang pendek/kecil
menunjukkan bahwa suatu objek makin mirip dengan objek lain.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Gambar 1. Ilustrasi Pengukuran jarak
Metode untuk mengukur kesamaan obyek antara lain :
1). Euclidean Distance
Jarak euclidean antara dua titik i dan j merupakan sisi miring (sisi terpanjang) dari segitiga
ABC.
𝐷(𝑖, 𝑗) = √𝐴2 + 𝐵2 = √∑(𝑋𝑖 − 𝑌𝑖)2 = √(𝑋1𝑖 − 𝑋1𝑗)2+(𝑋2𝑖 − 𝑋2𝑗)2
2). Squared Euclidean Distance
Merupakan pengukuran kuadrat jarak euclidean antara dua titik i dan j.
𝐷(𝑖, 𝑗) = 𝐴2 + 𝐵2 = ∑(𝑋𝑖 − 𝑌𝑖)2 = (𝑋1𝑖 − 𝑋1𝑗)2+(𝑋2𝑖 − 𝑋2𝑗)2
3). Chebychev
D(X,Y)= 𝑚𝑎𝑥𝑖|𝑋𝑖 − 𝑌𝑖|
4). City Block Distance
D(X,Y)= ∑|𝑋𝑖 − 𝑌𝑖|
D(I,j) = |𝐴| + |𝐵| = ∑|𝑋𝑖 − 𝑌𝑖| = |𝑋1𝑖 − 𝑋1𝑗| + |𝑋2𝑖 − 𝑋2𝑗|
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster
Seperti hal teknik analisis lain,analisis Cluster juga menetapkan adanya suatu asumsi. Ada dua
asumsi dalam analisis Cluster, yaitu :
a. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh sekelompok sampel.
Sampel yang digunakan dalam analisis ckuster harus dapat mewakili populasi yang ingin
dijelaskan, karena analisis ini baik jika sampel representatif. Jumlah sampel yang diambil
tergantung penelitinya, seorang peneliti harus yakin bahwa sampel yang diambil representatif
terhadap populasi.
b. Pengaruh Multikolinieritas
Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan dalam analisis
Cluster karena hal itu berpengaruh, sehingga variabel-variabel yang bersifat multikolinieritas
secara eksplisit dieprtimbangkan dengan lebih seksama.
Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan (overall
fit)
Ada dua proses penting yaitu algoritma Cluster dalam pembentukan Clusterdan
menentukan jumlah Cluster yang akan dibentuk. Keduanya mempunyai implikasi substansial tidak
hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap hasil
tersebut.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Gambar 2. Algoritma Analisa Kluster
Adapun metode pengelompokan dalam analisis Cluster meliputi :
1. Metode Non-Hirarkis.
dimulai dengan menentukan terlebih dahulu jumlah Cluster yang diinginkan (dua,tiga, atau
yang lain). Setelah jumlah Clusterditentukan, maka proses Cluster dilakukan dengan tanpa
mengikuti proses hirarki. Metode ini biasa disebut “K-Means Cluster”.
Berbeda dengan metode hirarkikal, prosedur non hirarkikal (K-means Clustering) dimulai
dengan memilih sejumlah nilai Cluster awal sesuai dengan jumlah yang diinginkan dan
kemudian obyek digabungkan ke dalam Cluster-Cluster tersebut.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
a. Sequential Threshold Procedure
Metode ini melakukan pengelompokan dengan terlebih dahulu memilih satu obyek dasar
yang akan dijadikan nilai awal Cluster, kemudian semua obyek yang ada didalam jarak
terdekat dengan Cluster ini akan bergabung lalu dipilih Cluster kedua dan semua obyek
yang mempunyai kemiripan dimasukkan dalam Cluster ini. Demikian seterusnya hingga
terbentuk beberapa Cluster dengan keseluruhan obyek didalamnya.
b. Parallel Threshold Prosedure
Secara prinsip sama dengan prosedur sequential threshold, hanya saja dilakukan
pemilihan terhadap beberapa obyek awal Cluster sekaligus dan kemudian melakukan
penggabungan obyek ke dalamnya secara bersamaan.
c. Optimizing
Merupakan pengembangan dari kedua metode diatas dengan melakukan optimasi pada
penempatan obyek yang ditukar untuk Cluster lainnya dengan pertimbangan krteria
optimasi.
2. Metode Hirarkis.
Memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling
dekat. Kemudian dilanjutkan pada obyek yang lain dan seterusnya hingga Cluster akan
membentuk semacam ‘pohon’ dimana terdapat tingkatan (hirarki) yangjelas antar obyek, dari
yang paling mirip hingga yang paling tidak mirip. Teknik hirarki (hierarchical methods)
adalah teknik Clustering membentuk kontruksi hirarki atau berdasarkan tingkatan tertentu
seperti struktur pohon (struktur pertandingan). Alat yang membantu untukmemperjelas proses
hirarki ini disebut “dendogram”.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Teknik hirarki (hierarchical methods) adalah teknik Clustering membentuk kontruksi
hirarki atau berdasarkan tingkatan tertentu seperti struktur pohon (struktur pertandingan).
Dengan demikian proses pengelompokkannya dilakukan secara bertingkat atau bertahap.
Hasil dari pengelompokan ini dapat disajikan dalam bentuk dendogram. Metode-metode yang
digunakan dalam teknik hirarki:
a. Agglomerative Methods
Metode ini dimulai dengan kenyatan bahwa setiap obyek membentuk Clusternya
masing-masing. Kemudian dua obyek dengan jarak terdekat bergabung. Selanjutnya
obyek ketiga akan bergabung dengan Cluster yang ada atau bersama obyek lain dan
membentuk Cluster baru. Hal ini tetap memperhitungkan jarak kedekatan antar obyek.
Proses akan berlanjut hingga akhirnya terbentuk satu Cluster yang terdiri dari keseluruhan
obyek. Ada beberapa teknik dalam Agglomerative methods yaitu:
• Single linkage (nearest neighbor methods)
Metode ini menggunakan prinsip jarak minimum yang diawali dengan mencari dua
obyek terdekat dan keduanya membentuk Cluster yang pertama. Pada langkah
selanjutnya terdapat dua kemungkinan, yaitu :
a. Obyek ketiga akan bergabung dengan Cluster yang telah terbentuk, atau
b. Dua obyek lainnya akan membentu Cluster baru.
Proses ini akan berlanjut sampai akhirnya terbentuk Cluster tunggal. Pada metode
ini jarak antar Cluster didefinisikan sebagai jarak terdekat antar anggotanya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu :
Gambar 3. Matriks Antara 5 Buah Objek.
Langkah penyelesaiannya :
a). Mencari obyek dengan jarak minimum
Menghitung jarak antara Cluster AB dengan obyek lainnya.
D(AB)C = min {dAC, dBC}= dBC = 3.0
D(AB)D = min {dAD, dBD}= dAD = 6.0
D(AB)E = min {dAE, dBE}= dBE = 7.0
Dengan demikian terbentuk matriks jarak yang baru
Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru
b). Mencari obyek dengan jarak terdekat.
D dan E mempunyai jarak terdekat, yaitu 2,0 maka obyek D dan E bergabung
menjadi satu Cluster.
c). Menghitung jarak antara Cluster dengan obyek lainnya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
D(AB)C = 3.0
D(AB)(DE) = min {dAD, dAE, dBD, dBE} = dAD = 6.0
D(DE)C = min {dCD, dCE} = dCD = 4.0
d). Mencari jarak terdekat antara Cluster dengan obyek dan diperoleh obyek C
bergabung dengan Cluster AB
e). Pada langkah yang terakhir, Cluster ABC bergabung dengan DE sehingga
terbentuk Cluster tunggal.
• Complete linkage (furthest neighbor methods)
Metode ini merupakan kebalikan dari pendekatan yang digunakan pada single linkage.
Prinsip jarak yang digunakan adalah jarak terjauh antar obyek.
Contoh : Terdapat matriks jarak antara lima buah obyek yaitu :
Gambar 5. Matriks Antara 5 Buah Objek.
Langkah penyelesaiannya :
a) Mencari obyek dengan jarak minimum
A dan B mempunyai jarak terdekat yaitu 1.0 maka obyek A dan B bergabung
menjadi satu Cluster.
b) Menghitung jarak antara Cluster AB dengan obyek lainnya
d(AB)C = max {dAC, dBC} = dAC = 5,0
d(AB)D = max {dAD, dBD} = dBD = 8,0
d(AB)E = max {dAE, dBE} = dAE = 8,0
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Dengan demikian terbentuk matriks jarak yang baru :
Gambar 4. Matriks 5 Buah Objek Dengan Jarak Baru
c) Mencari obyek dengan jarak terdekat.
D dan E mempunyai jarak terdekat yaitu 2.0 maka obyek D dan E bergabung
menjadi satu Cluster
d) Menghitung jarak antara Cluster dengan obyek lainnya.
d(AB)C = 4,0
d(AB)(DE) = 1/2{dAD, dAE, dBD, dBE} = 7,25
d(DE)C = 1/2{dCD, dCE,} = dCE = 5,00
Maka terbentuklah matrik jarak yang baru, yaitu :
Gambar 5. Matriks Akhir
e) Mencari jarak terdekat antara Cluster dengan obyek dan diperoleh obyek C
bergabung dengan Cluster AB.
f) Pada langkah yang terakhir, Cluster ABC bergabung dengan DE sehingga
terbentuk Cluster tunggal
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
• Ward’s error sum of squares methods
Ward mengajukan suatu metode pembentukan Cluster yang didasari oleh hilangnya
informasi akibat penggabungan obyek menjadi Cluster. Hal ini diukur dengan jumlah
total dari deviasi kuadrat pada mean Cluster untuk tiap observasi.
Error sum of squares (ESS) digunakan sebagai fungsi obyektif. Dua obyek akan
digabungkan apabila mempunyai fungsi obyektif terkecil diantara kemungkinan yang
ada.
ESS= ∑∑ 𝑋𝑖𝑗
2 −1
𝑛𝑗(∑ 𝑋𝑖𝑗)2
Dengan Xij adalah nilai untuk obyek ke-i pada Cluster ke-j.
b. Divisive Methods
Metode divisive berlawanan dengan metode agglomerative. Metode ini pertama-tama
diawali dengan satu Cluster besar yang mencakup semua observasi (obyek). Selanjutnya
obyek yang mempunyai ketidakmiripan yang cukup besar akan dipisahkan sehingga
membentuk Cluster yang lebih kecil. Pemisahan ini dilanjutkan sehingga mencapai
sejumlah Cluster yang diinginkan.
• Splinter average distance methods
Metode ini didasarkan pada perhitungan jarak rata-rata masing-masing obyek dengan
obyek pada grup splinter dan jarak rata-rata obyek tersebut dengan obyek lain pada
grupnya. Proses tersebut dimulai dengan memisahkan obyek dengan jarak terjauh
sehingga terbentuklan dua group. Kemudian dibandingkan dengan jarak rata-rata
masing-masing obyek dengan group splinter dengan groupnya sendiri. Apabila suatu
obyek mempunyai jarak yang lebih dekat ke group splinter daripada ke groupnya
sendiri, maka obyek tersebut haruslah dikeluarkan dari groupnya dan dipisahkan ke
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
group splinter. Apabila komposisinya sudah stabil, yaitu jarak suatu obyek ke
groupnya selalu lebih kecil daripada jarak obyek itu ke group splinter, maka proses
berhenti dan dilanjutkan dengan tahap pemisahan dalam group.
Contoh : Terdapat matriks jarak antara 5 buah obyek, yaitu :
Gambar 6. Matriks Perbandingan 5 buah Objek
Perhitungan :
a) Menghitung jarak rata-rata antar obyek
A = ¼ (12+9+32+31) = 21 D = ¼ (32+25+23+9) = 22.25
B = ¼ (12+9+25+27) = 18.25 E = ¼ (31+27+24+9) = 22.75
C = ¼ (9+9+23+24) = 16.25
Terlihat bahwa E mempunyai nilai jarak terjauh, yaitu 22.75, maka E dipisahkan
dari group utama dan membentuk group splinter.
b) Menghitung jarak rata-rata obyek dengan group utama dengan group splinter
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Gambar 7. Perhitungan Rata-Rata Group Utama Dengan Group Splinter
Pada D, jarak rata-rata dengan group splinter lebih dekat daripada dengan group
utama. Dengan demikian D harus dikeluarkan dari group utama dan masuk ke
group splinter.
c) Perhitungan jarak rata-rata
Gambar 7. Perhitungan Rata-Rata Group Utama Dengan Group Splinter
Karena jarak semua obyek ke group utama sudah lebih besar daripada jaraknya ke
group splinter, maka komposisinya sudah stabil.
Tahap Kelima : Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap Cluster dalam term untuk menamai dan menandai
dengan suatu label yang secara akurat dapat menjelaskan kealamian Cluster.
Membuat profil dan interpretasi Cluster tidak hanya untuk memperoleh suatu gambaran saja
melainkan pertama, menyediakan suatu rata-rata untuk menilai korespondensi pada Cluster yang
terbentuk, kedua, profil Cluster memberikan araha bagi penilainan terhadap signifikansi praktis.
Namun demikian yang perlu diperhatikan pada tahapan interpretasi adalah karakteristik yang
membedakan masing-masing Cluster sehingga kita dapat memberikan label pada masing-masing
Cluster tersebut.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Tahap Keenam: Proses Validasi dan Pembuatan Profil (profiling) Cluster
1. Proses validasi solusi Cluster
Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis Cluster
dapat mewakili populasi dan dapat digeneralisasi untuk objek lain. Pendekatan ini
membandingkan solusi Cluster dan menilai korespondensi hasil. Terkadang tidak dapat
dipraktekkan karena adanya kendala waktu dan biaya atau ketidaktersediaan objek untuk
analisis Cluster ganda.
2. Pembuatan Profil ( profiling) solusi Cluster
Tahap ini menggambarkan karakteristik tiap Cluster untuk menjelaskan Cluster-Cluster
tersebut dapat dapat berbeda pada dimensi yang relevan. Titik beratnya pada karakteristik
yang secara signifikan berbeda antar cluster dan memprediksi anggota dalam suatu Cluster
khusus.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Studi Kasus
Perusahaan ABC merupakan perusahaan manufacturing yang bergerak di bidang produksi
makanan ringan. Salah satu strategi perusahaan dalam menjaga masa pakai mesin dan
mempertahankan produktivitas yaitu pengadaan maintenance mesin secara rutin setiap periode
tertertu. Dalam maintenance mesin perusahaan ABC ingin mengelompokan maintenance mesin
pada 3 periode yaitu periode 1, periode 2, dan periode 3. Urutan periode maintenance mesin
berdasarkan pada urutan prioritas mesin berdasarkan beberapa faktor yang telah ditentukan.
Penentuan pengelompokan mesin berdasarkan beberapa faktor diantaranya umur mesin, output
yang dihasilkan perhari, jumlah defect produk, waktu set up/menit, dan down time mesin.
Berikut adalah data historis yang telah diperoleh dari 30 mesin :
No Mesin Umur Mesin
Output yang
dihasilkan
perhari
Jumlah Defect
Produk
Waktu Set
up/menit
Down
Time
Mesin
1 Mesin 1 80 240 8 15 4
2 Mesin 2 78 243 7 15 5
3 Mesin 3 70 248 7 14 3
4 Mesin 4 44 285 6 11 0
5 Mesin 5 78 242 7 15 4
6 Mesin 6 110 208 13 19 5
7 Mesin 7 98 212 11 17 5
8 Mesin 8 85 218 10 16 5
9 Mesin 9 120 201 14 20 5
10 Mesin 10 119 201 14 20 5
11 Mesin 11 116 203 14 20 2
12 Mesin 12 32 295 3 8 0
13 Mesin 13 63 252 6 11 3
14 Mesin 14 23 297 2 6 0
15 Mesin 15 82 235 10 15 3
16 Mesin 16 90 215 11 16 3
17 Mesin 17 41 275 5 10 1
18 Mesin 18 66 249 6 12 2
19 Mesin 19 65 250 6 12 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
No Mesin Umur Mesin
Output yang
dihasilkan
perhari
Jumlah Defect
Produk
Waktu Set
up/menit
Down
Time
Mesin
20 Mesin 20 101 210 13 19 3
21 Mesin 21 29 296 3 7 0
22 Mesin 22 40 270 5 10 0
23 Mesin 23 116 205 13 20 4
24 Mesin 24 120 202 15 20 4
25 Mesin 25 107 210 13 18 5
26 Mesin 26 73 252 7 12 1
27 Mesin 27 98 224 11 17 3
28 Mesin 28 36 282 4 4 2
29 Mesin 29 107 216 11 18 2
30 Mesin 30 37 288 4 9 1
Metode Hirarki
Langkah Penyelesaian :
1. Tahap Standarisasi Data
- Input Data pada Variable View
Mengisi data view seperti gambar dibawah ini
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Mengganti type dari variabel nama menjadi “String”
- Pada Data View Pilih descriptive statistics , kemudian pilih descriptives
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Pindahkan semua variabel ke kolom variable (S)
- Centang pada save standardized values as variables
- Kenudian klik OK
- Output normalisasi data
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Dari hasil Output diatas merupakan tampilan pertama hasil proses nomalisasi data. Dari
tabel menunjukkan hasil nilai N, Minimum, Maximum, Mean, dan Standar Deviation dari
masing-masing kriteria. Jika sudah tampil output seperti gambar diatas, maka anda
memastikan tampilan Data View anda sebelumnya sudah seperti gambar dibawah ini.
Terdapat tambahan variabel “Z” hasil dari normalisasi data kuesioner dari masing-masing
kriteria. Data "Z score” inilah yang kemudian akan diolah untuk tahap pengelompokkan
(clustering) berikutnya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
2. Tahap Pengelompokkan (clustering)
- Pilih Analyze >> Classify >> Hierarchical Cluster
- Memindahkan semua variabel Z Score pada kotak variable (s)
- Memindahkan variabel nama pada label cases by
- Pilih Statistics
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Pada kotak dialog statistics centang Agglomerative Schedule dan Proxy Matrix
- Pilih range of solution , kemudian isi minimum number menjadi 2, dan maximum
number menjadi 5. Kemudian klik continue
- Pada kotak dialog Plots mencentang Dendogram, All Cluster, dan Vertical
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Pada kotak dialog Method gantilah cluster Method menjadi Nearest Neighboor, dan
centang Interval kemudian mengganti pilihannya menjadi Squared Euqlidean Distance
- Klik continue
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Maka akan tampillah output spss sepeti beberapa tabel dibawah ini
OUTPUT 1 Agglomeration Schedule Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 9 10 ,001 0 0 8
2 12 21 ,057 0 0 6
3 6 25 ,059 0 0 8
4 1 5 ,073 0 0 11
5 19 26 ,135 0 0 12
6 12 14 ,150 2 0 20
7 16 27 ,189 0 0 21
8 6 9 ,242 3 1 17
9 23 24 ,286 0 0 17
10 17 30 ,287 0 0 14
11 1 2 ,308 4 0 19
12 18 19 ,310 0 5 16
13 7 8 ,321 0 0 18
14 17 22 ,332 10 0 15
15 4 17 ,340 0 14 20
16 13 18 ,372 0 12 22
17 6 23 ,374 8 9 18
18 6 7 ,395 17 13 25
19 1 3 ,454 11 0 22
20 4 12 ,491 15 6 28
21 16 29 ,498 7 0 23
22 1 13 ,548 19 16 24
23 15 16 ,554 0 21 24
24 1 15 ,596 22 23 26
25 6 20 ,611 18 0 26
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
26 1 6 ,640 24 25 27
27 1 11 ,699 26 0 28
28 1 4 1,437 27 20 29
29 1 28 1,499 28 0 0
Hasil output tabel pertama memberikan penjelasan mengenai penggabungan antara setiap
anggota 1 dengan anggota lainnya. Seperti contoh pembacaan tabel agglomeration
schedule :
a) Pada stage 1 mesin 19 bergabung dengan mesin 10 pada jarak yang terdekat
pertama yaitu (lihat pada kolom coefficients) 0,001. Dimana mesin 19 dan mesin
10 belum pernah bergabung sebelumnya (nilai 0) dengan anggota manapun (lihat
pada kolom stage cluster first appears. Untuk melihat penggabungan anggota yang
terlibat pada stage 1 berikutnya lihat pada kolom next stage 8.
b) Pada stage 2 mesin 6 bergabung dengan mesin 9 pada jarak yaitu (lihat pada kolom
coefficients) 0,242. Dimana anggota 6 pernah bergabung sebelumnya (nilai 3) dan
anggota 9 pernah bergabung sebelumnya ditandai dengan nilai 1 (lihat pada kolom
stage cluster first appears. Untuk melihat penggabungan anggota yang terlibat pada
stage berikutnya lihat pada kolom next stage 17.
c) Dan seterusnya.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
OUTPUT 2 Cluster Membership
Cluster Membership
Case 5 Clusters 4 Clusters 3 Clusters 2 Clusters
1:1 1 1 1 1
2:2 1 1 1 1
3:3 1 1 1 1
4:4 2 2 2 1
5:5 1 1 1 1
6:6 3 1 1 1
7:7 3 1 1 1
8:8 3 1 1 1
9:9 3 1 1 1
10:10 3 1 1 1
11:11 4 3 1 1
12:12 2 2 2 1
13:13 1 1 1 1
14:14 2 2 2 1
15:15 1 1 1 1
16:16 1 1 1 1
17:17 2 2 2 1
18:18 1 1 1 1
19:19 1 1 1 1
20:20 3 1 1 1
21:21 2 2 2 1
22:22 2 2 2 1
23:23 3 1 1 1
24:24 3 1 1 1
25:25 3 1 1 1
26:26 1 1 1 1
27:27 1 1 1 1
28:28 5 4 3 2
29:29 1 1 1 1
30:30 2 2 2 1
Output diatas menunjukkan bahwa setiap terbentuknya n kelompok, maka terdaftarlah
anggota-anggota setiap kelompoknya seperti yang sudah tertera pada tabel diatas. Ketika
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
menentukan banyaknya kelompok (cluster) tidak semua anggota berada pada cluster yang
sama ketika peneliti ingin membuat kelompok menjadi 2, 3, 4, atau 5. Contohnya :
Anggota ke 11 menjadi anggota cluster 4 ketika kelompok yang dibentuk sebanyak 5
kelompok, dan menjadi anggota cluster 3 ketika kelompok yang dibentuk sebanyak 4
kelompok , dan menjadi anggota cluster 1 ketika kelompok yang dibentuk sebanyak 3
kelompok. Hasil ini membantu anda dalam menentukan cluster berdasarkan metode cut off
pada hasil dendogram.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
OUTPUT 3 Dendogram
Hasil dendogram menunjukkan bahwa penggabungan setip anggota berdasarkan jarak
yang paling dekat, sehingga membentuk satu cluster yang sangat besar. Hasil dendogram
ini akan mudah dibaca jika pembacaannya dibantu oleh hasil Agglomerative Schedule
Pembentukkan jumlah cluster dapat dibentuk dengan metode cut off pada hasil dendogram.
Sebagai contoh:
a) Melakukan cut off pada angka 11
b) Akan terlihat cluster yang terbentuk sebanyak 3 cluster dengan 3 Outlier ,
c) Untuk melihat anggota masing-masing cluster dapat dilihat dari gambar berikut ini:
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Cluster 2,4, dan 6 merupakan outlier.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Cluster yang terbentuk jika menggunakan metode Cut Off, sebagai berikut:
Jarak Cut Off Cluster yang terbentuk Outlier yang terbentuk
10 5 4
15 2 1
20 2 1
3. Tahap pengujian crosstab
- Pada Data View menambah variabel baru yaitu variabel Cluster.
- Kemudian pada variabel cluster, mengganti measure- nya menjadi nominal
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Mengganti label value variabel cluster seperti gambar dibawah ini:
- Pada Data View mengisi data untuk variabel cluster berdasarkan masing-anggota pada
setiap kelompok seperti gambar dibawah.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Pilih Analyze >> Descriptive Statistics >> Crosstab
- Memindahkan seluruh variabel Z score pada kotak dialog Row(s)
- Memindahkan variabel cluster pada kotak dialog Coloumn (s).
- Pada menu Statistics beri tanda centang pada Correlations
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
- Klik Continue
- Pada menu cell display beri centang pada Observed dan total
- Klik Continue
- Klik OK, maka Output SPSS akan muncul.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
a) Output Crosstab pertama (Umur Mesin)
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Zscore(Umur_Me
sin)
-
1,75540
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,56203
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,46534
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,33642
Count 0 0 0 0 0 1 1
% of
Total 0,0% 0,0% 0,0% 0,0% 0,0% 3,3% 3,3%
-
1,30420
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,20751
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,17528
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,07859
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-,46624 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,40179 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
-,36956 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,24064 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,14396 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,01719 Count 0 0 2 0 0 0 2
% of
Total 0,0% 0,0% 6,7% 0,0% 0,0% 0,0% 6,7%
,08165 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,14610 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,24279 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
,40394 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,66177 Count 1 0 1 0 0 0 2
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
,75845 Count 0 1 0 0 0 0 1
% of
Total 0,0% 3,3% 0,0% 0,0% 0,0% 0,0% 3,3%
,95183 Count 1 0 1 0 0 0 2
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
1,04851 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
1,24189 Count 1 0 0 1 0 0 2
% of
Total 3,3% 0,0% 0,0% 3,3% 0,0% 0,0% 6,7%
1,33857 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
1,37080 Count 2 0 0 0 0 0 2
% of
Total 6,7% 0,0% 0,0% 0,0% 0,0% 0,0% 6,7%
Total Count 8 1 12 1 7 1 30
% of
Total 26,7% 3,3% 40,0% 3,3% 23,3% 3,3% 100,0%
b) Output Crosstab yang ke 2 (Output yang dihasilkan perhari)
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Zscore(Outpu
t)
-1,22108 Count 2 0 0 0 0 0 2
% of
Total 6,7% 0,0% 0,0% 0,0% 0,0% 0,0% 6,7%
-1,19040 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
-1,15972 Count 0 0 0 1 0 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
% of
Total 0,0% 0,0% 0,0% 3,3% 0,0% 0,0% 3,3%
-1,09836 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
-1,00632 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
-,94496 Count 1 1 0 0 0 0 2
% of
Total 3,3% 3,3% 0,0% 0,0% 0,0% 0,0% 6,7%
-,88360 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
-,79156 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,76087 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,69951 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
-,51543 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,17795 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
-,02454 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
,03682 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,06750 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,22090 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,25158 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,28226 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,34362 Count 0 0 2 0 0 0 2
% of
Total 0,0% 0,0% 6,7% 0,0% 0,0% 0,0% 6,7%
,89587 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,04927 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,26403 Count 0 0 0 0 0 1 1
% of
Total 0,0% 0,0% 0,0% 0,0% 0,0% 3,3% 3,3%
1,35608 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,44812 Count 0 0 0 0 1 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,66288 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,69356 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
1,72424 Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
Total Count 8 1 12 1 7 1 30
% of
Total 26,7% 3,3% 40,0% 3,3% 23,3% 3,3% 100,0%
c) Output Crosstab yang ke 3 (Defect produk)
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Zscore(Jumlah_Defect) -
1,69343
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,43814
Count 0 0 0 0 2 0 2
% of
Total 0,0% 0,0% 0,0% 0,0% 6,7% 0,0% 6,7%
Count 0 0 0 0 1 1 2
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
-
1,18285
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 3,3% 6,7%
-,92756 Count 0 0 0 0 2 0 2
% of
Total 0,0% 0,0% 0,0% 0,0% 6,7% 0,0% 6,7%
-,67227 Count 0 0 3 0 1 0 4
% of
Total 0,0% 0,0% 10,0% 0,0% 3,3% 0,0% 13,3%
-,41698 Count 0 0 4 0 0 0 4
% of
Total 0,0% 0,0% 13,3% 0,0% 0,0% 0,0% 13,3%
-,16168 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,34890 Count 1 0 1 0 0 0 2
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
,60419 Count 1 0 3 0 0 0 4
% of
Total 3,3% 0,0% 10,0% 0,0% 0,0% 0,0% 13,3%
1,11477 Count 3 1 0 0 0 0 4
% of
Total 10,0% 3,3% 0,0% 0,0% 0,0% 0,0% 13,3%
1,37006 Count 2 0 0 1 0 0 3
% of
Total 6,7% 0,0% 0,0% 3,3% 0,0% 0,0% 10,0%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
1,62535 Count 1 0 0 0 0 0 1
% of
Total 3,3% 0,0% 0,0% 0,0% 0,0% 0,0% 3,3%
Total Count 8 1 12 1 7 1 30
% of
Total 26,7% 3,3% 40,0% 3,3% 23,3% 3,3% 100,0%
d) Output Crosstab yang ke 4 (Set up mesin)
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Zscore(Waktu_Set_Up) -
2,19399
Count 0 0 0 0 0 1 1
% of
Total 0,0% 0,0% 0,0% 0,0% 0,0% 3,3% 3,3%
-
1,76380
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,54870
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-
1,33360
Count 0 0 0 0 1 0 1
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
Count 0 0 0 0 1 0 1
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
-
1,11850
% of
Total 0,0% 0,0% 0,0% 0,0% 3,3% 0,0% 3,3%
-,90341 Count 0 0 0 0 2 0 2
% of
Total 0,0% 0,0% 0,0% 0,0% 6,7% 0,0% 6,7%
-,68831 Count 0 0 1 0 1 0 2
% of
Total 0,0% 0,0% 3,3% 0,0% 3,3% 0,0% 6,7%
-,47321 Count 0 0 3 0 0 0 3
% of
Total 0,0% 0,0% 10,0% 0,0% 0,0% 0,0% 10,0%
-,04302 Count 0 0 1 0 0 0 1
% of
Total 0,0% 0,0% 3,3% 0,0% 0,0% 0,0% 3,3%
,17208 Count 0 0 4 0 0 0 4
% of
Total 0,0% 0,0% 13,3% 0,0% 0,0% 0,0% 13,3%
,38717 Count 1 0 1 0 0 0 2
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
,60227 Count 1 0 1 0 0 0 2
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
,81737 Count 1 0 1 0 0 0 2
% of
Total 3,3% 0,0% 3,3% 0,0% 0,0% 0,0% 6,7%
1,03247 Count 1 1 0 0 0 0 2
% of
Total 3,3% 3,3% 0,0% 0,0% 0,0% 0,0% 6,7%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
1,24756 Count 4 0 0 1 0 0 5
% of
Total 13,3% 0,0% 0,0% 3,3% 0,0% 0,0% 16,7%
Total Count 8 1 12 1 7 1 30
% of
Total 26,7% 3,3% 40,0% 3,3% 23,3% 3,3% 100,0%
e) Output Crosstab yang ke 5 (down time)
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Zscore(Down_Time) -
1,49729
Count 0 0 0 0 5 0 5
% of
Total 0,0% 0,0% 0,0% 0,0% 16,7% 0,0% 16,7%
-,94274 Count 0 0 2 0 2 0 4
% of
Total 0,0% 0,0% 6,7% 0,0% 6,7% 0,0% 13,3%
-,38819 Count 0 0 2 1 0 1 4
% of
Total 0,0% 0,0% 6,7% 3,3% 0,0% 3,3% 13,3%
,16637 Count 0 1 5 0 0 0 6
% of
Total 0,0% 3,3% 16,7% 0,0% 0,0% 0,0% 20,0%
,72092 Count 2 0 2 0 0 0 4
% of
Total 6,7% 0,0% 6,7% 0,0% 0,0% 0,0% 13,3%
1,27547 Count 6 0 1 0 0 0 7
% of
Total 20,0% 0,0% 3,3% 0,0% 0,0% 0,0% 23,3%
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Crosstab
Cluster
Total
Cluster
1
Cluster
2
Cluster
3
Cluster
4
Cluster
5
Cluster
6
Total Count 8 1 12 1 7 1 30
% of
Total 26,7% 3,3% 40,0% 3,3% 23,3% 3,3% 100,0%
Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada
hasil crosstab:
1. Jika terdapat karakter yang angkanya menunjukkan angka negatif, berarti cluster yang
bersangkutan ada di bawah rata-rata total.
2. Jika terdapat karakter yang angkanya menunjukkan angka positif, berarti cluster yang
bersangkutan ada di atas rata-rata total.
Dari seluruh hasil crosstab diatas, dapat diketahui karakteristik masing-masing cluster
berdasarkan karakteristik anggota anggota cluster yang dominan, dapat dilihat dari tabel berikut
ini:
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6
Umur
Mesin • 1,37080
(6,7%)
• 0,75845
(3,3%)
• 0,01719
(6,7%)
• 1,24189
(3,3%)
Untuk
kriteria
Umur
Mesin pada
cluster ini
dominan
dibawah
rata-rata
total
• -
1,33642
(3,3%)
Output • -
1,22108
(6,7%)
• -
0,94496
(3,3%)
• 0,34362
(6,7%)
• -1,15972
(3,3%)
Untuk
kriteria
Output pada
cluster ini
• 1,26403
(3,3%)
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6
dominan
diatas rata-
rata total
Jumlah
Defect • 1,11477
(10%)
• 1,11477
(3,3%)
• -
0,41698
(13,3%)
• 1,37006
(3,3%)
Untuk
kriteria
Jumlah
Defect pada
cluster ini
dominan
dibawah
rata-rata
total
• -
1,18285
(3,3%)
Waktu
Set Up • 1,24756
(13,3%)
• 1,03247
(3,3%)
• 0,17208
(13,3%)
• 1,24756
(3,3%)
• -
0,90341
(6,7%)
• -
2,19399
(3,3%)
Down
Time • 1,27547
(20%)
• 0,16637
(3,3%)
• 0,16637
(16,7%)
• -0,38819
(3,3%)
• -
1,49729
(16,7%)
• -
0,38819
(3,3%)
Dari tabel rekapitulasi diatas, maka dapatlah dilihat masing-masing cluster sebagai berikut:
1. Dalam cluster-1 terdiri dari mesin dengan dominan umur mesin diatas rata-rata total, output
yang dihasilkan dibawah rata-rata total, defect produk diatas rata-rata total, waktu set up diatas
rata-rata total, dan down time diatas rata-rata total.
Sehingga, cluster-1 diprioritaskan untuk dilakukan maintenance pada periode pertama.
2. Dalam cluster-3 terdiri dari mesin dengan dominan umur mesin diatas rata-rata total, output
yang dihasilkan diatas rata-rata total, defect produk dibawah rata-rata total, waktu set up diatas
rata-rata total, dan down time diatas rata-rata total.
Sehingga, cluster-3 diprioritaskan untuk dilakukan maintenance pada periode kedua.
3. Dalam cluster-5 terdiri dari mesin dengan dominan umur mesin dibawah rata-rata total, output
yang dihasilkan diatas rata-rata total, defect produk dibawah rata-rata total, waktu set up
dibawah rata-rata total, dan down time dibawah rata-rata total.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Sehingga, cluster-5 diprioritaskan untuk dilakukan maintenance pada periode ketiga.
Sedangkan cluster 2,4, dan 6 merupakan outlier, dikarenakan pada studi kasus ini perusahaan
ingin mengadakan maintenance pada 3 periode. Sehingga 3 outlier dapat dimasukan pada
periode yang berdasarkan pada karakteristik outlier tersebut, seperti penjelasan berikut:
1. Dalam cluster-2 terdiri dari mesin dengan umur mesin diatas rata-rata total, output yang
dihasilkan dibawah rata-rata total, defect produk dibawah rata-rata total, waktu set up
diatas rata-rata total, dan down time diatas rata-rata total.
Sehingga, cluster-2 diprioritaskan untuk dilakukan maintenance pada periode kedua.
2. Dalam cluster-4 terdiri dari mesin dengan umur mesin diatas rata-rata total, output yang
dihasilkan dibawah rata-rata total, defect produk diatas rata-rata total, waktu set up diatas
rata-rata total, dan down time dibawah rata-rata total.
Sehingga, cluster-4 diprioritaskan untuk dilakukan maintenance pada periode pertama.
3. Dalam cluster-6 terdiri dari mesin dengan umur mesin dibawah rata-rata total, output yang
dihasilkan diatas rata-rata total, defect produk dibawah rata-rata total, waktu set up
dibawah rata-rata total, dan down time dibawah rata-rata total.
Sehingga, cluster-6 diprioritaskan untuk dilakukan maintenance pada periode ketiga.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Metode Non Hierarki (K-Means Cluster)
Langkah Penyelesaian 1. Standarisasi Data
Karena data yang dikumpulkan berada dalam satuan yang berbeda maka terlebih dahulu dilakukan
proses standarisasi (normalisasi) data. Jika data sudah berada dalam satuan yg sama atau tidak
memiliki satuan maka langkah ini dapat diabaikan.
Masukkan seluruh data ke dalam spss :
a. Klik Analyze > Descriptive Statistics > Descriptives
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
b. Pindahkan variabel dikolom kiri ke kolom Variable (s)
c. Aktifkan Save Standardized as Variables
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
d. Klik OK
e. Hasil SPSS
Setelah tahap tersebut dilakukan, maka akan muncul tabel Descriptive Statistics yang
akan digunakan untuk membantu menganalisis pengelompokan cluster nantinya.
Pastikan tampilan pada data view telah berubah seperti gambar berikut ini:
Perhatikan pada variabel data asli akan muncul 5 kriteria dengan awalan “Z”
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
umur_mesin 30 23,00 120,00 77,4667 31,02806
Output 30 201,00 297,00 240,8000 32,59405
deffect 30 2,00 15,00 8,6333 3,91710
setup 30 4,00 20,00 14,2000 4,64906
downtime 30 ,00 5,00 2,7000 1,80325
Valid N (listwise) 30
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
2. Analisis Cluster Metode K-Means Cluster
a. Pada Analyze Classify K-Means Cluster
b. Pindahkan Variabel yang berawalan “Z” ke kolom Variable (s)
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
c. Tentukan jumlah Cluster dengan mengisikan angka 5 pada Number of Cluster
d. Pilih Save dan aktifkan Cluster Membership dan Distance from Cluster center, kemudian
Continue
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
e. Pilih Option, aktifkan Initial Cluster center dan Anova Table
f. Klik OK
Langkah tersebut akan menghasilkan tabel Initial Cluster seperti pada gambar di bawah
ini. Tabel Initial Cluster Centers menunjukkan hasil proses sementara pengelompokan
data yang di lakukan.
Initial Cluster Centers
Cluster
1 2 3
Zscore(umur_mesin) -1,75540 1,37080 -,24064
Zscore(Output) 1,72424 -1,22108 ,22090
Zscore(deffect) -1,69343 1,37006 -,41698
Zscore(setup) -1,76380 1,24756 -,04302
Zscore(downtime) -1,49729 1,27547 ,16637
Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi.
Untuk mendeteksi berapa kali proses iterasi dilakukan dalam proses clustering menggunakan
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
30 data objek dapat dilihat tampilan output berikut:
Iteration Historya
Iteration
Change in Cluster Centers
1 2 3
1 ,903 ,712 ,448
2 ,000 ,102 ,116
3 ,000 ,180 ,285
4 ,000 ,000 ,000
a. Convergence achieved due to no or small
change in cluster centers. The maximum
absolute coordinate change for any center is
,000. The current iteration is 4. The minimum
distance between initial centers is 3,281.
Ternyata proses clustering dilakukan melalui 4 iterasi untuk menentukan cluster yang tepat.
Dari tabel diatas disebutkan bahwa jarak minimum antar pusat cluster yang terjadi dari hasil
iterasi adalah 2,516.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Cluster Membership
Mesin QCL_1 QCL_2
Mesin 1 3 0,7922
Mesin 2 3 1,2322
Mesin 3 3 0,1789
Mesin 4 1 0,8947
Mesin 5 3 0,7304
Mesin 6 2 0,6307
Mesin 7 2 0,8328
Mesin 8 2 1,2696
Mesin 9 2 0,9269
Mesin 10 2 0,9125
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Mesin QCL_1 QCL_2
Mesin 11 2 1,2318
Mesin 12 1 0,4796
Mesin 13 3 0,7055
Mesin 14 1 0,9035
Mesin 15 3 0,9247
Mesin 16 2 1,0067
Mesin 17 1 0,673
Mesin 18 3 0,6915
Mesin 19 3 1,1639
Mesin 20 2 0,5685
Mesin 21 1 0,5791
Mesin 22 1 0,7544
Mesin 23 2 0,485
Mesin 24 2 0,863
Mesin 25 2 0,617
Mesin 26 3 1,1101
Mesin 27 2 0,8879
Mesin 28 1 1,2226
Mesin 29 2 1,1575
Mesin 30 1 0,3453
Terlihat dari gambar diatas menunjukkan tiap mesin masuk kedalam masing-masing cluster
yang dibentuk. Seperti mesin 1 masuk dalam cluster 3, nilai distance sebesar 0,7922.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Final Cluster Centers
Cluster
1 2 3
Zscore(umur_mesin) -1,36060 ,94191 -,15112
Zscore(Output) 1,38676 -,95676 ,14931
Zscore(deffect) -1,18285 ,99694 -,38861
Zscore(setup) -1,30671 ,91664 -,16252
Zscore(downtime) -1,22002 ,67826 ,10475
Tabel Final Cluster Centers menunjukkan hasil analisisnya untuk masing-masing krieria dan
cluster yang dibentuk.
Berikut ini merupakan pedoman ketentuan untuk menafsirkan tabel hasil analisis pada
Final Cluster Centers:
1. Jika hasil perhitungan ditemukan negatif, berarti cluster yang bersangkutan ada di bawah
rata-rata total.
2. Jika hasil perhitungan ditemukan positif, berarti cluster yang bersangkutan ada di atas rata-
rata total.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Number of Cases in each
Cluster
Cluster 1 8,000
2 13,000
3 9,000
Valid 30,000
Missing ,000
Tabel Number of cases in each cluster menunjukkan jumlah mahasiswa yang masuk ke
dalam tiap cluster. Cluster 1 (8 mesin), cluster 2 (13 mesin) dan cluster 3 (9 mesin).
Dari tabel output Final Cluster Centers, dengan ketentuan yang telah dijabarkan diatas pula,
dapat didefinisikan sebagai berikut :
1. Cluster 1
Dalam cluster-1 terdiri dari mesin dengan dominan umur mesin dibawah rata-rata total,
output yang dihasilkan perhari diatas rata-rata total, defect produk dibawah rata-rata total,
set up mesin dalam menit dibawah rata-rata total, dan down time dibawah rata-rata total.
Sehingga, cluster-1 yang terdiri dari 8 mesin diprioritaskan untuk dilakukan
maintenance pada periode 3.
2. Cluster 2
Dalam cluster-1 terdiri dari mesin dengan dominan umur mesin diatas rata-rata total,
output yang dihasilkan perhari dibawah rata-rata total, defect produk diatas rata-rata total,
set up mesin dalam menit diatas rata-rata total, dan down time diatas rata-rata total.
Sehingga, cluster-2 yang terdiri dari 13 mesin diprioritaskan untuk dilakukan
maintenance pada periode 1.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
3. Cluster 3
Dalam cluster-1 terdiri dari mesin dengan dominan umur mesin dibawah rata-rata total,
output yang dihasilkan perhari diatas rata-rata total, defect produk dibawah rata-rata total,
set up mesin dalam menit dibawah rata-rata total, dan down time diatas rata-rata total.
Sehingga, cluster-3 yang terdiri dari 9 mesin diprioritaskan untuk dilakukan
maintenance pada periode 2.
Informasi nilai rata-rata setiap cluster dapat dilihat pada tabel berikut:
Cluster
1 2 3
Umur mesin 35,24992 106,6923 72,77774
output 286,0001 209,6153 245,6666
deffect 3,999958 12,53841 7,111076
setup 8,125027 18,46151 13,44443
downtime 0,499999 3,923072 2,88889
Nilai tersebut menunjukan nilai rata-rata pada setiap cluster berdasarkan masing-masing
faktor. Misalnya:
Cluster 1 memiliki rata-rata umur mesin sebesar 38,24992 bulan dimana dibawah
rata-rata total, rata-rata output yang dihasilkan perjam sebanyak 286 produk diatas rata-
rata total, rata-rata defect produk sebanyak 3,999958 dibawah rata-rata total, rata-rata set
up mesin selama 8,125027 dibawah rata-rata total, dan rata-rata waktu downtime selama
0,49999 menit dibawah rata-rata total.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
Rata-rata total dapat diketahui berdasarkan hasil spss seperti pada tabel berikut:
N Minimum Maximum Mean Std.
Deviation
umur_mesin 30 23 120 77,4667 31,02806
Output 30 201 297 240,8 32,59405
deffect 30 2 15 8,6333 3,9171
setup 30 4 20 14,2 4,64906
downtime 30 0 5 2,7 1,80325
Dalam menghitung nilai rata-rata setiap faktor pada masing-masing cluster, rumus
umum yang digunakan yaitu :
𝑥 = µ + 𝑧. 𝜎
Dimana :
x : rata-rata sampel (variabel dalam cluster)
µ : rata-rata populasi
z : nilai standardisasi
𝜎 : standar deviasi
Sebagai contoh, apabila ingin mengetahui rata-rata umur mesin pada cluster 1 yaitu :
𝑥 = µ + 𝑧. 𝜎
𝑥 = 77,4667 + (−1,36060). (31,02806)
𝑥 = 35,24992
Jadi rata-rata jumlah umur mesin pada cluster 1 adalah 35,24992 bulan.
.
UNIVERSITAS ISLAM INDONESIA FM-UII-AA-FKA-07/R0
MATERI PRAKTIKUM
Fakultas : Teknologi Industri Pertemuan ke : 3 Jurusan/Program Studi : Teknik Industri Modul ke : 3 Kode Mata Kuliah : 52224603 Jumlah Halaman : 60 Nama Mata Kuliah : Analisis Keputusan dan Data Mining Mulai berlaku : 2016
DAFTAR PUSTAKA
• Bertalya. 2009. Konsep Data Mining. Universitas Gunadarma.
• Fayyad, Usama. 1996. Advances in Knowledge Discovery and Data Mining. MIT Press.
• Susanto, Hery Tri. 2009. Cluster Analysis. Seminar Nasional Matematika dan Pendidikan
Matematika. Yogyakarta: Universitas Negeri Yogyakarta.
• Turban, Efraim et al. 2005. Decision Support Systems and Intelligent Systems. Yogyakarta:
Andi Offset
• Walpole, Ronald E. dan Myers, Raymond H. 1986. Ilmu Peluang dan Statistik Untuk
Insinyur Dan Ilmuwan. Bandung: ITB Press.