Upload
ramanhia-putri
View
191
Download
0
Embed Size (px)
Citation preview
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 1/14
Konsep Data Mining
Klasifikasi : Pohon Keputusan
BertalyaUniversitas Gunadarma
2009
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 2/14
Definisi Klasifikasi
• Proses untuk menyatakan suatu objek ke salah satukategori yg sudah didefinisikan sebelumnya.
• Proses pembelajaran fungsi target (model klasifikasi)yg memetakan setiap sekumpulan atribut x (input) kesalah satu klas y yang didefinisikan sebelumnya.
– Input : sekumpulan record (training set ) – Setiap record terdiri atas sekumpulan atribut, salah satu
atribut adalah klas.
– Mencari model utk atribut klas sebagai fungsi dari nilai2utk atribut yg lain.
Klasifikasi 2
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 3/14
Definisi Klasifikasi (lanj.)
• Tujuannya adalah record2 yg sebelumnya tidak terlihatdinyatakan kelasnya seakurat mungkin.
• Model klasifikasi digunakan untuk – pemodelan deskriptif sebagai perangkat penggambaran
utk membedakan objek2 dari klas berbeda.
– Pemodelan prediktif digunakan utk memprediksi label klasutk record yg tidak diketahui atau tidak dikenal.
Klasifikasi 3
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 4/14
Contoh Klasifikasi
Tid Atr-1 Atr-2 Atr-3
Class
1 Yes Single 125K No
2 No Married 100K No
3 No Single 70K No
4 Yes Married 120K No
5 No Divorced 95K Yes
6 No Married 60K No
7 Yes Divorced 220K No
8 No Single 85K Yes
9 No Married 75K No
10 No Single 90K Yes10
c a t e
g o r i c a l
c a t e
g o r i c a l
c o n t i n
u o u s
c l a s
s
Atr-1 Atr-2 Atr-3
Class
No Single 75K ?
Yes Married 50K ?
No Married 150K ?
Yes Divorced 90K ?
No Single 40K ?
No Married 80K ?10
TestSet
TrainingSet
ModelLearn
Classifier
Klasifikasi 4
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 5/14
Classifier (Teknik Klasifikasi)
• Merupakan pendekatan sistematis utk membangunmodel klasifikasi dari sekumpulan data input.
• Contoh – Decision tree (pohon keputusan)
– Rule-based (berbasis aturan)
– Neural network (jaringan syaraf) – Support Vector Machine (SVM)
– Naïve Bayes
Klasifikasi 5
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 6/14
Contoh Aplikasi 1
• Pendeteksi Kecurangan – Tujuan : memprediksi kecurangan pada transaksi
kartu kredit – Pendekatan :
• Gunakan transaksi kartu kredit & informasimengenai pemegang rekening sebagai atribut2.
– Kapan si pelanggan membeli, apa yg dibeli, seberapasering pelanggan tsb membayar pada waktunya, dll
• Tandai transaksi yg lama sebagai transaksi ygbenar atau curang. Hal ini akan membentuk atributklas.
• Pelajari suatu model utk klas transaksi• Gunakan model ini utk mendeteksi kecurangandgn mengamati transaksi kartu kredit pada suaturekening.
Klasifikasi 6
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 7/14
Contoh Aplikasi 2
• Pemasaran secara langsung – Tujuan : mengurangi biaya pengiriman dengan
menargetkan sekumpulan pelanggan ygkemungkinan membeli produk telpon selular baru
– Pendekatan :• Gunakan data utk produk yg sama yg diperkenalkan
sebelumnya.• Kita mengetahui pelanggan yg memutuskan membeli atau
tidak. Hasil keputusan {beli, tidak beli} membentuk atributklas.
• Kumpulkan informasi mengenai pelanggan yg berhubungandengan demografik, gaya hidup & interaksi denganperusahaan.
– Tipe bisnis, dimanan mereka tinggal, berapa banyak ygmereka belanjakan, dll
• Gunakan informasi ini sebagai atribut input utk mempelajarimodel klasifikasi.
Klasifikasi 7
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 8/14
Pengukuran Kinerja Klasifikasi
• Akurasi = jumlah prediksi yang benar
total jumlah prediksi
• Rata2 kesalahan = jumlah prediksi yang salah
total jumlah prediksi
Klasifikasi 8
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 9/14
Pohon Keputusan (Decision Tree )
• Struktur hirarkis seperti pohon yg terdiri atas node &edge
– Root node , node yg tidak mempunyai edge yg masuk & 0
atau banyak edge yg keluar
– Internal node , node yg mempunyai satu edge yg masuk &dua atau lebih edge yg keluar
– Leaf atau terminal node , node yg mempunyai satu edge ygmasuk & tidak ada edge keluar
Leaf atau terminal node dinyatakan sebagai label klas.
Non-terminal node terdiri atas atribut kondisi tes utkmembedakan record dgn karakteristik berbeda.
Klasifikasi 9
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 10/14
Contoh Pohon Keputusan : Klasifikasi Vertebrata
Suhu tubuh
melahirkan Suhu tubuhBukan mamalia
Bukan mamaliaMamalia
panas dingin
Ya Tidak
Klasifikasi 10
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 11/14
Classification and Regression Trees (CART)
•
Klasifikasi 11
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 12/14
Contoh
Grandparents
A lotA little
Klasifikasi 12
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 13/14
Klasifikasi 13
DECISION TREE FOR THE CONCEPT
“Play Tennis”
Day Outloo T e m Humidit Wind PlayT e nn
D1 Sunny Hot High W eak NoD2 Sunny Hot High Strong No
D3 Overcas Hot High Weak Yes
D4 Rain Mild High W eak Yes
D5 Rain Cool Normal W eak Yes
D6 Rain Cool Normal Strong NoD7 Overcas Cool Normal Strong Yes
D8 Sunny Mild High W eak No
D9 Sunny Cool Normal W eak Yes
D10 Rain Mild Normal W eak Yes
D11 Sunny Mild Normal Strong YesD12 Overcas Mild High Strong Yes
D13 Overcas Hot Normal W eak Yes
D14 Rain Mild High Strong No
[Mitchell,1997]Mitchell, 1997
5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com
http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 14/14
Klasifikasi 14
DECISION TREE FOR THE CONCEPT
“Play Tennis”
Day Outloo Tem Humidit Wind PlayTenn
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Overcas Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Overcas Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Overcas Mild High Strong Yes
D13 Overcas Hot Normal Weak Yes
D14 Rain Mild High Strong No
[Mitchell,1997]Mitchell, 1997