14
 Konsep Data Mining Klasifikasi : Pohon Keputusan Bertalya Universitas Gunadarma 2009

Klasifikasi-Pohon Keputusan

Embed Size (px)

Citation preview

Page 1: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 1/14

Konsep Data Mining

Klasifikasi : Pohon Keputusan 

BertalyaUniversitas Gunadarma

2009

Page 2: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 2/14

Definisi Klasifikasi

• Proses untuk menyatakan suatu objek ke salah satukategori yg sudah didefinisikan sebelumnya.

• Proses pembelajaran fungsi target (model klasifikasi)yg memetakan setiap sekumpulan atribut x (input) kesalah satu klas y yang didefinisikan sebelumnya.

 – Input : sekumpulan record (training set ) – Setiap record terdiri atas sekumpulan atribut, salah satu

atribut adalah klas.

 – Mencari model utk atribut klas sebagai fungsi dari nilai2utk atribut yg lain.

Klasifikasi 2

Page 3: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 3/14

Definisi Klasifikasi (lanj.)

• Tujuannya adalah record2 yg sebelumnya tidak terlihatdinyatakan kelasnya seakurat mungkin.

• Model klasifikasi digunakan untuk – pemodelan deskriptif sebagai perangkat penggambaran

utk membedakan objek2 dari klas berbeda.

 – Pemodelan prediktif digunakan utk memprediksi label klasutk record yg tidak diketahui atau tidak dikenal.

Klasifikasi 3

Page 4: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 4/14

Contoh Klasifikasi

Tid  Atr-1 Atr-2 Atr-3

Class

1 Yes Single 125K No

2 No Married 100K No

3 No Single 70K No

4 Yes Married 120K No

5 No Divorced 95K Yes

6 No Married 60K No

7 Yes Divorced 220K No

8 No Single 85K Yes

9 No Married 75K No

10 No Single 90K Yes10

  c  a   t  e

  g   o  r   i  c  a   l

  c  a   t  e

  g   o  r   i  c  a   l

  c  o  n   t   i  n

  u  o  u  s

  c   l  a  s

  s

Atr-1 Atr-2 Atr-3

Class

No Single 75K ?

Yes Married 50K ?

No Married 150K ?

Yes Divorced 90K ?

No Single 40K ?

No Married 80K ?10 

TestSet

TrainingSet

ModelLearn

Classifier

Klasifikasi 4

Page 5: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 5/14

Classifier (Teknik Klasifikasi)

• Merupakan pendekatan sistematis utk membangunmodel klasifikasi dari sekumpulan data input.

• Contoh – Decision tree (pohon keputusan)

 – Rule-based (berbasis aturan)

 – Neural network (jaringan syaraf) – Support Vector Machine (SVM)

 – Naïve Bayes 

Klasifikasi 5

Page 6: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 6/14

Contoh Aplikasi 1

• Pendeteksi Kecurangan – Tujuan : memprediksi kecurangan pada transaksi

kartu kredit – Pendekatan :

• Gunakan transaksi kartu kredit & informasimengenai pemegang rekening sebagai atribut2.

 – Kapan si pelanggan membeli, apa yg dibeli, seberapasering pelanggan tsb membayar pada waktunya, dll

• Tandai transaksi yg lama sebagai transaksi ygbenar atau curang. Hal ini akan membentuk atributklas.

• Pelajari suatu model utk klas transaksi• Gunakan model ini utk mendeteksi kecurangandgn mengamati transaksi kartu kredit pada suaturekening.

Klasifikasi 6

Page 7: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 7/14

Contoh Aplikasi 2

• Pemasaran secara langsung – Tujuan : mengurangi biaya pengiriman dengan

menargetkan sekumpulan pelanggan ygkemungkinan membeli produk telpon selular baru

 – Pendekatan :• Gunakan data utk produk yg sama yg diperkenalkan

sebelumnya.• Kita mengetahui pelanggan yg memutuskan membeli atau

tidak. Hasil keputusan {beli, tidak beli} membentuk atributklas.

• Kumpulkan informasi mengenai pelanggan yg berhubungandengan demografik, gaya hidup & interaksi denganperusahaan.

 – Tipe bisnis, dimanan mereka tinggal, berapa banyak ygmereka belanjakan, dll

• Gunakan informasi ini sebagai atribut input utk mempelajarimodel klasifikasi.

Klasifikasi 7

Page 8: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 8/14

Pengukuran Kinerja Klasifikasi

• Akurasi = jumlah prediksi yang benar

total jumlah prediksi

• Rata2 kesalahan = jumlah prediksi yang salah

total jumlah prediksi

Klasifikasi 8

Page 9: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 9/14

Pohon Keputusan (Decision Tree )

• Struktur hirarkis seperti pohon yg terdiri atas node &edge

 –  Root node , node yg tidak mempunyai edge yg masuk & 0

atau banyak edge yg keluar

 –  Internal node , node yg mempunyai satu edge yg masuk &dua atau lebih edge yg keluar

 –  Leaf atau terminal node , node yg mempunyai satu edge ygmasuk & tidak ada edge keluar

Leaf atau terminal node dinyatakan sebagai label klas.

Non-terminal node terdiri atas atribut kondisi tes utkmembedakan record dgn karakteristik berbeda.

Klasifikasi 9

Page 10: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 10/14

Contoh Pohon Keputusan : Klasifikasi Vertebrata

Suhu tubuh

melahirkan Suhu tubuhBukan mamalia

Bukan mamaliaMamalia

panas dingin

Ya Tidak

Klasifikasi 10

Page 11: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 11/14

Classification and Regression Trees (CART)

Klasifikasi 11

Page 12: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 12/14

Contoh

Grandparents

A lotA little

Klasifikasi 12

Page 13: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 13/14

Klasifikasi 13

DECISION TREE FOR THE CONCEPT

“Play Tennis” 

Day Outloo T e m Humidit Wind PlayT e nn

D1 Sunny Hot High W eak NoD2 Sunny Hot High Strong No

D3 Overcas Hot High Weak Yes

D4 Rain Mild High W eak Yes

D5 Rain Cool Normal W eak Yes

D6 Rain Cool Normal Strong NoD7 Overcas Cool Normal Strong Yes

D8 Sunny Mild High W eak No

D9 Sunny Cool Normal W eak Yes

D10 Rain Mild Normal W eak Yes

D11 Sunny Mild Normal Strong YesD12 Overcas Mild High Strong Yes

D13 Overcas Hot Normal W eak Yes

D14 Rain Mild High Strong No

[Mitchell,1997]Mitchell, 1997

Page 14: Klasifikasi-Pohon Keputusan

5/13/2018 Klasifikasi-Pohon Keputusan - slidepdf.com

http://slidepdf.com/reader/full/klasifikasi-pohon-keputusan 14/14

Klasifikasi 14

DECISION TREE FOR THE CONCEPT

“Play Tennis” 

Day Outloo Tem Humidit Wind PlayTenn

D1 Sunny Hot High Weak No

D2 Sunny Hot High Strong No

D3 Overcas Hot High Weak Yes

D4 Rain Mild High Weak Yes

D5 Rain Cool Normal Weak Yes

D6 Rain Cool Normal Strong No

D7 Overcas Cool Normal Strong Yes

D8 Sunny Mild High Weak No

D9 Sunny Cool Normal Weak Yes

D10 Rain Mild Normal Weak Yes

D11 Sunny Mild Normal Strong Yes

D12 Overcas Mild High Strong Yes

D13 Overcas Hot Normal Weak Yes

D14 Rain Mild High Strong No

[Mitchell,1997]Mitchell, 1997