Prediksi numerik

Preview:

Citation preview

PREDIKSI Metode Data Mining

1 Data Warehouse & Data Mining

oleh

Aty Rachmawati

Aini Hanifa

Ridwan Effendi

Outline

Metode Prediksi

◦ Analisis Regresi

◦ CART

Penerapan di BI

Implementasi Tools

2 Data Warehouse & Data Mining

Klasifikasi vs Prediksi

KLASIFIKASI PREDIKSI

Memprediksi label

kategorik (diskrit & tak

terurut)

Prediksi Kategorik

Memprediksi label

numerik (kontinu &

terurut)

Prediksi Numerik

3 Data Warehouse & Data Mining

Baik/Buruk

Tipe A/B/C

Aman/Berisiko

Seberapa aman?

Seberapa berisiko?

Berapa jumlah

pendapatan?

Prediksi Numerik

Prediksikan

berapa besar

penghasilan yang akan

diterima karyawan

dengan masa kerja 15

tahun

Data Warehouse & Data Mining 4

Contoh:

Diberikan data berikut

Regresi Linear

Regresi Nonlinear

Model berbasis regresi lainnya

◦ CART (Classification and Regression Tree)

Metode Prediksi Numerik

5 Data Warehouse & Data Mining

Regresi Linear

Regresi Nonlinear

Model berbasis regresi lainnya

• CART(Classification and Regression Tree)

Analisis Regresi

Memodelkan hubungan antara satu atau

lebih variabel prediktor (independent var.)

dan sebuah variabel respons (dependent

var.)

• Regresi Linear Sederhana

• Regresi Linear Multivariabel

• Regresi Nonlinear

6 Data Warehouse & Data Mining

Contoh Regresi Linear

Data Warehouse & Data Mining 7

Tujuan: mencari persamaan linier (garis lurus) terbaik yang

menggambarkan data di atas.

Metode Least Square

Data Warehouse & Data Mining 8

}𝒆𝒏

} 𝒆𝟒 } 𝒆𝟑 } 𝒆𝟐

} 𝒆𝟏

𝑦 = 𝑤1𝑥 + 𝑤0 Metode untuk

meminimalkan

error titik data

terhadap model

regresi

Luaran:

Koefisien

regresi

Regresi Nonlinear

Menerapkan transformasi pada variabel-

variabel menjadi model regresi linear

Contoh:

𝑌 = 𝑒𝑤1𝑥+𝑤0

ln(𝑌) = 𝑤1𝑥 + 𝑤0

9 Data Warehouse & Data Mining

CART

Classification Tree Regression Tree

Data Warehouse & Data Mining 10

Penerapan di BI (lanj)

Memprediksi gaji lulusan perguruan tinggi

dengan x tahun pengalaman kerja

11 Data Warehouse & Data Mining

Penerapan di BI (lanj)

12

Memprediksi berapa lama waktu yang

diperlukan untuk mengantarkan pesanan

berikutnya dengan jarak sekian kilometer

Jarak

(km)

Waktu

(menit)

0,5 9,95

1,1 24,45

1,2 31,75

5,5 35

2,95 25,02

2 16,86

3,75 14,38Data Warehouse & Data Mining

Penerapan di BI (lanj)

Memprediksi kemajuan syaraf motorik

dan skor total dari orang yang mengalami

penyakit parkinson stadium awal dengan

pengukuran suara biomedis

13 Data Warehouse & Data Mining

Deskripsi Data

Data kriminalitas US 1995 (FBI)

Variabel Respon :total number of violent crimes per 100K popuation

Data Warehouse & Data Mining 14

Model Prediksi

Why?

CART dapat melakukan model prediksi

yang memiliki variable respon kontinu

Sederhana, mudah dipahami

Variable prediktor kategorik dan kontinu

Data Warehouse & Data Mining 15

Pra Prosesing Data

Seleksi atribut

Missing value

Data Warehouse & Data Mining 16

Hasil Prediksi

Root Mean Square Error=

480.706823727564

Mean Absolute Error= 315.266224317104

Relative Absolute Error=

0.796029235366585

Data Warehouse & Data Mining 17

Recommended