Tipe Data dan Eksplorasi Data Menggunakan Weka dan R

Preview:

Citation preview

TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN RPraktikum 3 Data Mining – 23 Februari 2016

1Eksplorasi data

Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses.

Dalam eksplorasi data, hal yang harus diperhatikan yaitu tipe data

Tipe data terdiri dari nominal, ordinal, interval, rasio

2Eksplorasi data

2Eksplorasi data

3Eksplorasi data dengan Weka

Weka hanya dapat mengenali tipe data nominal dan numerik. Gunakan data weather.arff yang telah tersedia di weka

Gambar 3 Statistika ringkasan dari atribut outlook

4Eksplorasi data dengan Weka

Gambar 4 Statistika ringkasan dari atribut temperature

5Eksplorasi data dengan Weka

Gambar 5 Histogram atribut temperature terhadap kelas play

[Dekatkan kursor ke grafik]

6Eksplorasi data dengan Weka

Gambar 6 Histogram atribut windy terhadap kelas play

7Eksplorasi data dengan Weka

Gambar 7 Scatter plot humidty terhadap temperature

8Eksplorasi data dengan Weka

Gambar 8 instance info [double klik tanda kross pada scatter plot]

9Eksplorasi data dengan Weka

Latihan :coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data labor.arff yang terdapat di weka

10Eksplorasi data dengan R

Eksplorasi pada R tidak jauh berbeda dengan weka, hanya saja di R memiliki tipe data dan visualisasi data yang lebih lengkap dibandingkan weka.

Untuk lebih jelasnya kita import data insurance.csv [Tersedia di http://bit.ly/insurance_csv] dan simpan pada variabel data .

Untuk melihat tipe data tiap atribut ketikkan perintah :

11Eksplorasi data dengan R

Jika dibandingkan dengan Weka, R memiliki tipe data yang lebih lengkap seperti int, Factor, num.

Untuk melihat statistika ringkasan (misal pada atribut age dan sex) ketikkan perintah :

Jika dibandingkan dengan Weka, R memiliki hasil statistika ringkasan lebih lengkap yaitu Min, Q1, Median, Mean, Q3, dan Max.

12Eksplorasi data dengan R

Beberapa visualisasi yang tersedia pada R yaitu histogram, pie chart, line chart, boxplot, scatter plot.

Untuk membuat boxplot ketiikan perintah :

13Eksplorasi data dengan R

Untuk membuat histogram ketikkan perintah :

14Eksplorasi data dengan R

Untuk membuat scatter plot ketikkan perintah :

15Eksplorasi data dengan R

Latihan : coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data usedcars.csv [Tersedia di

http://bit.ly/1SZ0FPW] dengan menggunakan R

16Eksplorasi data

Terdapat tiga jenis analisa yang dapat dilakukan dengan menggunakan scatter plot:

1 Scatter plot dapat menunjukkan hubungan (korelasi) antara dua variabel/atribut dan juga dapat digunakan untuk mendeteksi hubungan non linier antar dua variabel/atribut.

2 Ketika label dari kelas tersedia scatter plot dapat digunakan untuk menyelidiki derajat kedua atribut dalam memisahkan kelas

3 Menganalisa pencilan/outlier.

17Eksplorasi data

Berikut perbedaan secara general terkait eksplorasi data dengan menggunakan Weka dan R

R WekaStatistika Ringkasan

Min, Max, Q1,Median,Q3,Mean

Min, Max, StdDev, Mean

Visualisasi Data Histogram, Scatter plot, pie chart, line chart, box plot

Scatter plot, Histogram

9

[Tugas LKP Tersedia di LMS]