42
Analisa Keputusan dan Data Mining Introduction to Data Mining 1

8-Introduction to Data Mining

Embed Size (px)

DESCRIPTION

akdm

Citation preview

Analisa Keputusan dan Data MiningIntroduction to Data Mining 1This presentation demonstrates the new capabilities of PowerPoint and it is best viewed in Slide Show. These slides are designed to give you great ideas for the presentations youll create in PowerPoint 2010!

For more sample templates, click the File tab, and then on the New tab, click Sample Templates.1What is Database? Database adalah sekumpulan data yang teroganisir (angka, teks, dll) yang bisa diproses.

2Contoh - Data Penjualan

3Contoh Informasi Pasien

4Data VS Informasi Informasi adalah data yang diolah dan diorganisir dengan baik sehingga bermakna. Informasi kemudian diubah menjadi knowledge .

5Proses Knowledge Discovery in Databases (KDD)

6Proses Knowledge Discovery in Databases (KDD)KDD adalah keseluruhan proses untuk mencari dan mengidentifikasi pola dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.

Data Mining merupakan salah satu bagian dari KDD. 7Kenapa perlu data mining?Ada banyak data tersimpan setiap hariTransaksi di bank/kartu kreditPenjualan di departmen store web data, e-commerceTeknologi komputer semakin canggih (dapat menyimpan data 1.000.000.000.000 bytes)

8Kenapa perlu data mining?Data bertambah dengan sangat cepat Remote sensor pada satelit (banyak sinyal)Telescope memindai langit (banyak gambar)Data menjadi luas dan sangat banyakTeknik tradisional tidak dapat diterapkan

9Kenapa perlu data mining?Tanpa tool yang kuat, data yang banyak hanya akan menjadi kuburan data

mengubah kuburan manjadi tambang emas10Apa itu Data Mining?Analisa dari observasi data uji untuk menemukan hubungan yang tidak terduga untuk meringkaskan data dalam cara baru yang dimengerti dan berguna

Suatu bidang interdisipliner yang bersama-sama membawa teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk menunjukan isu dalam penyaringan informasi dari data yang berukuran besar (Evangelos Simoudis dalam Cabena et al)11Tujuan Data Mining Menemukan hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.

Mengubah kuburan data menjadi tambang emas12

Manfaat Data Mining Sudut pandang komersialMenangani ledakan volume data yang kemudian diubah menjadi infomari berharga untuk meningkatkan daya saing suatu institusiContoh:Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik. Memprediksi tingkat penjualan Memprediksi perilaku bisnis di masa mendatang Mengidentifikasi produk yang terjual bersamaan13

Manfaat Data Mining Sudut pandang keilmuanUntuk menganalisa dan menyimpan data yang bersifat real time dan sangat besar contoh; Remote sensor yang ditempatkan di satelitTeleskop yang memindai langit Simulasi saintifik yang membangkitkan data ukuran terrabytes. 14Kapan kita perlu data mining? Scability Terdiri dari data yang besar High dimensionalityData memiliki banyak dimensi atau atribut Heterogeneous and complexData set terdiri dari banyak atribut dengan banyak tipe, continous dan categorial.15

Data Mining Pre-Processing DataMengapa perlu pre-processing? Incomplete : kekurangan nilai atau atribut tertentuNoisy : kesalahan atau nilai outlierInconsistence : ketidakcocokan dalam penggunaan kode atau nama16 Merupakan tahapan yang perlu dilakukan sebelum data di proses. Data Mining Pre-Processing Data17Hubungan data mining dengan ilmu lain 18

Aplikasi Data Mining Analisa PasarMenembak target pasar Melihat pola beli pemakai Cross Market AnalysisProfil Customer Identifikasi kebutuhan customer Menilai loyalitas customer Informasi summary19Aplikasi data mining Analisa perusahaan dan manajemen risikoPerencanaan keuangan dan evaluasi aset Perencanaan sumber daya Persaingan Telekomunikasi Menganalisa jutaan transaksi yang masuk20Apa yang (tidak) termasuk data mining?Apa yang bukan data miningMencari no telepon dalam daftar no telepon Mencari infomasi tentang amazon di sebuah search engineApa yang masuk dalam data mining?Mencari informasi tentang nama orang yang sering muncul di sebuah daerah Mengelompokan dokumen yang mirip dari sebuah search engine berdasarkan kontennya 21Data mining TechniquesPrediction methodMenggunakan beberapa variabel untuk memprediksi apa yang terjadi di masa mendatang Classification , forecasting Description method menemukan pola tersembunyi dalam sebuah data Clustering, association rule 22Association Rule: Pengertian Teknik data mining yang digunakan untuk menemukan aturan assosiatif antara suatu kombinasi item.

Teknik yang digunakan untuk mengetahui pola interaksi antar item.

Banyak digunakan dalam Market Basket Analysis 23Association Rule: Pengertian Contoh untuk mengetahui produk yang sering dibeli secara bersamaan di sebuah swalayanDengan melihat total semua transaksi yang terjadi. 24

Jika seorang konsumen membeli popok dan susu, biasanya dia juga akan membeli beerAssociation Rule: Pengertian Contoh lain;Toko olah raga

Toko komputer

25

Classification Pengertian Proses untuk menemukan sekumpulan model yang menjelaskan dan membedakan kelas-kelas data, sehingga model tersebut dapat digunakan untuk memprediksi nilai suatu kelas yang belum diketahui pada sebuah objek.

Data akan dibagi menjadi training set dan tes set26Classification Contoh 27

Classification Contoh Sky survey catalogingUntuk memprediksikan klas dari benda-benda langit (bintang dan galaxi), berdasarkan gambar yang ditangkap oleh teleskop28

Forecasting Perngertian Memprediksi nilai atau kejadian yang masa mendatang berdasarkan data masa lampau. Banyak menggunakan metode statistika, neural network Contoh;Memprediksi penjualan produk Memprediksi cuaca29Clustering Pengertian Bertujuan untuk mengidentifikasi sekelompok obyek yang mempunyai kemiripan karakteristik tertentu yang dapat dipisahkan dengan kelompok obyek yang lain, sehingga objek yang berada dalam kelompok yang sama relatif lebih homogen dari pada obyek pada kelompok yang berbeda30Clustering Pengertian Data dalam satu kelompok memiliki kemiripan satu sama lain (within / intra cluster)

Data yang berbeda kelompok tidak mirip satu sama lain (between/ inter cluster)

Kemiripan data diukur dengan menggunakan pengukuran jarak, bisanya adalah euclidean distance31Clustering Pengertian 32

Mengukur kesamaan obyek Euclidean distance Metode yang paling sering digunakan 33

Mengukur kesamaan obyek Squared Euclidean Distance

Chebyce

City Block Distance

34

Clustering - MetodeMetode Hierarki Memulai pengelompokan dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat hingga seterusnya. Akan berbentuk pohon dimana terdapat tingkatan dari yang paling mirip hingga paling tidak mirip.Dibantu dengan dendogram 35

Clustering - MetodeDendogram 36Clustering - MetodeMetode non-Hierarki Dimulai dengan menentukan terlebih dahulu jumlah kluster yang diinginkan (dua, tiga, dll).Proses pengelompokkan dilakukan tanpa mengikuti proses hierarki.Contoh; K-means algorithm37Clustering - Metode38Clustering - Metode39Clustering contoh Market segmentationMembagi kelompok konsumen berdasarkan beberapa atribut ) untuk mengotimalkan pemasaran Document clustering Mengelompokan dokumen berdasarkan kata yang sering muncul

40Clustering contoh 41

Exciting new transitions

They are new too.42Terima kasih.42