Upload
ui
View
4
Download
0
Embed Size (px)
Citation preview
PERANCANGAN DATA WAREHOUSE DAN PENERAPAN DATA MINING ANGGOTA COBRAND PADA SISTEM
FREQUENT FLYER : STUDI KASUS PT. GARUDA INDONESIA
KARYA AKHIR
MUJOKO 0706193813
UNIVERSITAS INDONESIA
FAKULTAS ILMU KOMPUTER
PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI
JAKARTA
JANUARI 2009
PERANCANGAN DATA WAREHOUSE DAN PENERAPAN DATA MINING ANGGOTA COBRAND PADA SISTEM
FREQUENT FLYER : STUDI KASUS PT. GARUDA INDONESIA
KARYA AKHIR Diajukan sebagai salah satu syarat
untuk memperoleh gelar Magister Teknologi Informasi
MUJOKO 0706193813
UNIVERSITAS INDONESIA
FAKULTAS ILMU KOMPUTER
PROGRAM STUDI MAGISTER TEKNOLOGI INFORMASI
JAKARTA
JANUARI 2009
ii
HALAMAN PERNYATAAN ORISINALITAS
Karya Akhir ini adalah hasil karya saya sendiri,
dan semua sumber baik yang dikutip maupun dirujuk
telah saya nyatakan dengan benar.
Nama : Mujoko
NPM : 0706193813
Tanda tangan :
Tanggal : 09 Januari 2009
iii
HALAMAN PENGESAHAN
Karya Akhir ini diajukan oleh : Nama : Mujoko NPM : 0706193813 Program Studi : Magister Teknologi Informasi Judul Karya Akhir : Perancangan Data Warehouse dan Penerapan Data Mining Anggota Cobrand Pada Sistem Frequent Flyer : Studi Kasus PT. Garuda Indonesia Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian persyaratan yang diperlukan untuk memperoleh gelar Magister Teknologi Informasi pada Program Studi Magister Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Indonesia.
DEWAN PENGUJI
Pembimbing : Yova Ruldeviyani, M.Kom ( ………………….……... )
Pembimbing : Yudho Giri Sucahyo, Ph.D, CISA ( …….. .………….……... )
Penguji : Dr. Indra Budi ( .………………….…….. )
Penguji : Dr. Achmad Nizar H ( …….................. ……... )
Ditetapkan di : Jakarta
Tanggal : 9 Januari 2009
i
KATA PENGANTAR
Segala puji syukur kepada Allah SWT, karena hanya dengan berkat dan
karunia-Nya penulis dapat menyelesaikan tesis yang berjudul “PERANCANGAN
DATA WAREHOUSE DAN PENERAPAN DATA MINING ANGGOTA
COBRAND PADA SISTEM FREQUENT FLYER STUDI KASUS PT. GARUDA
INDONESIA” ini sesuai dengan yang direncanakan. Tesis ini dibuat guna
melengkapi persyaratan kelulusan pada Program Studi Magister Teknologi
Informasi, Fakultas Imu Komputer, Universitas Indonesia. Saya menyadari bahwa,
tanpa bantuan dan bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada
penyusunan karya akhir ini, sangatlah sulit bagi saya untuk menyelesaikannya. Oleh
karena itu, saya mengucapkan terima kasih kepada:
(1) Orang tua, istri dan ananda Muhammad Ihsan yang telah memberikan dukungan
bantuan berupa api semangat.
(2) Ibu Yova Ruldeviyani, M.Kom sebagai dosen pembimbing yang telah membimbing
penulis selama mengerjakan Tesis ini.
(3) Bapak Yudho Giri Sucahyo, Ph.D, CISA, selaku dosen pembimbing akademik dan
ketua program studi Studi Magister Teknologi Informasi, yang telah menyediakan
waktu, tenaga, dan pikiran untuk mengarahkan saya dalam penyusunan skripsi ini
mulai dari penyusunan proposal hingga Tesis dan jabatannya berakhir
(4) Bapak Dr.Indra Budi selaku penguji dalam sidang tesis
(5) Bapak Dr.Achmad Nizar H. selaku penguji dalam sidang tesis, sekaligus ketua
program studi Magister Teknologi Informasi mendatang dan selamat atas
jabatannya.
(6) Bapak K. Budiyanto, Ibu Lusi, Ibu Cita, Pak Sonny dan segenap staff karyawan
Garuda yang telah bersedia meluangkan waktu untuk menjawab pertanyaan-
pertanyaan penulis dan menyediakan data, semoga Allah membalas kebaikan rekan
semua.
(7) Ibu Connie dan Pak Heru selaku atasan saya yang memberi kesempatan pada saya
untuk mengeksplorasi FFP sebagai bahan kajian.
(8) Sahabat-sahabat saya di FFP yang telah berjuang siang dan malam, Bank
Dukun/Mukhlis, Pak Dipo, Iin, Vera, Jonny dan Gardiary sang pejantan, yang
telah banyak membantu saya dalam menyelesaikan karya akhir ini.
ii
(9) Bang Haikal, yang tela membantu saya selama saya sakit atas dukungannya
berupa materi dan material. Semoga Allah membalas kebaikan abang.
(10) Rekan kelas B dan kelompok ABUDOMM, terima kasih atas kebersamaan
dan kenangan indah yan tak terlupakan selama di MTI.
(11) Kang Asep dan Dodick dengan tumpangan kendaraan setiap saya pulang
selama kuliah.
(12) Mas Ganda yang telah menyumpahi saya agar mendapat nilai yang terbaik.
Akhir kata, saya berharap Tuhan Yang Maha Esa berkenan membalas
segala kebaikan semua pihak yang telah membantu. Semoga karya akhir ini
membawa manfaat bagi pengembangan ilmu.
Jakarta, 9 Januari 2009
Penulis
iii
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA AKHIR UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini: Nama : Mujoko NPM : 0706193813 Program Studi : Magister Teknologi Informasi Departemen : Magister Teknologi Informasi Fakultas : Ilmu Komputer Jenis Karya : Tesis Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Indonesia Hak Bebas Royalti Nonekslusif (Non-exclusive Royalty-Free Right) atas karya ilmiah saya yang berjudul : Perancangan Data Warehouse dan Penerapan Data Mining Anggota Cobrand Pada Sistem Frequent Flyer : Studi Kasus PT. Garuda Indonesia Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-ekskutif ini Universitas Indonesia berhak menyimpan, mengalihmedia/formatkan, mengelola dalam bentuk pangkalan data (database). Merawat, dan mempublikasikan karya akhir saya tanpa meminta izin dari saya selama tetap mencantumkan saya sebagai penulis/pencipta dan sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di : Jakarta Pada tanggal : .09 Januari 2009
Yang menyatakan
(………Mujoko…………)
iv
ABSTRACT
Globalization is now inevitable, which causes airlines to face a major problem nowadays. Time becomes major influence in decission making. If the management takes a lot of time in decision making, then company will be stagnant or even decline. There are needs to execute business decision with little time consuming, so that more opportunities can be captured with less cost. In addition to time consuming, accuracy is also a vital necessity for mature analysis and rational calculation. Any information from the insignificant one, as long as it is relevance and accurate can be used as an opportunity for increasing revenue. The main principle is how to optimize aircraft load to its maximum capacity as often as possible. In the context of winning a competition, the combination of a flexible management style and utilization of Information Technology become a vital element. Any business entity can survive depends on the existence of its customer. In order to gain more customer, business player has to execute strategy and innovation. This is necessary to influence people in choosing services provider. In this case, the context is airline service business. Any kind of Loyality Program such as Garuda Frequent Flyer (GFF), has important role in targeting core customer, i.e. customer that give the highest revenue to the company. GFF operational system that keeps information of customer profile and flight transaction, needs to be collected into a single form of data warehouse and updated periodically, so that reporting function can be executed without affecting operational performance. The extensive use of data with datamining technique could assist management in making the right decision based on historical data. Additionally, datamining has to be relevance and being part of business process in order to improve business performance. The focus of this research is to develop initial phase of datamining that can be scaled up in future, not a practical solution that can be directly used. Keyword : Data Warehouse, Data Mining, Frequent Flyer, Garuda Frequent Flyer xii+109 pages; 35 figures; 10 tables; 8 attachments; 0 technical documentation Bibliography: 16 (2001- 2008)
v
ABSTRAK
Globalisasi memang arus yang tidak bisa ditangkal. Airlines menghadapi masalah besar pada saat ini dan hari-hari mendatang. Manajemen yang terbiasa lambat mengambil keputusan dipastikan hanya akan membawa perusahaannya stall. Diperlukan kecepatan dalam mengeksekusi bisnis, agar kesempatan dapat diraih lebih banyak. Selain kecepatan, diperlukan juga ketepatan pengambilan keputusan, berdasarkan analisa perhitungan yang rasional dan matang. Persaingan mengkondisikan bisnis airlines dalam kondisi perang total. Informasi yang sekecil apapun tetapi relevan dimanfaatkan sebagai sebuah peluang untuk meningkatkan pendapatan. Prinsipnya adalah bagaimana memenuhi kapasitas angkut pesawat secara maksimal dan sesering mungkin. Dalam konteks memenangkan persaingan ini perpaduan antara gaya manajemen yang fleksibel dan peran teknologi informasi menjadi amat vital. Setiap bisnis akan tetap eksis jika dia memiliki customer. Untuk mendapatkan customer, pelaku bisnis melakukan berbagai strategi dan inovasi yang akan mempengaruhi ketertarikan orang dan memutuskan menggunakan layanan yang ditawarkan oleh penyedia layanan jasa/barang, dalam hal ini layanan angkutan penerbangan. Loyality program semacam Garuda Frequent Flyer (GFF), memegang peranan penting untuk membidik core customer, customer yang paling banyak memberikan benefit bagi perusahaan. Sistem operasional GFF yang menyimpan data anggota dan transaksi penerbangan, perlu dikumpulkan dalam satu bentuk data warehouse dan secara periodik di-update, sehingga reporting dapat dieksekusi dari data warehouse tanpa mempengaruhi kinerja operasional. Penggunaan data yang ekstensif dengan menggunakan teknik data mining dapat membantu managemen dalam mengambil kebijakan yang tepat berdasar data-data historical. Agar data mining dapat mempengaruhi bisnis, maka data mining sendiri harus relevan dan menjadi bagian dari bisnis proses. Kata Kunci : Data Warehouse, Data Mining, Frequent Flyer, Garuda Frequent Flyer xii+109 halaman; 35 gambar; 10 table; 8 lampiran; 0 technical documentation Bibliography: 16 (2001- 2008)
vi
DAFTAR ISI
KATA PENGANTAR........................................................................................................................ I
ABSTRACT....................................................................................................................................... IV
ABSTRAK..........................................................................................................................................V
DAFTAR ISI .................................................................................................................................... VI
DAFTAR GAMBAR.........................................................................................................................X
DAFTAR TABEL...........................................................................................................................XII
BAB I PENDAHULUAN...................................................................................................................1
1.1 LATAR BELAKANG .....................................................................................................................1 1.2 PERMASALAHAN ........................................................................................................................2 1.3 PEMBATASAN MASALAH............................................................................................................3 1.4 TUJUAN DAN MANFAAT PENELITIAN.........................................................................................4
BAB II LANDASAN TEORI ............................................................................................................5
2.1 DATA WAREHOUSE ......................................................................................................................5 2.1.1 Definisi Data Warehouse ..................................................................................................5 2.1.2 Penelitian Implementasi Data Warehouse .......................................................................6 2.1.3 Sistem Operasional dan Sistem Pendukung Pengambilan Keputusan ............................7 2.1.4 Keuntungan Data Warehouse ...........................................................................................8 2.1.5 Kategori Data pada Data Warehouse ............................................................................10 2.1.6 Arsitektur Data Warehouse.............................................................................................10 2.1.7 Tahapan Data Warehouse...............................................................................................12 2.1.8 Desain Data Warehouse..................................................................................................15
2.2 DATA MINING ............................................................................................................................17 2.2.1 Definisi Data Mining.......................................................................................................17 2.2.2 Teknik Data Mining.........................................................................................................18 2.2.2.1 Predictive Modeling .....................................................................................................19 2.2.2.2 Database Segmentation dengan Clustering.................................................................21 2.2.2.3 Link Analysis ................................................................................................................22 2.2.2.4 Deviation Detection......................................................................................................23 2.2.3 Tahap-Tahap Data Mining .............................................................................................24
2.3 BISNIS AIRLINE DAN DATA MINING ...........................................................................................27
vii
2.3.1 Loyalty Program dan Frequent Flyer Program .............................................................28 2.4 TOOLS DEVELOPMENT...............................................................................................................30
2.4.1 Pentaho Data Integration (PDI/Kettle) ..........................................................................30 2.4.2 Mondrian .........................................................................................................................31
2.5 KEBUTUHAN DATA MINING DALAM FREQUENT FLYER PROGRAM ............................................31
BAB III METODOLOGI PENELITIAN......................................................................................32
3.1 PENGUMPULAN DATA ..............................................................................................................32 3.2 KEBUTUHAN BISNIS DAN INFORMASI ......................................................................................32 3.3 PERANCANGAN DATA WAREHOUSE ..........................................................................................33 3.4 IMPLEMENTASI DATA MINING...................................................................................................33
BAB IV PERANCANGAN DATA WAREHOUSE .....................................................................36
4.1 PROFIL PERUSAHAAN...............................................................................................................36 4.1.1 Latar Belakang Perusahaan ...........................................................................................37 4.1.2 Visi dan Misi Perusahaan ...............................................................................................37 4.1.3 Struktur Organisasi Perusahaan ....................................................................................38
4.2 PEMAHAMAN TERHADAP PROSES BISNIS ................................................................................40 4.2.1 Pendaftaran (Enrollment) ...............................................................................................42 4.2.2 Upgrade/Downgrade Tier ...............................................................................................43 4.2.3 Aktifitas Earning Anggota...............................................................................................44 4.2.4 Aktifitas Redeem Anggota ...............................................................................................44 4.2.5 Keseimbangan Accrual dan Reedem........................................................................45 4.2.6 Kerja Sama Partner.........................................................................................................45
4.3 PERANCANGAN ARSITEKTUR ...................................................................................................45 4.3.1 Arsitektur logical .............................................................................................................46 4.3.2 Arsitektur Fisik ................................................................................................................47 4.3.4 Sumber Data....................................................................................................................48 4.3.5 Data Staging....................................................................................................................49 4.3.6 Proses ETL ......................................................................................................................50 4.3.6.1 Proses Extract .......................................................................................................50 4.3.6.2 Proses Cleansing...................................................................................................51 4.3.6.3 Proses Transformasi .............................................................................................52 4.3.6.4 Proses Loading......................................................................................................53 4.3.7 Model Data Warehouse...................................................................................................55 4.3.6.1 Model Customer....................................................................................................55 4.3.6.2 Model Air Transaction (Earning).........................................................................56 4.3.6.3 Model Non Air Transaction (Earning) .................................................................57 4.3.6.4 Model Certificate Transaction (Spending)..........................................................58
viii
4.3.6.5 Tabel Dimensi .......................................................................................................60 4.3.6.5.1 Dimensi Airport.........................................................................................................60 4.3.6.5.2 Dimensi Location ......................................................................................................60 4.3.6.5.3 Dimensi Gender.........................................................................................................60 4.3.6.5.4 Dimensi Customer Status ..........................................................................................61 4.3.6.5.5 Dimensi Member Tier Composition..........................................................................61 4.3.6.5.6 Dimensi Booking Class .............................................................................................61 4.3.6.5.7 Dimensi Time.............................................................................................................61 4.3.6.5.8 Dimensi Operating Flight Number ...........................................................................62 4.3.6.5.9 Dimensi Partner ........................................................................................................62
BAB V IMPLEMENTASI DATA WAREHOUSE ......................................................................63
5.1 PRESENTASI DATA WAREHOUSE................................................................................................63 5.2 PENYEDIAAN INFORMASI .........................................................................................................64
5.2.1 Informasi Customer.........................................................................................................65 5.2.2 Informasi Earning/Accrual Traffic .................................................................................69
5.2.3 INFORMASI REDEEM TRAFFIC ................................................................................................70 5.3 PENGARUH PERUBAHAN ..........................................................................................................71
BAB VI IMPLEMENTASI DATA MINING.................................................................................74
6.1 PEMAHAMAN TERHADAP BISNIS..............................................................................................74 6.2 SUMBER DATA .........................................................................................................................75 6.3 PEMILIHAN TEKNIK DAN PERANGKAT LUNAK DATA MINING.................................................76 6.4 PERSIAPAN DATA ............................................................................................................77
6.4.1 Persiapan Data Teknik Association Rule..................................................................77 6.4.2 Persiapan Data Teknik Decision Tree ......................................................................81
6.5 ANALISA HASIL UJI COBA...............................................................................................82 6.5.1 Analisa Hasil Uji Coba Dengan Teknik Association Rule.......................................82 6.5.2 Analisa Hasil Uji Coba Dengan Teknik Decision Tree ...........................................85
BAB VII KESIMPULAN ................................................................................................................89
7.1 KESIMPULAN ...................................................................................................................89 7.2 SARAN .............................................................................................................................90
DAFTAR PUSTAKA.......................................................................................................................91
LAMPIRAN-LAMPIRAN ..............................................................................................................93
LAMPIRAN 1 ...................................................................................................................................93
LAMPIRAN 2 ...................................................................................................................................97
LAMPIRAN 3 .................................................................................................................................102
ix
LAMPIRAN 4 .................................................................................................................................103
LAMPIRAN 5 .................................................................................................................................104
LAMPIRAN 6 .................................................................................................................................107
LAMPIRAN 7 .................................................................................................................................108
LAMPIRAN 8 .................................................................................................................................109
x
DAFTAR GAMBAR
Gambar 2.1 Arsitektur data warehouse (Ponniah, 2001)..................................... 11
Gambar 2.2 – Contoh transformasi single-field (Zain, 2008) ............................... 14
Gambar 2.3 – Contoh transformasi multi-field (Zain, 2008) ................................ 14
Gambar 2.4 Star Schema (Ponniah, 2001) ............................................................ 16
Gambar 2.5 Snow flake Schema (Ponniah, 2001) ................................................. 17
Gambar 2.6 Clasification menggunakan tree induction
(http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html)....... 20
Gambar 2.7 Clasification menggunakan neural network (Connonly and Begg,
2005) ..................................................................................................................... 20
Gambar 2.9 Tahap-tahap data mining (Zein, 2008).............................................. 24
Gambar 3.1 Tahap-tahap metodologi penelitian................................................... 34
Gambar 4.1-Struktur Organisasi Executive Vice President .................................. 38
Gambar 4.2- Struktur Organisasi Customer Relation Management. .................... 39
Gambar 4.3- Arsitektur logical Garuda Frequent Flyer....................................... 47
Gambar 4.4- Arsitektur fisik data warehouse Garuda Frequent Flyer ................ 48
Gambar 4.5- Alur transformasi transaksi penerbangan anggota GFF................... 52
Gambar 4.6- Alur transformasi tabel AIRPORT ................................................... 53
Gambar 4.7- Skema job pada Spoon yang mengurutkan pengerjaan transformasi
yang telah dibuat sebelumnya ............................................................................... 54
Gambar 4.8- Model skema bintang enrollment anggota GFF............................... 55
Gambar 4.9- Model skema bintang aktifitas penerbangan anggota...................... 57
Gambar 4.10- Model skema bintang aktifitas bukan penerbangan (non air activity)
anggota GFF.......................................................................................................... 58
Gambar 4.11- Model skema bintang redeem (penggunaan mileage) anggota GFF
............................................................................................................................... 59
Gambar 5.1- Contoh report Customer per branch office pada tahun 2007........... 66
Gambar 5.2- Contoh report Customer per Tier Composition pada tahun 2007.... 67
Gambar 5.3 - Contoh report Customer per yang melakukan aktivasi pada tahun
2007....................................................................................................................... 67
xi
Gambar 5.4 Informasi Customer yang terdistribusi dalam beberapa tier yang di
slice hanya tahun 2007 dan drill-down berdasar usianya...................................... 68
Gambar 5.5 Informasi Enrolment Customer yang terdistribusi dalam dalam tahun
pendaftaran dilengkapi dengan grafik trend enrollment. ...................................... 68
Gambar 5.6- Earning mileage customer yang di-slice berdasarkan Origin
Destination airport penerbangan .......................................................................... 69
Gambar 5.7- Earning mileage customer yang di slice berdasarkan Origin
Destination airport penerbangan yang dilengkap dengan grafik pie chart. ......... 70
Gambar 5.8- Contoh report redeem activity per branch office pada tahun 2007 . 71
Gambar 5.9- Langkah-langkah implementasi jenis report baru. .......................... 72
Gambar 6.1 Building block menggunakan Rapid miner Community 4.2 dengan
teknik data mining association rule ...................................................................... 78
Gambar 6.2 Building block metode Decision tree menggunakan Rapidminer
Community 4.2 ...................................................................................................... 82
Gambar 6.3 Bagian dari diagram pohon karakter anggota Cobrand yang
mendaftar melalui channel Cobrand atau Citibank .............................................. 85
Gambar 6.4 Bagian diagram pohon karakter anggota Cobrand yang mendaftar
melalui Customer Self Service (CSS).................................................................... 86
Gambar 8.1 Pola anggota GFF Cobrand yang melakukan pendaftaran melalui
jalur BO............................................................................................................... 102
Gambar 8.2 Pola anggota GFF Cobrand yang melakukan pendaftaran melalui
jalur BO, CSS dan jalur Citibank atau disebut channel Cobrand...................... 103
xii
DAFTAR TABEL
Tabel 2.1 Tabel operasi data mining dan teknik yang digunakannya (Zein, 2008)
............................................................................................................................... 19
Tabel 3.1 Alur Pengerjaan..................................................................................... 35
Tabel 4.1- Platform database sistem GFF operasional dan pertambahan data.... 49
Tabel 4.2-Perbandingan sumber data GFF dan DatabaseTemp............................ 50
Tabel 4.3-Perbedaan format data .......................................................................... 51
Tabel 4.4-Ketidak konsistenan data penerbangan anggota GFF karena duplikasi
data. ....................................................................................................................... 51
Tabel 6.1 Tabel sebelum transformasi ................................................................. 79
Tabel 6.2 Tabel setelah transformasi/preprocessing ........................................... 80
Tabel 6.3 Model Rule dengan kesimpulan masa keanggotaan Cobrand dalam
mendaftar melalui channel BO ............................................................................. 83
Tabel 6.4 Model Rule dengan kesimpulan masa keanggotaan Cobrand dalam
range1, range2, dan range2. ................................................................................. 84
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kebutuhan informasi bagi organisasi bisnis adalah kebutuhan utama yang
harus dipenuhi agar bisnis organisasi tersebut dapat bertahan dalam persaingan.
Pemanfaatan teknologi untuk menggali dan menyimpan berbagai informasi
menjadi penting adanya agar pengolahan dan pengelolaannya bisa optimal.
Teknologi data warehouse dan teknik data mining adalah salah satu teknologi
yang digunakan dalam Bisnis Intelligent (BI). Baik data warehouse dan data
mning bersumber pada aktifitas organisasi yang bersangkutan dengan tujuan
mendapat competitive advantage melalui analisis data internal
Frequent Flyer Program adalah program yang memberikan apresiasi
berdasarkan loyalitasnya. Frequent Flyer Program setiap airline brand-nya
berbeda-beda. Lufthansa Airline memiliki miles and more, Singapore Airline
memiliki KrisFlyer dan Garuda Airline (GA) memiliki Garuda Frequent Flyer
atau disingkat GFF. Program frequent flyer pada prinsip adalah customer akan
mendapatkan reward berupa poin (disebut miles) untuk setiap penerbangan
bersama pemilik airline atau airline partner, dan besarnya reward tergantung
pada jarak terbang, frekuensi terbang dan level member .
Jumlah anggota aktif GFF saat ini mencapai sekitar 300 000, meningkat 100
000 orang di tahun sebelumnya. Anggota GFF memiliki tingkatan/level disebut
Tier. Semakin banyak transaksi anggota dengan GA semakin besar pula poin
yang dikumpulkan dan tingkatan member. Tier tersebut berturut-turut dari rendah
ke tinggi adalah Temp, Blue, Silver , Gold dan Platinum dengan fasilitas dan
keuntungan yang berbeda.
2
Seiring waktu, data transaksi GFF terus meningkat seiring bertambah
banyaknya promosi-promosi juga peningkatan data customer. Data-data tersebut
disimpan dalam database. Tetapi pertumbuhan data yang pesat tersebut telah
menciptakan kondisi menumpuknya data tidak bisa diutilisasi sebagai sumber
informasi dan bernilai hanya sebagai tumpukan data. Data-data tersebut harus
dapat dikonversikan menjadi suatu informasi yang berguna.
Diperlukan suatu tools atau teknik yang dapat digunakan untuk menggali
lebih dalam informasi penting yang dapat diperoleh di dalam database. Business
Intelligence (BI) merupakan tools yang mampu menjawab kebutuhan di atas. BI
telah banyak digunakan oleh berbagai perusahaan dalam mengelola data dan
informasi sampai dengan dukungan pengambilan keputusan.
Anggota GFF Cobrand adalah jenis anggota yang memiliki kartu kredit
Citibank. Level tier anggota Cobrand menempati posisi Platinum, posisi tertinggi
dalam level GFF. Anggota jenis ini tidak harus melalui tier yang lebih rendah
yakni Temp, Blue, Silver dan Gold. Anggota Cobrand dianggap sebagai customer
yang potensial karena dengan kepemilikan kartu kredit, maka diasumsikan
customer tersebut masuk pada golongan orang yang memiliki pendapatan tinggi.
Timbul pertanyaan “Bagaimanakah rancangan data warehouse yang
mendukung penerapan data mining anggota Cobrand pada Sistem Frequent Flyer
di Garuda Indonesia?”.
1.2 Permasalahan
Kondisi sistem operasional GFF menampung banyak data yang lebih
banyak penggunaannya digunakan untuk kegiatan oprasional. Penggunaan data
sebagai sumber analisis adalah melalui modul reporting dari sistem GFF sendiri.
Beberapa kendala dalam penyediaan data analisis tersebut adalah;
Sistem report GFF dapat secara signifikan mengurangi performance
aplikasi hingga mengganggu jalannya aplikasi.
3
Standar report yang tersedia belum memadai dengan adanya report yang
terus berkembang.
Adanya kecenderungan permintaan report yang semakin kompleks dari
waktu ke waktu.
Terus bertambahnya jumlah report dengan tingkat kompleksitas yang
makin beragam.
Report yang tersedia belum belum memiliki informasi yang ditampilkan
secara visual sehingga mudah di baca oleh stakeholder.
Sering terjadi request report yang harus tersedia saat itu juga.
Informasi rutin maupun insidental yang dibutuhkan oleh level-level
pimpinan untuk proses perencanaan maupun pengambilan keputusan
terkadang relatif sulit disajikan.
Rumusan masalah dalam penelitian ini adalah merancang bangun sistem
pengelolaan data yang baik dan dapat menghasilkan informasi sesuai kebutuhan
secara cepat dan mudah dimengerti.
1.3 Pembatasan Masalah
Penelitian ini bertujuan untuk membantu divisi Customer Loyalty Garuda
dalam pembangunan data warehouse dan penerapan teknik data mining, sehingga
dapat mempermudah proses ekstraksi informasi yang dibutuhkan guna menggali
dan memprediksi potensi-potensi yang ada.
Pembangunan BI meliputi perancangan data warehouse dan pemanfaatan
data mining. Berdasarkan pertanyaan di sub bab latar belakang, ruang lingkup
penelitian yaitu perancangan data warehouse dan pemanfaatan data mining,
dalam rangka meningkatkan kualitas dan pelayanan Garuda Airlines. Lingkup
organisasi dibatasi pada divisi Customer Loyality.
4
1.4 Tujuan dan Manfaat Penelitian
Penelitian ini bertujuan untuk membantu divisi Customer Loyalty Garuda
dalam pembangunan BI dengan cakupan data warehouse dan penerapan teknik
data mining untuk anggota Cobrand, sehingga dapat mempermudah proses
ekstraksi informasi yang dibutuhkan guna menggali dan memprediksi potensi-
potensi yang ada atau lebih spesifik untuk menilai customer equity untuk setiap
jenis customer.
Dengan pengumpulan data ke dalam data warehouse dan penerapan data
mining diharapkan dapat membantu perusahaan dalam menghadirkan quality of
service yang baik. Dengan dipisahnya data online transaction processing (OLTP)
dan data warehouse diharapkan performance tidak terganggu saat membuat
report. dan diharapkan dapat memperoleh informasi-informasi strategic dari data
sistem GFF.
5
BAB II
LANDASAN TEORI
Pada bagian ini penulis menjelaskan landasan teori yang menjadi acuan
dalam penelitian ini yaitu landasan teori mengenai data warehouse dan data
mining. Pada sub bab data warehouse penulis menjelaskan pengertian data
warehouse, model arsitektur data warehouse yang akan digunakan berikut teknik
dan proses yang akan dilakukan untuk membentuknya. Pada sub data mining akan
dijelaskan mengenai pengertian dan kegunaan data mining berikut teknik dan
proses membuatnya.
2.1 Data Warehouse
Data warehouse merupakan database relational yang didesain untuk
melakukan lebih dari sekedar proses transaksi tapi lebih mengarah pada proses
query dan analisa. Biasanya terdiri dari historical data yang diambil dari
transaction data, tapi bisa juga berasal dari sumber yang lain. Data warehouse
memisahkan antara analisa dan transaksi dan memungkinkan suatu organisasi
untuk mengkonsolidasikan data dari beberapa source.
2.1.1 Definisi Data Warehouse
Muntean (2007) mendefinisikan data warehouse sebagai kumpulan
informasi yang disimpan dalam database yang digunakan untuk mendukung
pengambilan keputusan dalam sebuah organisasi. Data dikumpulkan dari berbagai
aplikasi yang telah ada. Data yang telah dikumpulkan tersebut kemudian
divalidasi dan direstrukturisasi lagi, untuk selanjutnya disimpan dalam data
warehouse. Pengumpulan data ini memungkinkan para pengambil keputusan
untuk pergi hanya ke satu tempat untuk mengakses data yang ada tentang
organisasinya.
Sebagai tambahan, data memuat proses extraction, transportation,
transformation, and loading (ETL) solution, mesin online analytical processing
6
(OLAP), client analysis tools, dan aplikasi lainnya yang mengatur proses
pengumpulan dan pengiriman data ke user.
Data warehouse sering menjadi bagian inti dari infrastruktur business
intelligent (BI) organisasi. Data warehouse adalah kumpulan dari basis data yang
terintegrasi dan subject oriented yang didesign untuk mendukung DSS (Decision
Support Systems). Karakter utama dari data warehouse antara adalah lain
(Muntean et al, 2007):
• Subject oriented, data disusun dan diorganisasikan berdasarkan
bagaimana users menggunakannya.
• Semua sifat ketidak konsistenan yang disebabkan oleh kesepakatan
penamaan dan representasi nama dihilangkan
• Time Variant, data bersifat kekinian tapi lebih bersifat time series.
• Non volatile, data di simpan dalam dalam format read-only dan tidak
akan berubah.
2.1.2 Penelitian Implementasi Data Warehouse
Bentuk-bentuk penelitian dalam perancangan data warehouse meliputi
berbagai bidang. Data warehouse dimanfaatkan untuk mendapatkan informasi
kinerja dosen (jumlah mata kuliah yang diajarkan, jumlah kelulusan/
ketidakllusan), kinerja mahasiswa (jumlah mata kuliah yang lulus/tidak lulus
dibanding mata kuliah yang diambil), summary tiap nilai mata kuliah yang
memiliki nilai A, B, dan C, (Handojo et al, 2004). Data warehouse juga
digunakan dibidang medis untuk membantu menyediakan sumber data dalam
infrastruktur BI dunia medis. BI dalam mengambil keputusan dalam memberikan
tindakan terbaik terhadap pasien (Bhattacharyya ,2005).
Menurut Bhattacharyya (2005), BI adalah serangkaian proses untuk
mengubah data menjadi informasi yang pada akhirnya menjadi pengetahuan
Data adalah angka-angka, gambar, kata-kata dan lain-lain. Data mendorong
terbentuknya informasi atau pengetahuan. Aplikasi operasional menyimpan data
transaksi secara simultan, sehingga pertambahan data tidak bisa dihindarkan.
7
Semakin besar data tersimpan, akan mempengaruhi performace aplikasi, terutama
modul reporting.
Handojo dan Silivia (2004) melaporkan bahwa pada kasus implementasi
data warehouse di Universitas Petra Surabaya, dengan adanya data warehouse,
proses penyusunan laporan menjadi lebih sederhana, karena pengguna bisa
melakukan customization report sesuai dengan yang diinginkan, sehingga tercipta
efisiensi waktu dari yang sebelumnya satu bulan (dengan program tambahan) atau
seminggu (manual) menjadi satu hari.
Ariana (2007) juga menyebutkan hal yang sama bahwa implementasi data
warehouse dalam organisasinya (Universitas Nasional) membantu pengambil
kebijakan. Pada kasus UNAS lebih spesifik digunakan untuk mengenali pola
karakterisitik mahasiswa yang mengambil program peminatan tertentu di program
studi Manajemen Perusahaan UNAS dengan dibantu data mining.
2.1.3 Sistem Operasional dan Sistem Pendukung Pengambilan Keputusan
Data operasional dan data yang tersimpan berbeda. Ponniah (2001)
memaparkan perbedaan tersebut diantaranya;
1. Dalam sistem operasional, data yang disimpan menunjukan data yang
sekarang (Current Values), sedangkan apa yang tersimpan dalam data
warehouse adalah data archived atau data sebagai hasil penurunan-
penurunan atau summarized dari suatu data besar.
2. Dilihat dari struktur keduanya juga berbeda, data operasional didesign
dengan sedemikian sehingga optimum untuk melakukan transaksi,
sedangkan dalam data warehouse dioptimalkan untuk menghandle query
yang rumit.
3. Penggunaan data operasional bersifat perulangan, sedangkan data
warehouse bersifat ad-hoc, acak dan heuristic.
4. Ditinjau dari frequency mengaksesnya, data operasional sangat sering
diakses sedangkan data warehouse levelnya sedang atau jarang.
5. Jika dalam data operasional akses terhadap datanya bisa read, update atau
bahkan delete, maka dalam data warehouse hanya bisa read.
8
6. Jumlah pengguna juga berbeda, jika operasional digunakan oleh orang
banyak, sedangkan data warehouse oleh beberapa orang saja untuk
mendukung analisa keputusan.
Perbedaan tersebut adalah karena memang adanya perbedaan tujuan dari
dibuatnya sistem. Data Operasional digunakan untuk menjalankan operasional
bisnis dengan cara memasukan data-data kedalamnya. Dalam data warehouse
tujuannya adalah mendapatkan informasi yang bisa mendukung pengambilan
keputusan. Pengguna bisa produk mana yang menjadi favorit, daerah mana yang
banyak mengalami masalah penjualan, kenapa bisa terjadi masalah (drill down),
yang pada prinsipnya untuk menangkap peluang dan mengurangi resiko dalam
menjalankan bisnis.
2.1.4 Keuntungan Data Warehouse
Implementasi data warehouse yang tepat dapat memberikan keuntungan-
keuntungan antara lain:
1. Meningkatkan produktifitas dari pengambil keputusan perusahaan
Data warehouse meningkatkan produktifitas dari pengambil keputusan
perusahaan dengan membuat integrasi database yang konsisten, berorientasi
subject dan historical data. Data warehouse mengintegrasikan data dari banyak
sistem yang tidak kompatibel menjadi suatu bentuk yang menyediakan satu
tampilan yang konsisten mengenai perusahaan. Dengan mentransformasikan
data menjadi informasi yang berguna, data warehouse mengijinkan si
pengambil keputusan untuk melakukan analisis lebih sesuai dengan kenyataan ,
akurat dan konsisten.
2. Potensi ROI (Return On Investment) yang besar
Suatu perusahaan akan mengeluarkan sumber daya yang cukup besar
untuk mengimplemtasikan data warehouse dan pengeluaran yan berbeda-beda
sesuai dengan variasi solusi teknikal yang akan diterapkan pada perusahaan.
Bagaimana pun juga. Suatu studi oleh International Data Corporation (IDC)
9
pada tahun 1996 melaporkan bahwa rata-rata tiga tahun return of investment
(ROI) dalam data warehouse mencapai 401% dengan lebih dari 90% dari
perusahaan yang disurvei mencapai lebih dari 40% ROI, setengah dari
perusahaan mencapai lebih dari 160% ROI, dan seperempat lebih mendapat
lebih dari 600% ROI (IDC, 1996);
3. Competitive Advantage
Return on investment yang besar dari perusahaan yang berhasil
mengimplementasikan suatu data warehouse adalah bukti dari sangat besarnya
competitive advantage yang dapat diperoleh dengan menggunakan teknologi in.
Competitive advantage diperoleh dengan mengijinkan si pengambil keputusan
untuk mengakses data tersembunyi yang sebelumnya tidak tersedia, tidak di
ketahui, dan tidak dimanfaatkan seperti data mengenai pelanggan, tren, dan
permintaan.
Berikut adalah contoh-contoh peluang yang ada karena ketersediaan
informasi strategic menurut Ponniah (2001):
Ketersediaan informasi strategic di salah satu bank terbesar di United
States dengan asset $250 billion memberikan kesempatan pada users untuk
membuat keputusan yang cepat untuk mempertahankan nilai mereka pada
customer.
Pada kasus organisasi pelayanan kesehatan yang besar, terjadi peningkatan
yang signifikan program-program pelayanan kesehatan yang terealisasi,
dengan hasil 22% penurunan kunjungan emergency room, 29% penurunan
terhadap pasien anak asma, diabetes dan peningkatan tingkat vaksinasi dan
lebih 100.000 performance report dibuat untuk pasien dan apoteker.
Komunitas apoteker yang bersaing dalam skala nasional dengan lebih dari
800 franchise apotik mengerti betul apa yang dibutuhkan oleh customer,
hasilnya penurunan level inventory, meningkatkan efektifitas promosi dan
marketing, meningkatkan keuntungan bagi perusahaan.
10
2.1.5 Kategori Data pada Data Warehouse
Untuk memahami data warehouse lebih dalam, ada dua aspek penting
yang harus di pahami yaitu pertama adalah memahami tipe spesifik
(classification) dari data yang akan disimpan di data warehouse dan kedua
mengenai tahapan proses dalam pembuatan data warehouse . Mengenai kategori
pada data warehouse, kategori ini diakomodasikan berdasarkan time-dependent
data sources.
Adapun klasifikasinya adalah sebagai berikut ini: (Kantardzic, 2003)
1. Old detail data (data lama)
2. Current (new) detail data (data saat ini atau baru)
3. Lightly summarize data (data yang disimpulkan secara ringan)
4. Highly summarize data (data yang disimpulkan secara berat)
5. Metadata (direktori data atau panduan tentang data)
2.1.6 Arsitektur Data Warehouse
Arsitektur dalam data warehouse mencakup pengaturan yang benar
komponen-komponen penyusun data warehouse, baik itu software ataupun
hardware. Untuk mempermudah proses pembangunan suatu data warehouse
diperlukan pemilihan arsitektur yang tepat dan pemahaman yang baik terhadap
arsitektur data warehouse. Berikut adalah komponen-komponen penyusun data
warehouse.
Pada sub bab ini ini di jelaskan mengenai arsitektur dan komponen utama
dari data warehouse (Anahory dan Murray, 1997) beserta proses tools, dan
teknologi yang berhubungan dengan data warehouse. Untuk lebih jelasnya dapat
dilihat pada Gambar 2.1 berikut ini.
11
Gambar 2.1 Arsitektur data warehouse (Ponniah, 2001)
• Komponen Sumber Data
• Production Data
• Internal Data
• Archived Data
• External Data
• Data Staging Component
• Data Extraction
• Data Transformation
• Data Loading
• Data Storage Component
• Information Delivery Component
• Metadata Component
• Managament and Control Component
12
2.1.7 Tahapan Data Warehouse
1. Studi kelayakan, pada phase ini melakukan kajian strategic analysis,
termasuk mengevaluasi bisnis line organisasi. Studi kelayakan mencakup
mendefinisikan aktifitas-aktifitas, biaya-biaya, keuntungan, faktor-faktor
untuk kesuksesan sistem dimasa yang akan datang.
2. Analisa bentuk perusahaan, pengertian/pengetahuan bisnis yang
dijalankan dan mengidentifikasi kebutuhan bisnis (business requirements
identification).
3. Perancangan arsitektur data warehouse, arsitektur logic dan arsitektur
fisik. Tahap ini dilakukan setelah komponen-komponen dalam organisasi
didefinisikan terlebih dahulu.
4. Pemilihan teknologi sebagai solusi, mengidentifikasi teknologi-teknologi
yang mungkin di gunakan untuk implemetasi arsitektur data dan arsitektur
aplikasi dan juga untuk arsitektur sistem support.
5. Perencanaan iterasi project, implementasi data warehouse dengan satu
subject area dalam satu waktu yang diukur dengan skala prioritas dan
kebutuhan bisnis.
6. Detail designing (data warehouse modeling), adalah pemodelan data
warehouse secara lengkap.
Memilih tahapan atau proses yang tepat untuk mengkonstruksi data
warehouse adalah langkah yang kritis dalam pembuatan suatu data warehouse.
Data pada data warehouse harus distandarisasi terlebih dahulu sebelum
dimasukkan. Proses yang digunakan dalam memproses data sebelum dimasukkan
ke dalam suatu data warehouse adalah proses ETL (extract, transform and load).
Penjelasan dari masing-masing adalah sebagai berikut;
1. Extract
Proses extract adalah proses mengekstrak (extracting) dan pengambilan data
dari sumber pada sistem untuk diload ke data warehouse. Sumber data dapat
13
diperoleh secara alternatif melalui ODS (Operational Data Storage). Data harus
dikonstruksi ulang sebelum dimasukkan ke dalam data warehouse.
Proses konstruksi ini melibatkan proses:
a) Cleansing data, yaitu proses pembersihan data kotor. Kotor dalam hal ini
adalah data berkualitas rendah seperti ketidakkonsistenan penulisan nama,
kode id, duplikasi data, data tidak lengkap dan lain-lain.
b) Restrukturisasi data pada data warehouse untuk memahami kebutuhan
yang ada. Contoh: penambahan atau pengurangan fields dan denormalisasi
data
c) Memastikan sumber data konsisten dengan data yang sudah ada di dalam
data warehouse
2. Transform
Proses transform adalah proses pengubahan data, dimana dat yang
diperoleh dari proses extract (dalam format operasional) menjadi data dalam
bentuk data warehouse. Proses transform ini melibatkan proses:
1. Summarizing the data, dengan cara pemilihan (selection), proyeksi
(projecting) , penggabungan (joining), normalisasi (normalization),
agregasi (aggregation) dan grouping relasional data menjadi views
yang lebih nyaman dan berguna bagi pengguna.
2. Packaging the data, dengan mengkonversi detail data atau
summarized data menjadi format yang lebih berguna seperti
spredsheets, text documents, private database , dan lainnya.
Terdapat dua cara transformasi yaitu dengan menggunakan fungsi record-
level, dan fungsi field-level. Fungsi record-level melibatkan proses
Summarizing the data, sedangkan fungsi field-level adalah single-field dan
multi-field. Transformasi single-field mengubah satu field menjadi field yang
lain. Berbeda dengan multi-field dimana satu data atau lebih diubah menjadi
field baru. Gambar mengenai single-field dan multi-field dapat dilihat pada
Gambar 2.2 dan 2.3.
14
ID NAME ADDRESS
ID NAME CITY
Gambar 2.2 – Contoh transformasi single-field (Zain, 2008)
ID FIRST NAME MIDDLE
NAME
LAST NAME TITLE
ID NAME TITLE ADDRESS PHONE
Gambar 2.3 – Contoh transformasi multi-field (Zain, 2008)
GEGER KALONG BANDUNG
BANDUNG
Concatenate
15
3. Load
Proses load adalah proses tahapan terakhir dari proses ETL. Pada proses
ini akan dilakukan proses pemuatan data dari proses transform ke dalam suatu
data warehouse. Pada proses ini dilakukan juga proses indexing untuk
memberikan indeks ke masing-masing data untuk mempercepat proses query.
Terdapat dua mode loading ke dalam data warehouse yaitu refresh dan update.
Mode refresh yaitu proses menuliskan kembali keseluruhan data di dalam data
warehouse pada suatu interval waktu. Sedangkan untuk mode update yaitu suatu
proses untuk meng-update (tidak menghapus atau menimpa data lain) data yang
berubah ke tempat tujuan pada data warehouse. Mode refresh digunakan pertama
kali ketika data warehouse berjalan dan hendak dimuat, sedangkan mode update
umumnya digunakan ketika pemeliharaan data atau ketika data warehouse
sedang running.
2.1.8 Desain Data Warehouse
Untuk memulai pembuatan data warehouse database harus
memperhatikan keperluan yang utama dan memilih data yang harus didahulukan
terlebih dahulu, baru setelah itu bisa diperoleh komponen-komponen database
dari data warehouse adalah dimensional modelling (DM). Pengertian dari
dimensional modeling adalah suatu teknik desain secara logikal yang memiliki
sasaran untuk mempresentasikan data dengan standar, bentuk intuitif yang
mengijinkan akses secara sangat cepat. Setiap tabel dimensional model memiliki
komposisi dari satu tabel dengan composite key yang dinamakan fact table dan
sekumpulan set tabel yang lebih kecil yang dinamakan dimension table.
Dimensional modelling memiliki beberapa struktur skema, yaitu:
Skema bintang (Star Schema)
Struktur logical yang memiliki fact table mengandung data fakta
posisi tengah, dikelilingi oleh dimension tables yang mengandung
referensi data (yang bisa didenormalisasi). Contoh dapat dilihat pada
Gambar 2.4
16
Gambar 2.4 Star Schema (Ponniah, 2001)
Skema bola salju (snowflake schema)
Snowflake schema merupakan perluasan dari skema bintang
dengan tambahan beberapa tambahan tabel dimensi yang tidak
berhubungan secara langsung dengan tabel fakta. Tabel dimensi tersebut
berhubungan dengan tabel dimensi yang lain. Skema ini memperbolehkan
dimensi memiliki dimensi.
Varian dari star schema dimana tabel dimensi tidak mengandung
denormalisasi data. Sebagai contoh kita bisa melakukan normalisasi
location data(atribut city, region, dan country) pada branch di dimension
table dari 2.4 untuk membuat dimension tables dari property sales schema
ditampilkan pada Gambar 2.5
17
Gambar 2.5 Snow flake Schema (Ponniah, 2001)
2.2 Data Mining
2.2.1 Definisi Data Mining
Data mining adalah suatu proses mengekstraksi secara valid, sebelumnya
belum diketahui, komprehensif dan informasi yang dapat memberikan aksi dari
database besar dan menggunakannya untuk membuat keputusan bisnis yang
krusial (Simoudis, 1996). Data mining berhubungan dengan analisis dari data dan
penggunaan teknik software untuk menemukan pola yang tersembunyi dan tidak
diharapkan dan relasinya dalam bentuk set suatu data. Fokus dari data mining
adalah memunculkan informasi yang tersembunyi dan tidak diharapkan. Informasi
yang tersembunyi tersebut dapat memberikan nilai tambah pada bisnis
perusahaan. Selain alasan diatas terdapat pula alasan-alasan lain mengapa
diperlukan penggunaan data mining berikut ini;
18
• Data yang tersedia berjumlah sangat besar
Dalam dekade terakhir ini, harga dari perangkat keras terutama hardisk
telah turun secara drastis. Disamping itu perusahaan telah mengumpulkan
sejumlah data yang sangat besar dari banyak aplikasi yang dimiliki.
Dengan sejumlah data ini, perusahaan melakukan eksplorasi data untuk
mencari pola tersembunyi sebagai panduan untuk membantu strategi bisnis
yang akan dijalankan
• Kompetisi yang meningkat
Kompetisi yang ada sangat tinggi sebagai hasil dari marketing dan dengan
adanya saluran distribusi seperti internet dan telekomunikasi. Perusahaan
akan menghadapi kompetisi dunia, karena itu kunci suksesnya bisnis
adalah kemampuan untuk membina pelanggan yang sudah ada dan
mendapatkan yang baru. Teknologi data mining dapat membantu
perusahaan untuk menganalisa faktor yang mempengaruhi hal tersebut.
• Kemampuan Teknologi
Teknologi data mining sebelumnya hanya ada pada lingkungan akademik
tetapi saat ini banyak teknologi seperti ini semakin canggih dan siap untuk
diterapkan pada industri. Algoritma yang ada semakin akurat, efisien dan
dapat menangani komplikasi data yang meningkat. Sebagai tambahan,
data mining application programming interfaces (APIs) telah
distandarisasi, sehingga mengijinkan pengembang untuk membuat aplikasi
data mining yang lebih baik.
2.2.2 Teknik Data Mining
Ada empat operasi utama yang dapat dilakukan pada teknik data mining
yaitu predictive modelling, database segmentation, link analysis, dan deviation
detection. Meskipun salah satu dari operasi utama dapat digunakan untuk
mengimplementasikan aplikasi bisnis apapun, ada keterhubungan yang ditemukan
antara aplikasi dan operasi yang bersangkutan. Teknik adalah implementasi secara
spesifik dari operasi data mining. Bagaimanapun juga masing-masing operasi
memiliki kekuatan dan kelemahannya masing-masing. Untuk lebih jelasnya
19
mengenai teknik yang berasosiasi dengan salah satu dari empat operasi utama
data mining (Cabena 1997 dalam Zein 2008) dapat dilihat pada Tabel 2.1 berikut
ini:
Operations Data Mining Techniques
Predictive modelling Classification
Value Prediction
Database segmentation Demographic clustering
Neural clustering
Link analysis Association discovery
Sequential pattern discovery
Similar time sequence discovery
Deviation detection Statistics
Visualization Tabel 2.1 Tabel operasi data mining dan teknik yang digunakannya (Zein, 2008)
2.2.2.1 Predictive Modeling
Predictive Modeling menggunakan pendekatan generalisasi dari ’real
world’ dan kemampuan menempatkan data baru ke kerangka utama. Predictive
modeling bisa digunakan untuk menentukan karakteristik (model) mengenai data
set. Model ini dikembangkan dengan menggunakan supervised learning yang
terdiri dari dua fase: training dan testing. Training membuat model menggunakan
sampel besar dari data yang dinamakan training set, sedangkan testing mencoba
model baru, data yang sebelumnya tidak terlihat untuk menentukan keakurasian
dan karakteristik performa fisik. Ada dua teknik yang berasosiasi dengan
predictive modeling: classification dan value prediction.
Classification digunakan untuk membangun kelas spesifik yang telah
ditentukan sebelumnya untuk masing-masing record di database, dari suatu set
terbatas ke nilai kelas yang memungkinkan. Ini adalah dua spesialisasi dari
klasifikasi: tree induction dan neural induction. Contoh dari klasifikasi
menggunakan induction ada pada Gambar 2.7. Pada contoh ini menggambarkan
20
bagaimana institusi keuangan memuruskan kelayakan calon nasabahnya layak
diberikan pinjaman atau tidak. Predictive model telah menentukan bahwa dua
variabel yang digunakan yaitu: range pendapatan applicant. catatan kriminal dan
lama waktu selama bekerja. Model ini membantu menentukan applicant yang
layak mendapatkan pinjaman, jika applicant memliki pendapatan antara $30-$70
dan bekerja kurang dari setahun ditempat kerja terkahir, maka applicant ini tidak
boleh diberikan pinjaman.
Gambar 2.6 Clasification menggunakan tree induction
(http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html)
Contoh Classification dengan mengunakan neural induction ditunjukkan
pada Gambar 2.7
Gambar 2.7 Clasification menggunakan neural network (Connonly and Begg, 2005)
Customer renting property >2 years
Customer age >25 years
0.5
0.3
0.3
0.6
0.7
0.4
Class (Rent or buy property)
21
Pada kasus ini, classification dari data diperoleh dengan menggunakan nueral
network. Neural network mengadung koleksi dari titik-titik yang terkoneksi
dengan input, output, dan processing pada masing-masing titik. Antara lapisan
input dan output mungkin sebagai sejumlah lapisan proses tersembunyi. Masing-
masing proses unit dalam satu lapisan saling berhubungan dengan proses unit di
lapisan berikutnya oleh weighted value yang menggambarkan kekuatan hubungan.
2.2.2.2 Database Segmentation dengan Clustering
Berbeda dengan clasification dimana kelas data telah ditentukan
sebelumnya, clustering melakukan pengelompokan data tanpa berdasarkan kelas
data tertentu. Bahkan clustering dapat dipakai untuk memberikan label pada kelas
data yang belum diketahui itu. Karena itu clustering sering digolongkan sebagai
metode unsupervised learning.
Prinsip dari clustering adalah memaksimalkan kesamaan antar anggota
satu kelas dan meminimumkan kesamaan antar kelas/cluster. Clustering dapat
dilakukan pada data yang memiliki beberapa atribut yang dipetakan sebagai ruang
multidimensi. Ilustrasi dari clustering dapat dilihat di Gambar 2.8 dimana lokasi,
dinyatakan dengan bidang dua dimensi, dari pelanggan suatu toko dapat
dikelompokkan menjadi beberapa cluster dengan pusat cluster ditunjukkan oleh
tanda positif (+).
Gambar 2.8 Contoh Clustering (Ponniah, 2001)
22
Beberapa kategori algoritma clustering yang banyak dikenal adalah metode
partisi dimana pemakai harus menentukan jumlah k partisi yang diinginkan lalu
setiap data dites untuk dimasukkan pada salah satu partisi, metode lain yang telah
lama dikenal adalah metode hierarki yang terbagi dua lagi : bottom-up yang
menggabungkan cluster kecil menjadi cluster lebih besar dan top-down yang
memecah cluster besar menjadi cluster yang lebih kecil. Kelemahan metode ini
adalah bila salah satu penggabungan/pemecahan dilakukan pada tempat yang
salah, tidak dapat didapatkan cluster yang optimal. Pendekatan yang banyak
diambil adalah menggabungkan metode hierarki dengan metode clustering .
2.2.2.3 Link Analysis
Link analysis memiliki sasaran untuk membangun jaringan yang
dinamakan associations antara individual records atau sets of records di dalam
database. Ada tiga spesialisasi dari analysis jaringan: associations discovery,
sequential pattern discovery dan similar time sequence discovery. Associations
discovery digunakan untuk menemukan item yang menyatakan keberadaan dari
item yang lain didalam event yang sama. Sequencial pattern discovery
menemukan pattern antara event seperti keberadaan satu set dari kelompok item
yang diikuti oleh satu set dari sekelompok item yang diikuti oleh satu set dari
sekelompok item didalam database dalam beberapa periode waktu. Similar time
sequence discovery digunakan seperti contoh: dalam discovery of links antara dua
set data yang bergantung terhadap waktu dan berdasarkan derajat kesamaan antara
pola dari suatu seri waktu.
Association Rule Mining merupakan bagian dari Frequent Pattern Mining.
Frequent Pattern Mining merupakan salah satu task data mining yang sangat
penting. Task ini mencari hubungan/relasi, assosiasi, dan korelasi dalam data.
Pengetahuan yang dihasilkan juga sangat berguna untuk klasifikasi, clustering,
dan task data mining yang lain. Selain Association Rule Mining, masih ada
Sequential Pattern, dan Structured Pattern yang termasuk dalam Frequent
Pattern Mining. Association Rule Mining dapat juga disebut Frequent Itemset
Mining karena pola yang dihasilkan adalah pola item yang sering muncul
bersamaan dalam sebuah database. Contoh klasik yang sering digunakan untuk
23
menjelaskan Association Rule Mining adalah market basket analisis. Pada market
basket analisis, kita menganalisa kebiasaan konsumen dalam membeli barang.
Secara umum, Association Rule Mining dapat dibagi menjadi dua tahap
yaitu pencarian Frequent Itemset (Frequent Itemset Candidate Generation) dan
Rule Generation. Pada tahap Frequent Itemset Candidate Generation terdapat
beberapa kendala yang harus dihadapi untuk memperoleh Frequent Itemset seperti
banyaknya jumlah kandidat yang memenuhi minimum support, dan proses
perhitungan minimum support dari Frequent Itemset yang harus melakukan scan
database berulang-ulang. Pendekatan apriori sangat membantu dalam mengurangi
jumlah kandidat Frequent Itemset.
Dengan menggunakan FP-growth, dapat dilakukan Frequent Itemset
Mining tanpa melakukan candidate generation. FP-growth menggunakan struktur
data FP-tree. Dengan menggunakan cara ini scan database hanya dilakukan dua
kali saja, tidak perlu berulang-ulang. Data akan direpresentasikan dalam bentuk
FP-tree. Setelah FP-tree terbentuk, digunakan pendekatan divide and conquer
untuk memperoleh Frequent Itemset. FP-tree merupakan struktur data yang baik
sekali untuk Frequent Pattern mining. Struktur ini memberikan informasi yang
lengkap untuk membentuk Frequent Pattern. Item-item yang tidak frequent
(infrequent) sudah tidak ada dalam FP-tree.
2.2.2.4 Deviation Detection
Deviation detection adalah teknik yang relatif masih baru dalam teknik
data mining. Namun Deviation detection sering kali menjadi sumber penemuan
baru karena teknik ini mengidentifikasi outlier yang mengekspresikan deviasi dari
penemuan sebelumnya. Operasi ditampilkan menggunakan teknik statistics dan
visulazation atau sebagai suatu produk dari data mining. sebagai contoh regresi
linier memfasilitasi pengidentifikasian data dalam teknik visualisasi modern yang
menampilkan kesimpulan dan representasi grafik yang membuat deviasi mudah
untuk dideteksi.
24
2.2.3 Tahap-Tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap yang diilustrasikan di Gambar 2.9. Tahap-tahap tersebut, bersifat
interaktif dimana pemakai terlibat langsung atau dengan perantaraan knowledge
base.
Gambar 2.9 Tahap-tahap data mining (Zein, 2008)
• Pembersihan data (untuk membuang data yang tidak konsisten dan noise)
Pada umumnya data yang diperoleh, baik dari database suatu
perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak
sempurna seperti data yang hilang, data yang tidak valid atau juga hanya
sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak
relevan dengan hipotesa data mining yang kita miliki. Data-data yang tidak
relevan itu juga lebih baik dibuang karena keberadaannya bisa mengurangi
mutu atau akurasi dari hasil data mining nantinya. ”Garbage in garbage
out” (hanya sampah yang akan dihasilkan bila yang dimasukkan juga
25
sampah) merupakan istilah yang sering dipakai untuk menggambarkan
tahap ini. Pembersihan data juga akan mempengaruhi performa dari sistem
data mining karena data yang ditangani akan berkurang jumlah dan
kompleksitasnya.
• Integrasi data (penggabungan data dari beberapa sumber)
Tidak jarang data yang diperlukan untuk data mining tidak hanya
berasal dari satu database tetapi juga berasal dari beberapa database atau file
teks. Integrasi data dilakukan pada atribut-atribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama, jenis produk, nomor
pelanggan dsb. Integrasi data perlu dilakukan secara cermat karena
kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang
dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh bila
integrasi data berdasarkan jenis produk ternyata menggabungkan produk
dari kategori yang berbeda maka akan didapatkan korelasi antar produk
yang sebenarnya tidak ada. Dalam integrasi data ini juga perlu dilakukan
transformasi dan pembersihan data karena seringkali data dari dua database
berbeda tidak sama cara penulisannya atau bahkan data yang ada di satu
database ternyata tidak ada di database lainnya.
Hasil integrasi data sering diwujudkan dalam sebuah data warehouse
karena dengan data warehouse, data dikonsolidasikan dengan struktur
khusus yang efisien. Selain itu data warehouse juga memungkinkan tipe
analisa seperti OLAP. Untuk membangun data warehouse juga tersedia
paket-paket software yang mapan seperti database-nya dan piranti
pendukung yang sering disebut sebagai ETL (Extract Transform Loading).
Banyak paket software ETL sudah mencakup tahap pembersihan dan
integrasi data.
• Transformasi data (data diubah menjadi bentuk yang sesuai untuk di-
mining)
Beberapa teknik data mining membutuhkan format data yang khusus
sebelum bisa diaplikasikan. Sebagai contoh beberapa teknik standar seperti
analisis asosiasi dan clustering hanya bisa menerima input data kategorikal.
Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi
26
menjadi beberapa interval. Proses ini sering disebut binning. Disini juga
dilakukan pemilihan data yang diperlukan oleh teknik data mining yang
dipakai. Transformasi dan pemilihan data ini juga menentukan kualitas dari
hasil data mining nantinya karena ada beberapa karakteristik dari teknik-
teknik data mining tertentu yang tergantung pada tahapan ini.
• Aplikasi teknik data mining
Aplikasi teknik data mining sendiri hanya merupakan salah satu
bagian dari proses data mining. Ada beberapa teknik data mining yang
sudah umum dipakai. Kita akan membahas lebih jauh mengenai teknik-
teknik yang ada di seksi berikutnya. Perlu diperhatikan bahwa ada kalanya
teknik-teknik data mining umum yang tersedia di pasar tidak mencukupi
untuk melaksanakan data mining di bidang tertentu atau untuk data tertentu.
Sebagai contoh akhir-akhir ini dikembangkan berbagai teknik data mining
baru untuk penerapan dibidang bioinformatika seperti analisa hasil
microarray untuk mengidentifikasi DNA dan fungsi-fungsinya.
• Evaluasi pola yang ditemukan (untuk menemukan yang menarik/bernilai)
Dalam tahap ini hasil dari teknik data mining berupa pola-pola
yang khas maupun model prediksi dievaluasi untuk menilai apakah
hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh
tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti :
menjadikannya umpan balik untuk memperbaiki proses data mining,
mencoba teknik data mining lain yang lebih sesuai, atau menerima hasil
ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat.
Ada beberapa teknik data mining yang menghasilkan hasil analisa
berjumlah besar seperti analisis asosiasi. Visualisasi hasil analisa akan
sangat membantu untuk memudahkan pemahaman dari hasil data mining.
• Presentasi pola yang ditemukan untuk menghasilkan aksi
Tahap terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau aksi dari hasil analisa yang didapat. Ada
kalanya hal ini harus melibatkan orang-orang yang tidak memahami data
27
mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan
yang bisa dipahami semua orang adalah satu tahapan yang diperlukan
dalam proses data mining. Dalam presentasi ini, visualisasi juga bisa
membantu mengkomunikasikan hasil data mining.
2.3 Bisnis Airline dan Data Mining
Pelayanan terhadap penumpang yang bersifat individu sebagai hasil dari
segmentasi terhadap pelanggan harus dapat dijelaskan dan nilai tambahnya juga
harus dapat dibuktikan. Hasil segmentasi terhadap penumpang adalah
mendapatkan pemahaman yang lebih baik mengenai konsumen airline. Pritscher
(2001) mengatakan, peluang data mining dalam industri airline dapat dilakukan
dengan memilah-milah customer yang katagori pembagian tersebut dapat
dilakukan berdasarkan:
1 Region : Kebutuhan penumpang akan terlayani dengan lebih baik jika
diketahui geografi yang disukai diketahui dengan baik atau tempat
penumpang. Penumpang dapat dipilah-pilah berdasarkan asal dan tujuan
perjalanan atau branch office yang terdekat dengan tempat tinggal
penumpang.
2 Market: Dari sudut pandang sales, market dibedakan menjadi market
home, market pihak ketiga yang dilayani karena penumpang dari airline
lain (connecting passenger). Penumpang dapat dipilah berdasarkan market
yang mereka gunakan dan tempat tinggal mereka.
3 Travel Preference: Agar dapat melayani penumpang dengan penawaran
yang tepat, diperlukan perjananan/travel yan bagaimana yang diinginkan
oleh penumpang. Penumpang dapat bedakan berdasarkan rasio dari
penerbangan longhaul (intercontinental) dan penerbangan shorthaul,
berdasarkan rasio dari tiket yang hight fare dan low fare juga kombinasi
keduanya.
4 Travel Behaviour: Salah satu informasi penting pelanggan adalah jenis
tiket yang dibeli secara berkala. Tipe tiket ini terkait erat dengan tujuan
28
perjalanan misalnya untuk berlibur atau untuk perjalanan bisnis. Data
penting yang tercatat adalah booking class yang digunakan untuk
penerbangan, sedangkan waktu dan harga tiket tidak terekam karena
tergantung pada ketersediaan dan waktu.
Menurut McIlroy dan Barnett (2000) dalam Wijaya (2005), biaya untuk
mendapatkan konsumen yang baru dapat mencapai 5 kali dari mempertahankan
konsumen yang sudah ada. Keanggotaan dalam loyalty program dibagi menjadi 2
jenis, open dan limited. Limited loyalty tidak dapat dikuti oleh semua orang, ada
mekanisme tertentu untuk menjadi anggota limited ini seperti membayar uang
pendaftaran dan kadang-kadang disertai syarat-syarat lainnya seperti melakukan
pmbelian dengan volume tertentu atau memiliki penghasilan tertentu (Wijaya,
2005).
2.3.1 Loyalty Program dan Frequent Flyer Program
Menarik dan mempertahanan konsumen memerlukan biaya yang tinggi,
khususnya untuk industri jasa. Loyalitas didefinisikan Oliver (Celuch dan
Goodwin, 1999) sebagai komitmen yang tinggi untuk membeli kembali suatu
produk atau jasa yang disukai di masa mendatang, disamping pengaruh situasi dan
usaha pemasar dalam merubah perilaku. Dengan kata lain konsumen akan setia
untuk melakukan pembelian ulang secara terus-menerus.
Menurut Shoemaker dan Lewis (1998) dalam Wijaya (2005), loyalty
program adalah adalah program yang ditawarkan pada konsumen untuk
membangun ikatan terhadap merek/brand tertentu. Lebih lanjut Wijaya (2005)
menyatakan bahwa sebagian besar konsumen melakukan pembelian ulang dalam
rangka menambah keuntungan yang ditawaran kemudian redeem dengan
menggunakan reward yang telah dikumpulkan. Konsumen loyal terhadap
program, bukan kepada perusahaannya. Tidak ada hubungan langsung antara
program dengan ikatan emosional konsumen terhadap perusahaan. Hubungan
emosional dapat terbentuk salah satunya dengan memberikan pelayanan yang
baik.
29
Lebih dalam lagi Gramer dan Brown (Utomo, 2006) memberikan definisi
mengenai loyalitas (loyalitas jasa), yaitu derajat sejauh mana seorang konsumen
menunjukkan perilaku pembelian berulang dari suatu penyedia jasa, memiliki
suatu desposisi atau kecenderungan sikap positif terhadap penyedia jasa, dan
hanya mempertimbangkan untuk menggunakan penyedia jasa ini pada saat
muncul kebutuhan untuk memakai jasa ini. Dari definisi yang disampaikan
Gramer dan Brown, konsumen yang loyal tidak hanya seorang pembeli yang
melakukan pembelian berulang, tetapi juga mempertahankan sikap positif
terhadap penyedia jasa.
Frequent flyer program (FFP) adalah loyalty program yang ditujukan bagi
para pengguna jasa penerbangan. Airline pengelola FFP memberikan poin reward
pada konsumen (disebut miles) yang bisa digunakan untuk membeli tiket (Emch,
2007). Ada 3 alasan bagaimana FFPs dapat mengurangi ongkos produksi dalam
dunia penerbangan (Adrian Emch , 2007);
1. Mempertahankan konsumen yang sudah jadi pelanggan lebih murah
dibandingkan dengan mencari pelanggan baru.
2. Pelanggan yang setia lebih menguntungkan dari pada pelangggan baru
3. FFP dapat digunakan untuk meningkatkan pelayanan melalui personalisasi
dari setiap service yang diberikan untuk penumpang.
Pada prinsipnya setiap tiket gratis yang dibeli dengan menggunakan
mileage yang dimiliki oleh anggota FFP adalah tiket untuk tempat duduk yang
kosong. Tidak ada biaya yang harus dikeluarkan untuk tiket yang dikeluarkan,
hanya pada tataran praktis, hal ini belum dikaji mekanismenya. Di GFF sendiri,
setiap tiket yang dibeli oleh penumpang ada prosentase bagian awardnya.
30
2.4 Tools Development
2.4.1 Pentaho Data Integration (PDI/Kettle)
Kettle adalah aplikasi ETL (Extract, Transformation and Load). Aplikasi
Kettle sendiri merupakan bagian dari aplikasi BI Pentaho. Sebelumnya proyek ini
berdiri sendiri dan kemudian diakuisisi oleh Pentaho pada tahun 2006.
Kettle terdiri dari 4 aplikasi, yaitu :
Spoon, yaitu aplikasi grafis berbasis swing yang digunakan untuk
merancang file skema job dan transformation
Pan, yaitu script yang digunakan untuk menjalankan file skema
transformation melalui terminal / command line
Kitchen, yaitu script yang digunakan untuk menjalankan file skema job
melalui terminal / command line
Carte, yaitu temporary web server yang digunakan untuk mengeksekusi
job/transformation secara cluster atau parallel
Kesemua aplikasi tersebut di atas dijalankan melalui shell atau batch script yang
berkaitan. Fitur-fitur Kettle antara lain :
• Memiliki utilitas grafik yang dapat digunakan merancang skema step atau
langkah kontrol dan transformasi data.
• Multi platform - karena dikembangkan di atas Java yang notabene
berjalan di banyak platform.
• Bersifat concurrent, dalam arti row-row data diambil oleh suatu step dan
diserahkan ke step lain secara parallel. Artinya tidak menunggu sampai
suatu koleksi data diambil secara keseluruhan terlebih dahulu.
• Scalable - dapat beradaptasi dengan penambahan kapasitas memori RAM
atau pun storage (scale up) dan dapat beradaptasi dengan penambahan
node komputer atau cluster lain (scale out).
31
2.4.2 Mondrian
Mondrian adalah web aplikasi yang berbasis open source. Mondrian
memiliki fitur-fitur untuk melakukan drill-down, drill-up seperti halnya tools
untuk presentasi data warehouse lainnya.
2.5 Kebutuhan Data Mining dalam Frequent Flyer Program
Frequent Flyer Program menyimpan data-data anggota yang juga
pelanggan setia dari penerbangannya. Data penerbangan anggota Frequent Flyer
adalah sekedar tumpukan data operasional bagi airline yang memiliki sistem
tersebut. Infrastruktur IT untuk operasional Frequent Flyer dapat mudah ditiru
oleh airline lainnya dan saat itu Frequent Flyer bukan lagi menjadi pembeda bagi
sebuah airline dari pesaingnya karena Frequent Flyer Program sudah menjadi
komoditas yang mudah dimiliki oleh setiap industri penerbangan.
Penggunaan data yang dimiliki secara ekstensif dapat menjadi keunggulan
kompetitif bagi suatu airline. Hal ini menjadikan airline tersebut berbeda dengan
airline lainnya ketika data tersebut diolah dan dianalisa dengan metode statistik
atau teknik data mining lainnya dalam BI. Hasil dari analisa tersebut sulit ditiru
oleh perusahaan lain dan bisa menjadi keunggulan kompetitif bagi perusahaan
yang bersangkutan.
Sebagai gambaran adalah promo-promo yang diadakan oleh sebuah airline
bisa menggunakan data anggota FFP agar promo tersebut bisa tepat sasaran.
Airline juga bisa membuat jadwal penerbangan dan memprediksi penerbangan
dari mana kemana yang pada waktu tertentu seperti peak season dapat lebih
optimal. Juga penggunaan data FFP untuk memberikan personalisasi untuk setiap
service yang diberikan airline.
32
BAB III
METODOLOGI PENELITIAN
Metodologi yang digunakan dalam penelitian terbagi dalam beberapa tahap,
yaitu: Pengumpulan Data, Menelaah Kebutuhan Bisnis dan Informasi, Menelaah
Data dan Perancangan Data Warehouse, dan terakhir Implementasi Data Mining.
3.1 Pengumpulan Data
Tahap pertama dalam penelitian adalah pengumpulan data. Untuk
keperluan tersebut penulis melakukan pengumpulan data dengan cara melakukan
observasi ke obyek penelitian dan melakukan pengkajian dokumen atau literatur
untuk menggali dokumen organisasi yang berkaitan, struktur organisasi, tugas dan
gambaran proses bisnisnya.
Dalam penelitian ini penulis melakukannya dengan pendekatan top-down,
pendekatan ini dimulai dengan mendefinisikan sasaran dan kebijakan organisasi
kemudian dilakukan analisis kebutuhan informasi lalu turun ke pemrosesan
transaksi. Sebelum mulai membuat data model untuk data warehouse, sebaiknya
spesifikasi kebutuhan informasi dan data yang tersedia (sumber data) sudah harus
diketahui. Tahap pertama adalah tahap pengumpulan data. Input dari tahap ini
adalah permasalahan-permasalahan dalam sistem operasional GFF, salah satunya
adalah masalah dalam modul reporting yang mempengaruhi performance sistem
operasional GFF.
3.2 Kebutuhan Bisnis dan Informasi
Tahap ini dilakukan analisis lebih dalam mengenai kebutuhan bisnis dan
informasi yang diharapkan oleh manajemen perusahaan. Data yang telah
dikumpulkan sebelumnya akan dijadikan sebagai masukan dalam proses analisis
terhadap kebutuhan bisnis dan informasi tersebut.
33
3.3 Perancangan Data Warehouse
Data diekstrak dari database operasional dan sumber eksternal, dibersihkan
untuk meminimalisasi error dan mengisikan informasi yang kurang jika
dimungkinkan, dan ditransformasikan untuk memperbaiki ketidakcocokan
semantik. Mentransformasikan data biasanya dilakukan dengan mendefinisikan
view relational pada tabel dalam sumber data. Loading data terdiri dari
mematerialisasi view dan menyimpannya dalam data warehouse. Data yang
dibersihkan dan ditransformasikan akhirnya di-load ke dalam data warehouse.
Berkaitan dengan volume data yang besar, loading merupakan proses yang
lambat. Oleh karena itu paralelisme penting untuk loading warehouse. Setelah
data di-load ke dalam warehouse, pengukuran tambahan harus dilakukan untuk
menjamin data dalam warehouse di-refresh secara periodik untuk merefleksikan
pembaruan sumber data dan secara periodik membuang data lama (mungkin
kedalam media pengarsipan)
Spesifikasi kebutuhan fungsional informasi secara teknis menyatakan data
apa yang harus disimpan didalam data warehouse untuk memenuhi analisa yang
akan dilakukan oleh pemakai. Ini dapat dinyatakan dalam bentuk pertanyaan yang
harus dapat dijawab oleh data didalam data warehouse, seperti: berapa jumlah
member GFF yang mendaftar pada bulan September hingga Desember, perbulan,
pertahun. Berapa member aktif yang melakukan penerbangan dibulan Desember.
Berapa jumlah member yang mengikuti promo-promo yang diselenggarakan oleh
GFF, berapa jumlah member GFF yang branch officenya di Bali, dan lain
sebagainya.
3.4 Implementasi Data Mining
Pada tahap ini informasi penting digali untuk kepentingan pengambilan
keputusan dengan menggunakan salah satu teknik data mining (clustering). Pada
tahap ini ini akan digunakan tools data mining yan sudah tersedia, yaitu
Rapidminer data mining versi Community development.
34
Proses yang dillakukan pada tahap ini adalah implementasi data mining
mengenai kebutuhan bisnis dan informasi yan telah diidentifikasi. Data mining
dilakukan untuk menggali informasi penring yang berguna bagi kepentingan
perusahaan dalam pengambilan keputusan.
Dalam bentuk flow diagram, keempat langkah metodologi penelitian
tersebut , nampak gambar 3.1 sebagai berikut :
Pengumpulan Data
Output:Rumusan masalah
Metode:Observasi ke lapangan
Output:Gambaran sistem operasional,
data dan jenis report
Metode:Kajian dokumen dan literature
wawancara
OutputProses bisnis, tujuan GFF,
organisasi
Analisa
Output:Kebutuhan bisnis
dan informasi
Perancanganan
Output:Rancangan data warehouse
Implementasi
Output:Presentasi data mining
Kesimpulan
Output:Kesimpulan dan saran
Gambar 3.1 Tahap-tahap metodologi penelitian
35
Penjelasan lebih detail dari masing-masing tahapan pada alur pengerjaan
seperti metode yang digunakan berikut hasil dari masing-masin tahapan dapat
dilihat pada Tabel 3.1 berikut ini.
Tahap Pengumpulan Data
Metode : Observasi, Studi literature Output : Rumusan masalah
Analisa Kebutuhan Informasi Bisnis
Metode : Analisa kebutuhan bisnis dan informasi Output : Kebutuhan bisnis dan informasi
Perancangan Data Warehouse
Metode : Tahapan Data Warehouse Merancang arsitektur data warehouse Menentukan tabel fakta dan tabel dimensi Melakukan proses cleansing dan ETL Melakukan perancangan OLAP Output : Rancangan data warehouse
Implementasi Data Mining
Metode : Tahapan-tahapan data mining. Output : Presentasi data mining
Menarik kesimpulan Metode :deduktif Output : kesimpulan dan saran atas hasil penelitian (Perancangan Data Warehouse & implementasi Data Mining)
Tabel 3.1 Alur Pengerjaan
36
BAB IV
PERANCANGAN DATA WAREHOUSE
Data yang disimpan dalam data warehouse adalah data historis
berorientasi subyek yang dapat mendukung proses pengambilan keputusan bagi
manajemen. Artinya data tersebut harus kita susun sedemikian rupa sehingga
dapat dianalisis menjadi berbagai informasi yang dibutuhkan manajemen saat
proses pengambilan keputusan.
Oleh karena itu, tahap pertama dari perancangan data warehouse adalah
mendefinisikan informasi-informasi apa saja yang dibutuhkan oleh manajemen.
Supaya kebutuhan ini dapat didefinisikan dengan tepat, maka pemahaman akan
peran dan tugas manajemen yang membutuhkan informasi tersebut mutlak harus
dilakukan lebih dulu
Pada tahap identifikasi ini, mengacu pada struktur organisasi didukung
oleh tipe data report yang dibutuhkan, selanjutnya setelah diidentifikasi
kebutuhan informasi, maka ditentukan sumber data yang selanjutnya dilakukan
proses ETL (extract, transform, load). Pada bagian ini dijelaskan profil
perusahaan serta langkah-langkah yang akan dilakukan dalam perancangan data
warehouse di PT Garuda Indonesia, yaitu mengenai proses identifikasi,
perencanaan secara teknis, penentuan sumber data yang digunakan dan proses
persiapan dan melalui proses ETL.
4.1 Profil Perusahaan
Perusahaan yang dijadikan objek penelitian oleh penulis dalam bentuk
perseroan terbatas yaitu PT. Garuda Indonesia. Perusahaan ini didirikan pada
tahun 1949. PT. Garuda Indonesia berkantor pusat di Jakarta.
37
4.1.1 Latar Belakang Perusahaan
Garuda Indonesia mendapatkan konsesi monopoli penerbangan dari
Pemerintah Republik Indonesia pada tahun 1950 dari Koninklijke Nederlandsch
Indie Luchtvaart Maatschappij (KNILM), perusahaan penerbangan nasional
Hindia Belanda. Garuda adalah hasil joint venture antara Pemerintah Indonesia
dengan maskapai Belanda Koninklijke Luchtvaart Maatschappij (KLM). Pada
awalnya, Pemerintah Indonesia memiliki 51% saham dan selama 10 tahun
pertama, perusahaan ini dikelola oleh KLM. Pada tahun 1954, KLM menjual
sebagian dari sahamnya ke pemerintah Indonesia. Pada mulanya, Garuda memiliki
27 pesawat terbang, staf terdidik, bandara dan jadwal penerbangan, sebagai
kelanjutan dari KNILM. Saat ini, Garuda Indonesia telah menerapkan standar
internasional sesuai dengan standar ISO 9001 – 2001.
Garuda merilis GFF pada tahun 1999 untuk penerbangan domestic yang
meluas pada tahun 2001 dengan tambahan tidak hanya domestic tapi juga
Singapura, Hongkong dan Tokyo. Kemudian di tahun-tahun selanjutnya didaerah-
daerah lainnya hingga Mekkah. GFF mengalami perubahan sistem dan
managemen pada tahun 2007. Dengan adanya kebijakan Garuda untuk efisiensi
bagian IT Garuda, maka pengelolaan GFF bersama sistem IT lainnya, yang
awalnya dikelola sendiri, menjadi dikelola oleh pihak ketiga. Pihak ketiga dalam
hal ini adalah Lufthansa Systems Indonesia, perusahaan patungan antara Garuda
dan Lufthansa Systems German. Adanya GFF bagi Garuda bertujuan untuk
menjaga marketshare dengan meningkatkan customer-nya yang loyal dan untuk
mendukung program-program promosi Garuda.
4.1.2 Visi dan Misi Perusahaan
Visi PT. Garuda Indonesia adalah menjadi perusahaan penerbangan yang
handal dengan menawarkan pelayanan berkualitas kepada masyarakat dunia
menggunakan keramahan Indonesia. Misinya adalah sebagai perusahaan
penerbangan pembawa bendera bangsa (flag carrier) Indonesia yang
mempromosikan Indonesia kepada dunia guna menunjang pembangunan ekonomi
38
nasional dengan memberikan pelayanan yang profesional dan pelayanan
penerbangan yang menguntungkan.
4.1.3 Struktur Organisasi Perusahaan
PT. Garuda Indonesia terdiri dari 6 direktorat, yang dipimpin oleh 6
Executive Vice President ; EVP Business Support & Corporate Affairs, EVP
Operations, EVP Commersial, EVP Engineering, Maintenance, EVP Finance,
EVP Strategic & IT. Berikut adalah struktur organisasi yang dipimpin oleh EVP
Commercial. Berikut adalah struktur organisasi PT. Garuda Indonesia pada level
directorate Commercial.
Gambar 4.1-Struktur Organisasi Executive Vice President
39
Gambar 4.2- Struktur Organisasi Customer Relation Management.
Berikut adalah struktur organisasi yang akan dalam ruang lingkup yang
lebih kecil sesuai dengan ruang lingkup yang telah dibatasi oleh penulis Garuda
Frequent Flyer dikelola oleh departemen Customer Relation Management. Untuk
mengetahui lebih jelasnya dapat dilihat pada gambar 4.2.
Departemen Marketing menggunakan data yang dideliver oleh
departement CRM untuk membuat promosi-promosi untuk untuk jalur
penerbangan yang penumpangnya sedikit. Departemen Revenue menggunakan
untuk menentukan harga tiket dan konversi nilai award mileage. Harga tiket yang
dijual pada penumpang, salah satu komponen penyusunnya adalah jumlah award
mileage. Baik penumpang yang member GFF ataupun bukan, membayar jumlah
yang sama terhadap tiket yang digunakannya untuk terbang.
Di dalam departemen CRM sendiri, yang menggunakan data dari GFF
adalah divisi Customer Affairs. Customer affairs berkepentingan dengan keluhan-
keluhan pelanggan dan tindak lanjut terhadap keluhan, seperti masalah bagasi
yang hilang. Unit GFF juga membuat laporan pemasukan keuangan yang berasal
40
dari anggota berbayar dan bisa juga billing partner yang digunakan oleh bagian
finance.
Kebijakan garuda untuk fokus pada core bussines penerbangan, menggeser
IT GFF untuk dikelola oleh pihak ketiga bersama dengan sistem lainnya yang
mendukung operasional penerbangan. Application Service Provider (ASP) yang
mengelola sistem GFF adalah Lufthansa Systems Indonesia, yang juga diserahi
tugas untuk mengelola service-service IT yang lain untuk garuda dan penerbangan
lainnya. Lufthansa Systems Indonesia sendiri adalah adalah shareholder antara
PT. Garuda Indonesia dan Lufthansa Systems.
4.2 Pemahaman Terhadap Proses Bisnis
Tujuan adanya GFF bagi Garuda adalah untuk menjaga marketshare
dengan meningkatkan jumlah konsumen yang loyal terhadap jasa penerbangan
Garuda. Tujuan lainnya adalah untuk mendukung program marketing. Dalam
perancangan data warehouse perlu mempertimbangkan tujuan dari adanya sistem
GFF.
Untuk lebih memahami istilah dalam komponen-komponen Frequent
Flyer adalah sebagai berikut;
1. Tier, adalah tingkatan tingkatan anggota dalam GFF. Terbagi menjadi
tingkatan, secara berturut-turut dari yang paling rendah adalah TEMP,
Blue, Silver, Gold dan Platinum. Pada OLTP Tier ini disimpan menjadi
satu tabel tersendiri dan menjadi catalog.
2. Member Type, adalah jenis keanggotaan anggota GFF yakni Reguler,
Cobrand, VIP dan Junior. Member type disimpan pada satu tabel catalog.
3. Award Mileage, point yang diberikan oleh GFF kepada setiap anggotanya
sebagai bentuk penghargaan atas loyalitas yang diberikan oleh anggota.
Point ini diakumulasikan dan akan terus bertambah jika anggota
melakukan aktivitas penerbangannya dengan Garuda atau dengan partner
41
Garuda baik airlines ataupun perusahaan lainnya seperti hotel, bank,
telekomunikasi.
4. Tier Mileage, adalah jumlah point yang diberikan GFF setiap kali terbang
dengan Garuda dan digunakan untuk menentukan tingkat loyalitas anggota
GFF. Tier Mileage dihitung dari 1 Januari hingga 31 Desember dan akan
di reset setiap awal tahun, sehingga nilai tier per 1 Januari akan bernilai 0
pada tahun berikutnya.
5. Frequency, setiap satu kali penerbangan yang sifatnya eligible to earn
akan di nilai 1 point frequency. Frequency ini juga bisa menentukan
tingkat loyalitas anggota GFF.
6. Accrual rules, adalah yang mengatur jumlah mileage, baik tier mileage
maupun award mileage, yang diberikan untuk kepada anggota GFF untuk
setiap aktivitasnya dengan Garuda atau partner Garuda. Untuk aktivitas
penerbangan dengan dengan memperhatikan origin airport, destination
airport, tier member dan booking class yang digunakan. Jika aktivitas
adalah bukan penerbangan, maka yang menjadi parameter adalah partner
Garuda dan jenis aktifitasnya.
Setiap aktifitas anggota GFF disimpan dalam database. Aktifitas tersebut
di-rating oleh batch proses dengan menggunakan Accrual rules yang
berlaku saat transaksi berlangsung, maka dibuat catatan transaksi dan
menandai setiap aktifitas anggota yang dengan flag bahwa aktivitas
tersebut sudah di-rating. Hasil perhitungan award mileage, tier mileage,
dan frequency yang merupakan hasil perhitungan ketika rating, masuk ke
dalam field curr_one, curr_two dan curr_three dalam transaksi anggota
GFF yang bersangkutan.
7. Redeem award, salah satu keuntungan keanggotaan GFF adalah dengan
menggunakan award mileage yang dimilikinya untuk mendapatkan tiket
42
gratis, mengupgrade class atau yang lainnnya baik untuk diri sendiri,
kerabat ataupun teman. Anggota yang melakukan redeem award seperti
halnya membelanjakan award yang dimilikinya yang akan memotong
jumlah award yang dimilikinya. Untuk saat ini award yang bisa di-redeem
dan disediakan adalah Free Flight award dan Upgrade award baik untuk
anggota GFF yang bersangkutan, atau orang lain (companion).
8. Upgrade award, misalnya seorang anggota GFF memiliki account balance
award milage 20000 miles. Anggota tersebut membeli tiket kelas ekonomi
dan harga Upgrade award untuk penerbangan kelas W (bisnis) adalah 9000
miles. Maka ia setelah redeem upgrade, account balance award milage
menjadi 11000, demikian juga aturan yang berlaku untuk freeflight award.
4.2.1 Pendaftaran (Enrollment)
Keanggotaan dalam loyalty program dibagi menjadi 2 jenis, open dan
limited. Limited loyalty tidak dapat dikuti oleh semua orang, ada mekanisme
tertentu untuk menjadi anggota limited ini seperti membayar uang pendaftaran dan
kadang-kadang disertai syarat-syarat lainnya seperti melakukan pmbelian dengan
volume tertentu atau memiliki penghasilan tertentu (Wijaya, 2005).
Dalam GFF, jenis keanggotaan untuk yang open bersifat gratis (Reguler
Member Type, Junior Member Type). Keanggotaan limited terbagi menjadi 3;
VIP, Cobrand dan ECPlus. Member type VIP adalah untuk kalangan pejabat dan
anggota DPR yang mendapatkan penawaran khusus untuk menjadi anggota GFF
atau untuk kalangan tertentu selain pejabat. Member type Cobrand adalah pemilik
kartu kredit Citibank yang mendaftarkan diri melalui Citibank, dan GFF akan
memberikan tagihan pada Citibank untuk setiap mileage yang diberikan pada
anggota tersebut. Member type ECPlus adalah jenis anggota yang secara rutin
membayar iuran pada GFF. Pendapatan GFF yang berasal dari limited member,
dibuatkan report yang diberikan pada bagian finance (keuangan) untuk diaudit.
43
4.2.2 Upgrade/Downgrade Tier
Level keanggotaan dalam program frequent flyer disebut tier. Kenaikan
level kenggotaan dalam program frequent flyer disebut upgrade tier, sedangkan
penurunan level keanggotaan disebut downgrade tier. Proses upgrade/downgrade,
sistem melakukan langkah-langkah berikut;
a) Sistem akan membuat tier yang baru dan menonaktifkan tier yang lama
dengan masa berlaku tertentu.
b) Sistem membuat kartu yang memiliki durasi tertentu dengan tier yang sesuai
dengan tier.
c) Sistem membuat mailing card untuk untuk anggota ini yang berisi paket-paket
yang harus dikirim oleh GFF melalui pihak ketiga. Mailing card ini berisi
penjelasan status card pada awal ‘siap untuk dikirim’ dan akan diupdate oleh
sistem ketika kartu sudah diterima oleh anggota menjadi ’terkirim’. Paket ini
bisa berbeda-beda untuk setiap tier.
d) Untuk jenis anggota tertentu, anggota mendapatkan luggage mailing yang
mekanisme pengirimannya sama dan berbarengan dengan mailing card.
Baik downgrade ataupun upgrade, langkah-langkah yang ditempuh oleh
sistem sama, yang membedakannya adalah tier yang dihasilkan oleh sistem
berbeda, Untuk upgrade tier yang baru, tier pada card yang baru lebih tinggi dari
sebelumnya. Untuk downgrade, adalah sebaliknya, tier saat ini lebih rendah dari
tier sebelumnya.
Anggota GFF dapat melakukan enrollment baik melalui CSS (Customer
Self Service) atau BO (Back Office). Saat itu, anggota GFF akan memilki tier
TEMP ketika pertama kali mendaftar (untuk member type Reguler), selanjutnya
akan diupgrade menjadi BLUE setelah melakukan penerbangan perdananya
terhitung sejak anggota terdaftar. Jumlah member yang melakukan aktivasi dan
yang ugrade menjadi BLUE menjadi indikator keberhasilan/kinerja unit Customer
Loyalty.
44
4.2.3 Aktifitas Earning Anggota
Aktifitas anggota GFF terbagi menjadi aktifitas penerbangan (air actvity)
dan aktifitas bukan penerbangan (non air actvity). Aktifitas penerbangan mencatat
asal dan tujuan penerbangan anggota GFF, tanggal penerbangan dan flight
number yang digunakan. Aktifitas bukan penerbangan merupakan aktifitas
anggota dengan partner GFF, seperti melakukan transfer uang dengan
menggunakan kartu kredit Citibank, anggota menginap di hotel partner GFF,
belanja di Roda Mas dan aktiftas-aktifitas semacam ini dengan berbagai partner
GFF. Setiap aktifitas anggota akan dirating dan angota mendapatkan reward
berupa award mileage, tier milage dan frequency. Jumlah milage yang dihasilkan
oleh anggota, besarnya tergantung pada accrual rule yaitu jarak penerbangan
(untuk bukan aktifitas penerbangan), level tier saat anggota terbang, booking class
(untuk aktifitas penerbangan), jumlah volume sesuai kesepakatan antara partner
dengan GFF (untuk bukan aktifitas penerbangan). Proses rating melibatkan
accrual rule, yang berisi aturan pemberian mileage sebagai dasar perhitungan.
Setelah didapatkan nilai award mileage, tier mileage dan frequency dari proses
rating, di tambahkan record mileage transaction milik anggota tersebut.
4.2.4 Aktifitas Redeem Anggota
Award mileage yang dikumpulkan oleh anggota dapat dibelanjakan atau
ditukar dengan penawaran-penawaran dari Garuda dan partner. Award yang
tersedia saat berupa award free ticket dan upgrade booking class. Setiap anggota
membeli award akan tercatat dalam certificate activity dan mileage transaction
dengan tipe spending. Sistem meng-issued certificate untuk setiap pembelian
award dengan voucher number bersifat unik, bisa berupa certificate companion
(certificate yang digunakan oleh bukan anggota) atau self usage.
45
4.2.5 Keseimbangan Accrual dan Reedem
Accrual artinya anggota mendapatkan point terkait aktivitasnya dengan
GFF Sebagai ilustrasi, GFF sebagai organisasi berhutang sejumlah mileage (saat
ini sekitar Rp 110,-) yang dikumpulkan oleh anggota. Saat anggota GFF
melakukan redeem, artinya GFF membayar utangnya kepada anggotanya.
Jika anggota GFF banyak melakukan accrual tanpa membelanjakannya,
maka utang GFF terus bertambah dan bisa menjadi bom waktu bagi garuda jika
suatu saat anggota-anggota GFF melakukan penerbangannya secara serentak.
Untuk itu perlu keseimbangan antara jumlah accrual dan redeem sehingga utang
GFF tidak terus bertambah. Jadi, selain jumlah transaksi accrual dan redeem.
Perbandingan jumlah antara anggota yang melakukan accrual dan redeem
menjadi indikator bagi kinerja GFF, semakin seimbang maka semakin baik.
4.2.6 Kerja Sama Partner
Dari partner GFF, seperti Citibank, ABN Amro, Danamon, Hotel Aston
group dan partner GFF lainnya, bisa mendapatkan penghasilan dan mendapat
benefit secara langsung. GFF melakukan billing untuk setiap mileage yang
dikeluarkan untuk anggota karena aktifitas bukan penerbangan. Selain benefit
langsung, benefit secara tidak langsung adalah jumlah anggota GFF bisa
bertambah karena adanya partner dengan tersedianya channel-channel alternative
bagi anggota dalam melakukan aktifitasnya bersama Garuda. Hal salah satu
strategi memperkuat brand Garuda dan menambah core customer. Jumlah partner
Garuda dijadikan indicator performace GFF sebagai departemen dalam lingkup
kerja divisi Customer Loyalty.
4.3 Perancangan Arsitektur
Untuk memulai perancangan arsitektur data warehouse, didefinisikan
kebutuhan dari pengguna yang paling dibutuhkan dan data mana yang harus
46
diutamakan. Rancangan arsitektur data warehouse dibagi menjadi dua, arsitektur
logical dan arsitektur fisikal. Arsitektur logical adalah tahapan alur data dari
sumber data yang digunakan sampai data warehouse yang digunakan, sedangkan
arsitektur fisik adalah gambaran teknis dari konfigurasi yang diterapkan pada data
warehouse.
4.3.1 Arsitektur logical
Berikut adalah perancangan arsitektur logical pada data warehouse.
Sumber data yang digunakan adalah sumber data yang diperoleh dari data
operasional. RDBMS, yang digunakan untuk penyimpanan data operasional
frequent flyer. Dari sumber data ODS (Operational Data Store), dilakukan proses
selection. Proses selection yaitu proses pemilihan data yang diperlukan dalam
sistem data warehouse dari sumber data. Tidak semua data dari sumber data
digunakan untuk data warehouse, untuk itulah proses selection dilakukan. Proses
selanjutnya setelah selection adalah extraction, memindahkan data yang sudah
dipilah kedalam sistem database yang terpisah dari sistem database operasional.
Pemisahan database ini adalah agar sistem operasional tidak terganggu oleh
proses dalam data warehouse.
Data yang sudah terseleksi kemudian dilakukan proses dilakukan proses
cleansing, yaitu proses pembersihan data dan proses tranformasi yang kedua
proses tersebut dilakukan data staging atau temporary database. Kemudian proses
loading, yaitu proses memasukan data hasil proses sebelumnya ke dalam data
warehouse. Aliran data dari arsitektur logical tersebut dapat dilihat pada gambar
4.3.
47
Garuda Frequent Flyer
Data Souce Data Staging Data Warehouse
Operasional Data Store
(ODS)
Database Temp
Transformation Data Warehouse
Archive/ Backup Data
LOADINGSelection, Extraction
Gambar 4.3- Arsitektur logical Garuda Frequent Flyer
4.3.2 Arsitektur Fisik
Berikut adalah perancangan arsitektur fisik pada data warehouse Garuda
Frequent Flyer, dapat dilihat gambar 4.4. Database operasional GFF
menggunakan platform Oracle 9i begitu juga untuk database yang digunakan
untuk data staging dan data warehouse. Hanya saja mesin yang digunakan
berbeda dengan mesin yang digunakan oleh mesin operasi. Kesamaan platform
database dengan pertimbangan karena pengembangan kedepan dan lisensi yang
dimiliki saat ini adalah Oracle. User yang dapat mengakses sistem data
warehouse adalah user yang terhubung dengan web server.
48
Gambar 4.4- Arsitektur fisik data warehouse Garuda Frequent Flyer
4.3.4 Sumber Data
Sumber data yang akan digunakan adalah sumber data yang diperoleh dari
sumber database Oracle 9i. Database berisi informasi anggota GFF lengkap
dengan profilenya, transaksi harian anggota GFF baik yang diinput manual
maupun melalui proses batch.
Oracle 9i Oracle 9i
49
Tabel 4.1- Platform database sistem GFF operasional dan pertambahan data
Jumlah tabel operasional adalah 167 tabel dengan total kolom 2152 dan
ukuran data saat dilakukan penelitian ini adalah 25 giga bytes. Dari 167 tabel
tersebut tidak semua tabel akan disimpan dalam data warehouse dan dari masing-
masing tabel yang digunakan, tidak semua kolom akan disimpan. Tabel-tabel
yang diproses dan disimpan dalam data warehouse adalah tabel AIRPORT, TIER,
MEMBER_TYPE, ACCRUAL_RULE, BRANCH_OFFICE, TRANSACTION,
ACTIVITY, CUSTOMER dan MEMBER_ACCOUNT.
4.3.5 Data Staging
Tidak semua data yang berasal dari sumber data digunakan, hanya data
yang mendukung keperluan data warehouse yang digunakan. Tempat untuk
melakukan seleksi informasi yang diperlukan dan mempersiapkan data untuk
diproses lebih lanjut ke data warehouse adalah staging area, sedangkan data pada
kondisi tersebut pada pada kondisi tersebut dinamakan data staging. Pada tahap
data staging, dilakukan proses selection, filtering, editing, summarizing,
combining, dan loading data tersebut terhadap sumber data untuk mempersiapkan
data dalam pemrosesan lebih lanjut ke data warehouse.
Tipe Database RDBMS
Engine Oracle 9i
Platform Linux SUSE enterprise edition
Nama Database Oracle
Jumlah total tabel 167
Jumlah total kolom 2303
Pertambahan data 3 Mbytes/1 hari
Ukuran data 25 Giga Bytes
50
4.3.6 Proses ETL
Proses ETL (extract, transform, load) adalah proses yang digunakan
dalam memproses data sebelum dimasukkan ke dalam suatu data warehouse yang
akan dilakukan oleh load manager. Proses ini dilakukan untuk men-
standarisasikan data yang akan digunakan pada data warehouse. ETL adalah
langkah kritis dalam pembuatan data warehouse. Proses ETL dilakukan secara
periodic dan otomotis.
4.3.6.1 Proses Extract
Ekstraksi dilakukan dari sumber data yang digunakan melalui proses
pemilihan data yang kemudian disimpan pada temporary database. Penempatan
temporary database diletakkan pada penyimpanan database, mesin dan platform
yang sama dengan data warehouse agar proses ETL dapat dilakukan lebih cepat
dan tidak mengganggu proses operasional. Adapun database operasional yang
digunakan dan diekstrak dapat dilihat pada lampiran 1 dan 2 beserta penjelasan
atribut yang digunakan dan yang tidak digunakan. Untuk lebih detailnya
mengenai perbedaan karakteristik perbedaan database operasional GF dan
temporary database.
EKSTRAKSI
Source Destination
Engine Oracle 9i Oracle 9i
Platform Open Suse Microsoft Windows Server 2003
Sumber Data DB , GFF Operasional DWTemp
Jumlah Total Table 167 12
Jumlah Total Field 2303 152
Jumlah Total Row 36679283 9169821 Tabel 4.2-Perbandingan sumber data GFF dan DatabaseTemp
51
4.3.6.2 Proses Cleansing
Proses yang dilakukan selanjutnya adalah pembersihan data (cleansing).
Proses yang dilakukan pada proses cleansing ini adalah proses untuk
membersihkan data yang redundant dan data yang tidak konsisten satu sama lain.
Contoh dari ketidak konsistenan data adalah seperti data yang rusak (corrupt)
sehingga isi datanya tidak benar.
Ketidak konsistenan Format Data
Tabel Contoh Format
Transaction mm-dd-yy 02-30-07
Activity mm-dd-yyyy 03-30-2007
Member_account dd-mm-yy 23-02-2007
Customer dd-mm-yyyy 01-30-2007 Tabel 4.3-Perbedaan format data
Tanggal dalam sistem operasional mencatat tanggal hingga jam, menit
dan detik. Kebutuhan bisnis yang diwakili oleh report yang ada dan keseragaman,
format tanggal diubah menjadi dd-mm-yyyy. Untuk mengatasi permasalahan pada
tabel, maka dilakukan penyeragaman format data waktu mengikuti format dd-
mm-yyyy, hal ini juga untuk menghindari data yang tidak konsisten yang dapat
menimbulkan data yang bias.
Tabel 4.4-Ketidak konsistenan data penerbangan anggota GFF karena duplikasi data.
Transaksi anggota GFF yang tercatat oleh sistem melalui batch proses juga
berpeluang besar terjadi ketidak konsistenan dengan adanya duplikasi transaksi
anggota yang ternyata aktifitas penerbangannya hanya satu. Hal ini biasanya
Ketidak konsistenan karena adanya duplikasi data transaksi ENTITY_ID CREATED_ON TRANS_DATE CURR_ONE CERTIFICATE_ID ACCOUNT_ID ORIG DEST
1068117 15-DEC-06 01-23 -07 10000 101536 20 CGK PLM 1068118 16-DEC-06 01-23 -07 10000 101537 20 CGK PLM
52
karena sistem reservasi mengupload file penerbangan yang sama dua kali pada
hari yang berbeda, sehingga tercatat dua kali.
4.3.6.3 Proses Transformasi
Transformation pada prinsipnya mengubah bentuk data dari data yang
telah diextract menjadi bentuk yang sesuai dengan kebutuhan pengguna. Proses
ini dilakukan setelah data yang ada sudah melewati proses ekstraksi dan
pembersihan. Proses transformasi yang dilakukan dibagi berdasarkan level, yaitu
record-level dan field-level, pada proses ini dilakukan proses pemilihan,
penggabungan dan agregasi untuk mendapatkan data ringkasan sesuai dengan
dimensi yang akan dibuat. Proses transformasi menggunakan step-step
transformation yang ada pada Kettle.
Gambar 4.5- Alur transformasi transaksi penerbangan anggota GFF
Pada tranformasi diagram Kettle gambar 4.5, data transaksi anggota GFF
mengalami beberapa transformasi. Transformasi yang pertama adalah
denormalisasi customer, kemudian branch office, branch office counttry, country,
53
membersihkan data tanggal transaksi dalam penyamaan format, denormalisasi
tanggal dan pemisahan data sesuai dengan data model.
Semua jenis transaksi dalam sistem operasional disatukan dalam satu tabel
TRANSACTION. Proses transformasi ini membagi dan memisahkan setiap jenis
transaksi ke dalam 3 tabel terpisah untuk transaksi penerbangan (accrual),
transaksi bukan penerbangan (accrual) dan transaksi penerbangan jenis redeem.
Gambar 4.6- Alur transformasi tabel AIRPORT
Data-data catalog dari tabel TIER, AIRPORT, FLIGHT_SCHEDULE,
MEMBER_TYPE, ACCRUAL_RULES, COUNTRY, dan TIER proses
transformasinya berupa denormalisasi. Pada gambar 4.6 di atas, catalog
AIRPORT, field idCountry tidak lagi look_up ke tabel COUNTRY, tapi langsung
langsung diisi field name dari tabel country.
4.3.6.4 Proses Loading
Proses yang dilakukan pada tahap akhir adalah pemuatan data (loading).
Data yang digunakan pada tahap ini merupakan data dari proses-proses yang
dilakukan sebelumnya, yaitu ekstraksi, pembersihan (cleansing), dan transformasi
54
ke dalam data warehouse dengan menggunakan Spoon, Pan dan Kitchen . Semua
Tools tersebut merupakan produk Pentaho. Spoon digunakan untuk mendesign
pengolahan data untuk cleansing, selecting, transformasi dan mapping dari data
operasional ke data staging atau data warehouse. Pan digunakan untuk
mengeksekusi file-file Spoon. Kitchen untuk mengeksekusi Pan secara periodik
dengan scheduler.
Cara pemuatan data ke dalam data warehouse adalah dengan
menggunakan tool Pentaho yang dijalankan secara periodik dengan feature
scheduler milik Kitchen. Skema transformasi yang dibuat oleh Spoon, ada
beberapa yang dieksekusi secara berurutan karena satu transformasi tergantung
pada step transformasi yang lain.
Gambar 4.7- Skema job pada Spoon yang mengurutkan pengerjaan transformasi yang telah
dibuat sebelumnya
Sebagai contoh pada gambar 4.7 di atas, proses ekstraksi, transformasi dan
loading dari tabel catalog airport yang urutannya adalah dimulai dengan
pembuatan tabel airport_dim dan mengosongkan jika tabel itu sudah ada dan
mengupdate jika ada perubahan.
55
4.3.7 Model Data Warehouse
Data warehouse dan OLAP dibangun berdasarkan multidimensional data
model. Pada model ini diperlukan tabel fakta dan tabel dimensi. Tabel fakta berisi
fakta numerik yang memiliki ciri-ciri : panjang, kurus, dan besar, serta sering
berubah dan berguna untuk mengukur (measure). Sedangkan tabel dimensi berisi
kolom yang bersifat deskriptif, kecil, pendek, dan lebar yang berguna untuk
filtering (menyaring) dan didasarkan pada atribut dimensi.
4.3.6.1 Model Customer
Model Customer ini menyimpan informasi data angota GFF. Contoh
informasi yang bisa diperoleh adalah jumlah anggota GFF yang mendaftar hari,
bulan dan tahun tertentu untuk dilihat trend perkembangannya relatif terhadap
waktu. Berikut adalah model skema bintang Customer pada gambar 4.8 sebagai
berikut.
class Customer
dim_member_tier_composition
«column»*PK tierCompositionId memberType tier
«PK»+ PK_dim_member_type()
dim_cus_status
«column»*PK statusId status
«PK»+ PK_dim_cus_status()
fact_customer
«column» tierCompositionKey locationKey genderKey processKey registeredDateKey totalCustomer totalEnrolled totalProcessTier
dim_location
«column»*PK locationId branchOffice country city
«PK»+ PK_dim_location()
dim_gender
«column»*PK genderId gender
«PK»+ PK_dim_gender()
dim_process_tier
«column»*PK processId processName
«PK»+ PK_dim_process()
dim_time
«column»*PK time_id year month day
«PK»+ PK_dim_time()
1
0..*
1
0..*
1
0..*
1
0..*
1
0..*
Gambar 4.8- Model skema bintang enrollment anggota GFF
56
Ditentukannya subject ini selain berdasarkan report yang ada saat ini juga
mempertimbangkan tujuan bisnis dari sistem GFF yaitu untuk meningkatkan
market share Tabel fakta fact_customer ini menyimpan data anggota GFF yang
telah terdaftar. Peranannya adalah menyediakan informasi dan laporan tentang
jumlah customer dengan kondisi sesuai dengan atribut dari dimensi yang ada.
Measure yang ada pada tabel fakta ini ada 3 measure, yaitu totalCustomer,
totalEnrolled, dan totalProcessTier. TotalCustomer adalah measure yang
menerangkan jumlah anggota GFF. Measure totalEnrolled adalah orang yang
melakukan pendaftaran. Measure totalProcessTier adalah jumlah anggota GFF
yang mengalami perubahan level tier, baik upgrade, downgrade ataupun maintain
tier.
4.3.6.2 Model Air Transaction (Earning)
Jumlah penerbangan anggota GFF yang masuk dalam katagori earning
mileage, atau menambah jumlah mileage bagi anggota yang bersangkutan.
Measure-measure dalam tabel fakta air_transaction adalah award_mileage,
tier_mileage, flown_frequency dan frequency_mileage. Dalam accrual rule,
beberapa jenis penerbangan dinilai 0 sehingga untuk melihat jumlah penerbangan
tidak dari frequency_mileage tapi dibuat measure terpisah, yakni flown_frequency
yang menunjukan jumlah penerbangan.
57
class Air Transaction Model
fact_air_trans
«column» originAirportKey destAirportKey memberAddressKey operatorFlightNumKey bookingClassKey statusKey tierKey timeKey awarMileage tierMilaege frequencyMileage flownFrequency
dim_tier
«column» tierName
dim_time
«column» year quarter month day
dim_customer
«column» enrolledBranchOffice enrolledCity enrolledChannel gender
dim_airport
«column» iataCode country
dim_book_class
«column» bcName
dim_oper_flight
«column» fl ightNumber
dim_mem_address
«column» city country
status
«column» name
1
0..*
1
0..*
1
0..*
1 0..*
1
0..*
1
0..*
1
0..*
10..*
Gambar 4.9- Model skema bintang aktifitas penerbangan anggota
Berikut adalah skema bintang transaksi penerbangan yang menambah
mileage anggota, pada gambar 4.8. Tabel fact_air_trans ini digunakan untuk
menyimpan informasi penerbangan anggota GFF. Setiap penerbangan yang
dilakukan oleh anggota GFF tercatat ditabel ini bersama atribut-atribut yang ada
dalam dimensi. Aktivitas penerbangan akan dihargai oleh GFF dan anggota akan
mendapatkan point atas penggunaan jasa tersebut yang terdiri dari 3 macam yakni
awardMileage, tierMileage dan frequencyMileage. Ketiga mileage ditambah
dengan atribut flownFrequency menjadi measure dalam tabel fact_air_trans ini.
4.3.6.3 Model Non Air Transaction (Earning)
Model star skema untuk transaksi bukan penerbangan adalah seperti
terlihat pada gambar 4.9. Measure yang dimiliki oleh tabel fakta
non_air_transaction adalah award_mileage dan tier_mileage. Dimensi yang
58
dimiliki model ini juga berbeda dengan tabel fakta fact_air_transaction. Pada
model ini measure yan ada hanya award mileage dan tier mileage tanpa frequency
karena tidak diperhitungkan frequency tapi lebih kesepakatan paket-paket yang
menjadi kerja sama antara GFF dan partner.
class Non Air Transaction
dim_partner
«column»*PK partnerId name location
«PK»+ PK_dim_partner()
fact_non_air_trans
«column» partnerKey timeKey memberAccountKey awardMileage tierMileage
dim_time
«column»*PK timeId year quarter month day
«PK»+ PK_dim_time()
dim_customer
«column»*PK customerId enrolledBranchOffice enrolledCity enrolledChannel gender
«PK»+ PK_dim_customer()
1
0..*
10..*1 0..*
Gambar 4.10- Model skema bintang aktifitas bukan penerbangan (non air activity) anggota
GFF
Peranan dari tabel fact_non_air_trans ini adalah menyimpan informasi
data aktifitas anggota GFF yang dilakukan bersama partner GFF seperti misalnya
aktivitas melakukan credit dengan melalui kartu GFF Cobrand, kartu yang
diissued oleh CitiBank dan bekerja sama dengan GFF. Contoh aktivitas lainnya
adalah aktivitas menginap di hotel Aston, karena Aston adalah partner GFF maka
anggota tersebut mendapatkan sejumlah awardMileage. Transaksi bukan
penerbangan ini measurenya hanya satu, yakni awardMileage karena mileage
yang dihasilkan memang hanya awardMileage.
4.3.6.4 Model Certificate Transaction (Spending)
Anggota GFF yang melakukan redeem, membelanjakan mileage (award
mileage) yang dimilikinya, tercatat dan diaudit oleh bagian keuangan. Berapa
59
jumlah voucher yang telah direedem dan mileage yang telah digunakan oleh
anggota dengan berbagai dimensi. Award mileage anggota GFF bisa digunakan
untuk mendapatkan tiket gratis penerbangan atau untuk meng-upgrade tiket
booking class ekonomi yang dibeli masuk ke booking class bisnis.
class Certificate Transaction
dim_airport
«column»*PK airportId iataCode country
«PK»+ PK_dim_airport()
fact_trans_cert
«column» originAirportKey destAirportKey memberAccountKey issuedDateKey transDateKey awardMileage
dim_customer
«column»*PK customerId enrolledBranchOffice enrolledChannel enrolledCity gender
«PK»+ PK_dim_customer()
dim_ticket_office
«column»*PK ticketOfficeId boName countryName ticketOffice
«PK»+ PK_dim_ticket_office()
dim_time
«column»*PK timeId year month day
«PK»+ PK_dim_time()
dim_trans_type
«column»*PK transTypeId type
«PK»+ PK_dim_trans_type()
dim_status
«column»*PK statusId name
«PK»+ PK_dim_status()
1
0..*
1
0..*
1
0..*
1
0..*
1
0..*
1
0..*
Gambar 4.11- Model skema bintang redeem (penggunaan mileage) anggota GFF
Peranan dari tabel fakta fact_trans_cert adalah menyediakan informasi dan
laporan penggunaan awardMileage untuk mendapatkan tiket gratis. Measure yang
diperlukan untuk tabel fakta fact_trans_cert ini adalah awardMileage yang akan
mengurangi jumlah atau saldo award mileage anggota.
60
4.3.6.5 Tabel Dimensi
Tabel dimensi adalah tabel yang berisikan data dari berbagai perspektif
atau dengan kata lain tabel dimensi adalah tabel yang berisikan user-defined
metadata. Dimensi-dimensi itu dipilih dalam upaya meningkatkan kualitas
pelaporan yang sudah ada menjadi lebih baik dengan cara memberikan laporan
secara rinci berdasarkan dimensi-dimensi tersebut. Dalam model ini beberapa
dimensi digunakan bersama-sama oleh tabel fakta yang berlainan.
4.3.6.5.1 Dimensi Airport
Dimensi airport digunakan oleh tabel fakta yang berisi transaksi
penerbangan baik untuk untuk earning atau spending. Airport ini menunjukan asal
penerbangan dan tujuan penerbangan. Dalam dunia penerbangan, untuk
mengidentifikasi lokasi airport digunakan IATA code yang terdiri dari 3 huruf.
Setiap airport memiliki IATA airport code. Seluruh airport dunia diassign IATA
code dan lembaga yang mendefinisikannya adalah International Airport
Transport Association (IATA) yang bermarkas di Montreal,
4.3.6.5.2 Dimensi Location
Garuda memiliki branch office yang tersebar di hampir seluruh kota-kota
besar Indonesia dan beberapa kota besar di luar negeri. Ketika mendaftar pertama
kali, anggota GFF terdaftar di branch office terdekat yang sesuai dengan alamat
yang digunakannya. Aktifitas promosi pada anggota GFF sering dilakukan
spesifik untuk branch office tententu.
4.3.6.5.3 Dimensi Gender
Anggota GFF terdaftar dengan jenis kelamin saat dia terdaftar. Data yang
ada adalah M yang berarti Male atau pria dan F yang berarti Female atau
perempuan.
61
4.3.6.5.4 Dimensi Customer Status
Setelah anggota GFF mengaktifkan keanggotaanya dengan melakukan
penerbangannya. Status anggota GFF yang awalnya inactive menjadi active.
Setelah masa setahun hingga dua tahun (tergantung tier yang dimilikinya),
keanggotaannya dievaluasi apakah masih layak atau tidak dan jika tidak layak
maka statusnya menjadi deleted.
4.3.6.5.5 Dimensi Member Tier Composition
Tier Composition kombinasi antara catalog member type dan catalog
member tier. Member type adalah jenis keanggotaan dalam GFF. Beberapa jenis
keanggotaan GFF adalah berbayar yang berbeda bisnis prosesnya dengan yang
tidak berbayar. Tier merupakan level dalam GFF yang dijadikan indikator
loyalitas anggota pada GFF.
4.3.6.5.6 Dimensi Booking Class
Garuda Indonesia adalah full-service airline yang berbeda dengan 'no-frill’
low cost carrier. Konfigurasi kelas penerbangannya terbagi menjadi kelas
executive dan kelas ekonomi. Pembagian ini terkait dengan in-flight service yang
diberikan. Dalam sistem GFF, kelas excutive juga mendapat rate yang lebih tinggi
dibandingkan dengan kelas ekonomi. Kode booking class menggunakan kode
huruf dan yang masuk kategori class executive adalah C, D dan I. Selain ketiga
code tersebut masuk kategori class ekonomi.
4.3.6.5.7 Dimensi Time
Data yang termasuk kedalam tabel dimensi time yaitu id tanggal, tanggal
lengkap (dd-mm-yyyy), periode bulan , periode 3 bulanan (quarterly) dan tahun.
62
4.3.6.5.8 Dimensi Operating Flight Number
Aktifitas penerbangan mencatat data operator flight number, yakni flight
yang digunakan untuk terbang. Karena beberapa penerbangan bisa jadi melibatkan
berapa operator penerbangan. Primary key dari tabel dimensi ini adalah flightId.
4.3.6.5.9 Dimensi Partner
Dimensi ini berisi data-data partner GFF. Satu partner bisa berisi lebih
dari satu record dengan harus lokasi yang berbeda. Contohnya adalah partner
hotel Accor group yang memiliki beberapa hotel. Setiap hotel akan memiliki satu
key location dan satu partner memiliki satu location atau lebih.
63
BAB V
IMPLEMENTASI DATA WAREHOUSE
Tujuan adanya Frequent Flyer Program seperti GFF adalah menjaga dan
meningkatkan market share dengan mempertahankan valueable customer dengan
mengetahui dan mengerti secara proactive kebutuhan dan keinginan setiap
konsumen. Konsumen tesebut berharga karena menggunakan jasa yang disediakan
oleh Garuda secara berulang (generate repeat business among core customers)
dan menjadi core customer dan salah satu jalan meningkatkan customer equity
(CE). Konsumen menggunakan jasa Garuda secara berulang terkait dengan
kualitas pelayanan Garuda. Selain itu, GFF juga bertujuan untuk mendukung
program yang diadakan oleh bagian marketing.
Kemampuan penyediaan informasi dari data warehouse untuk melakukan
analisa terhadap kegiatan anggota Garuda Frequent Flyer, baik dari enrollment,
proses upgrade dan downgrade, sehingga managemen Garuda dapat menentukan
langkah apa yang bisa dilakukan untuk meningkatkan kualitas pelayanan terhadap
customer.
Data warehouse Garuda Frequent Flyer dibangun agar dapat
menyediakan informasi yang cepat, tepat dan akurat sehingga manajemen Garuda
dapat mengambil keputusan yang tepat dalam meningkatkan pelayanannya
terhadap penumpang dan penumpang melakukan pembelian yang terus berulang
dan menjadi penumpang yang loyal.
5.1 Presentasi Data Warehouse
Kemampuan data warehouse dalam menyajikan informasi pada pengguna
adalah hal yang paling penting. Penggunaan tools dalam presentasi data perlu
dipertimbangkan hal-hal seperti fitur yang ada, biaya saat development dan
maintain setelah data warehouse beroperasi. Tools yang digunakan sebisa
64
mungkin tidak terikat (loosely coupled) pada satu platform database supaya
pengembangan di layer bisnis tidak perlu mengubah mengubah terlalu banyak
arsitektur dibawahnya (separation of concern) . Tools yang digunakan adalah:
• Mondrian adalah OLAP engine yang menggunakan bahasa pemrograman
java. Mondrian digunakan untuk analisis interaktif dari database yang
besar, menggunakan bahasa MDX (Multi Dimensional eXpression) untuk
mengeksekusi Query. MDX merupakan query yang digunakan untuk data
multidimensional dan menggunakan sintaks yang sama dengan SQL.
Perbedaannya adalah SQL digunakan untuk query relational table
sedangkan MDX digunakan untuk query multidimensional table.
• JPivot adalah JSP yang dapat menampilkan OLAP table dan chart. JPivot
mempunyai kemampuan navigasi OLAP seperti drill down, slice dan dice.
JPivot adalah taglib Java Server Pages (JSP) yang yang bersifat open
source.
Kemampuan Mondrian dalam berintergrasi dengan berbagai platform
database memberi kebebasan bagi pengembang data warehouse untuk memilih
database sesuai dengan kebutuhan dan mengurangi ketergantungan pada satu
vendor saja (vendor lock-in). Meskipun tools ini bersifat open source dan
penggunaan tools yang bersifat open source tetapi Mondrian dan JPivot memiliki
kemampuan yang baik sebagai OLAP engine dan melakukan presentasi data
warehouse.
5.2 Penyediaan Informasi
Media yang digunakan untuk menampilkan presentasi tersebut adalah
media web. Dengan media web diharapkan dapat mempermudah pengguna dalam
melihat informasi tersebut, kapan dan dimana saja selama terhubung dengan
jaringan dan memiliki browser, yakni web browser yang mengakses aplikasi
aplikasi Mondrian yang dideploy di web server. Kemampuan yang dimiliki
aplikasi data warehouse ini antara lain:
65
• Kemampuan roll-up dan drill-down sehingga memudahkan analisa
data, seberapa dalam tingkat kedetailan yang diinginkan oleh
pengguna.
• Roll-up adalah kemampuan menampilkan data dengan tingkat rincian
yang lebih rendah. Drill –down adalah kemampuan menampilkan data
dengan tingkat rincian yang lebih tinggi.
• Kemampuanuntuk membuat query sendiri seusai dengan kebutuhan
• Kemampuan report customization sesuai dengan kebutuhan informasi.
• Kemampuan untuk membuat chart atau grafik sesuai dengan laporan
yang diinginkan.
• Kemampuan membuat report dalam format Excel dan dan PDF
5.2.1 Informasi Customer
Apapun bentuk dan jenis bisnis model, supaya tetap eksis diperlukan
customer. Ukuran keberhasilan loyality program seperti GFF salah satunya adalah
banyaknya customer atau penumpang yang terdaftar sebagai anggota GFF.
Penumpang memiliki kebutuhan yang spesifik yang perlu dipenuhi. Pembagian
kelompok dalam sistem GFF adalah dalam bentuk tier level composition.
Pembagian kelompok ini secara tidak langsung adalah salah satu upaya GFF
dalam menerapkan strategi segmentasi pelanggannya berdasarkan tingkat
penggunaan layanan jasa Garuda.
Sebagai gambaran adalah, anggota GFF yang memiliki “tier composition“
Temp Reguler, artinya anggota tersebut belum melakukan aktifitas
penerbangannya dengan dengan Garuda. Garuda akan mencoba menarik anggota
Temp Reguler ini ke dalam tier Blue untuk melakukan aktifitas penerbangannya.
Garuda memberikan paket promosi “Welcome Blue” pada anggota GFF Temp
yang melakukan penerbangan perdananya. Perlakuan Garuda terhadap anggota
GFF yang memiliki level Platinum, berbeda dengan level yang dibawahnya.
Anggota Gold dan Platinum diberikan kartu “luggage” bersamaan dengan
pengiriman kartu anggota yang baru, yang dapat digunakan oleh anggota agar
bagasinya mendapat prioritas.
66
Berikut ini adalah jenis-jenis laporan yang berkaitan dengan informasi
customer:
Laporan jumlah anggota per-branch office terdekat dari tempat tinggalnya
(Gambar 5.1).
Laporan jumlah anggota yang melakukan aktivasi (Gambar 5.2)
Laporan jumlah anggota per-tier composition (Gambar 5.3)
Gambar 5.1- Contoh report Customer per branch office pada tahun 2007
67
Gambar 5.2- Contoh report Customer per Tier Composition pada tahun 2007
Gambar 5.3 - Contoh report Customer per yang melakukan aktivasi pada tahun 2007
68
Gambar 5.4 Informasi Customer yang terdistribusi dalam beberapa tier yang di slice hanya
tahun 2007 dan drill-down berdasar usianya.
Gambar 5.5 Informasi Enrolment Customer yang terdistribusi dalam dalam tahun pendaftaran
dilengkapi dengan grafik trend enrollment.
69
5.2.2 Informasi Earning/Accrual Traffic
Aktifitas anggota GFF bersama Garuda dan partner GFF diberikan
apresiasi oleh Garuda dalam bentuk mileage atau disebut accrual mileage yang
bersifat earning point bagi anggota GFF. Anggota mendapatkan award mileage,
tier milage dan frequency.
Berikut adalah contoh informasi earning mileage customer GFF. Jumlah
mileage yang dikeluarkan oleh Garuda adalah utang garuda pada palanggannya
dan tercatat untuk audit oleh bagian keuangan. Bagian keuangan mengalokasikan
sejumlah mileage anggota yang tercatat sebagai liquid cash.
Gambar 5.6- Earning mileage customer yang di-slice berdasarkan Origin Destination airport
penerbangan
70
Gambar 5.7- Earning mileage customer yang di slice berdasarkan Origin Destination airport
penerbangan yang dilengkap dengan grafik pie chart.
5.2.3 Informasi Redeem Traffic
Traffic penerbangan anggota GFF yang merupakan penerbangan redeem,
menjadi salah satu indikator kinerja divisi loyalty. Reedem adalah penggunaan
/pembelanjaan mileage anggota GFF untuk mendapatkan award dari penyedia
loyality program, dalam hal ini Garuda.
71
Gambar 5.8- Contoh report redeem activity per branch office pada tahun 2007
5.3 Pengaruh Perubahan
Modul report dalam sistem operasional GFF adalah bagian dari sistem
GFF yang menangani berbagai bentuk report. Query yang disubmit kedalam
sistem akan di eksekusi secara periodik oleh batch proses sesuai dengan
kebutuhan. Format yang dihasilkan oleh sistem GFF adalah format microsoft
excel.
Kebutuhan untuk mendapatkan laporan, baik laporan harian, mingguan,
bulanan atau 3 bulanan saat ini ditangani sepenuhnya oleh pengelola sistem GFF.
Flow jika ada kebutuhan report yang tidak tersedia dalam sistem, flow berikut
harus dilalui dan flow ini akan memerlukan waktu hingga 1 bulan. Diawali
dengan change request dari garuda pada pihak pengelola sistem GFF. Pengelola
sistem akan melakukan analisa terhadap dampak setiap perubahan, termasuk
adanya report pada live systems. Setelah diketahui dampak-dampak perubahan,
hasil analisa ini akan dibicarakan dalam CAB meeting dan penyusunan skenario
deployment, skenario jika deployment gagal dan step-step detail untuk fall back,
menetapkan tanggal, dan team yang melakukan perubahan. Setelah CAB selesai
72
yang dilengkap dokumen perubahan (biasanya 2 kali CAB meeting), proses CAB
dilakukan pada tanggal yang telah ditetapkan. Dalam bentuk diagram alir, proses
CAB adalah sebagai berikut, pada gambar 5.9.
Gambar 5.9- Langkah-langkah implementasi jenis report baru.
Dengan adanya data warehouse, penyusunan laporan menjadi lebih
sederhana, karena pengguna dapat melakukan customization report sesuai dengan
yang diinginkan, sehingga dapat diperoleh efisiensi waktu dari yang awalnya 3
minggu untuk melakukan change request hingga dapat digunakan dan 5 hari kerja
jika diselesaikan secara ad hoc query¸ menjadi satu hari. Dengan demikian GFF
dapat mengoptimalkan sumber daya manusia yang sebelumnya dialokasikan
untuk penyusunan laporan menjadi lebih fokus pada hal yang sifatnya strategis
mengelola partnership yang strategic atau merancang promosi yang tepat untuk
diajukan ke Garuda. Hal lainnya yang diperoleh dari data warehouse adalah
tersedianya data history setiap customer baik yang statusnya active ataupun yang
tidak active lagi untuk kebutuhan data mining misalnya.
Change Request dalam bentuk RFC dan analisa dampak perubahan terhadap
Change Advisory Board Meeting (Membahas skenario jika berhasil dan gagal, dan
gagal step-step untuk fall back)
Deployment dan monitoring dampak perubahan
Change Advisory Board Meeting (Evaluasi terhadap perubahan)
73
Saat report dieksekusi langsung terhadap data operasional, sistem yang
berjalan menjadi jauh lebih lambat bahkan tidak jarang sistem menjadi tidak
stabil. Hal ini dikarenakan database yang digunakan oleh sistem operasional
resourcenya digunakan oleh query report yang jumlahnya hingga jutaan transaksi.
Setelah sistem data warehouse diimplementasikan, maka sistem operasional tidak
terganggu saat repot digenerate. Performance sistem operasional juga tidak
terganggu terkait kebutuhan report saat melakukan uji report yang baru sebagai
bagian dari proses CAB.
74
BAB VI
IMPLEMENTASI DATA MINING
Pada bab ini dijelaskan mengenai implementasi data mining untuk
mendapatkan dan menggali informasi yang tersembunyi dalam data warehouse.
Untuk mendapatkan hasil yang baik dan bermanfaat diperlukan proses data
mining yang terstruktur dengan baik melalui tahapan data mining. Karena itu
pada bab ini akan dijabarkan bagaimana implementasi data mining dijalankan
melalui tahapan data mining yang sebelumnya dijelaskan pada bab II.
6.1 Pemahaman Terhadap Bisnis
Tujuan dari adanya GFF ada dua yakni; 1) untuk menjaga dan
meningkatkan marketshare dengan cara meningkatkan jumlah customer yang
loyal, 2) mendukung program-program pemasaran. Seperti yang diuraikan
sebelumnya pada bab II, bahwa biaya untuk mendapatkan customer baru akan
jauh lebih mahal dari pada mempertahankan customer yang loyal.
Salah satu program/promosi yang ditawarkan oleh GFF dalam rangka
meningkatkan customer yang loyal adalah dengan adanya keanggotaan yang
langsung menempati posisi tertinggi dalam tingkatan tier adalah dengan adanya
program Cobrand. GFF bekerja sama dengan Citibank menjaring anggota secara
bersamaan. Cara kerjanya adalah anggota pemilik kartu kredit Citibank akan
ditawari untuk menjadi anggota GFF dengan imbalan keanggotaan eksklusif
dengan level tier tertinggi tanpa harus memiliki mileage yang cukup dan tidak
harus memenuhi kriteria seperti halnya anggota biasa. Penawaran keanggotaan ini
saat anggota akan masuk menjadi pemilik kartu kredit Citibank. Citibank menjadi
intermediary untuk melakukan cross selling GFF. Aktifitas anggota baik bersama
GFF atau bersama Citibank akan mendapatkan poin mileage.
75
Adanya program Cobrand ini cukup beralasan, karena orang-orang yang
memiliki kartu kredit Citibank berpeluang besar untuk menggunakan jasa
penerbangan Garuda terkait dengan tingkat penghasilannya yang diasumsikan
menengah keatas. Bagi GFF, selain mendapatkan Customer yang potensial untuk
memberikan revenue, juga mendapatkan prosentase membership fee dari anggota
yang dibayarkan ke Citibank.
6.2 Sumber Data
Saat anggota GFF tercatat dalam sistem, anggota tersebut dan akan
memiliki kartu Temp. Dengan level tier Temp, customer tersebut belum
melakukan penerbangan dengan Garuda, kemudian sesaat setelah anggota Temp
melakukan penerbangan maka ia berubah menjadi ber-level Blue dan selanjutnya
itu level tier bergantung pada seberapa banyak anggota melakukan aktifitasnya
bersama Garuda atau partner-nya. Sewaktu-waktu anggota tersebut bisa naik ke
level yang lebih tinggi. Dan setiap tahun, dievaluasi apakah tier-nya turun atau
tidak tergantung akumulasi aktifitas selama setahun. Aturan seperti ini berlaku
untuk anggota tidak berbayar dan bersifat terbuka dan berbeda dengan
keanggotaan yang bersifat tertutup.
Salah satu keanggotaan yang bersifat tertutup adalah Cobrand. Tidak
seperti keanggotaan terbuka atau Reguler, masa berlaku Cobrand adalah selama
tiga tahun terhitung sejak anggota tersebut mendaftar. Hanya saja, bisa saja
anggota tersebut berhenti dari Cobrand (Terminate Cobrand) dan GFF otomatis
merubah jenis kenggotaannya menjadi keanggotaan biasa (Reguler member type)
yang pada akhir tahun akan dievaluasi kelayakan level tier-nya. Pada prinsipnya,
saat anggota melakukan terminasi keanggotaan Cobrand anggota tersebut
mengundurkan diri dari kepemilikan kartu kredit Citibank, dan masih anggota
GFF.
Mekanisme melakukan terminasi Cobrand adalah dimulai dari anggota
yang mengundurkan diri melalui Citibank yang selanjutnya Citibank mengirimkan
file berisi daftar anggota yang berhenti menjadi Cobrand dan sistem operasional
memproses file tersebut.
76
Masa keanggotaan GFF Cobrand terhitung sejak terdaftar sejak anggota
tanggal mengajukan terdaftar, hingga sehari sebelum terdaftar menjadi anggota
biasa dapat dihitung sebagai lamanya anggota tersebut telah memberikan revenue
pada Garuda dengan iuran yang anggota bayar tiap tahun. Semakin lama seorang
anggota GFF menjadi Cobrand maka nilai Customer Equity semakin lebih besar
yang artinya anggota tersebut memiliki potensi menjadi sumber pendapatan GFF.
Pilihan bagi anggota untuk menggunakan alamat pribadi atau alamat
kantor diasumsikan bahwa saat anggota menggunakan alamat kantor maka
perjalanan dan aktifitasnya bersama Garuda adalah aktifitas atau perjalanan bisnis.
Karena data adalah hasil dari data warehouse, maka cleansing data tidak perlu
dilakukan, yang perlu dilakukan adalah membuat kedalam bentuk artifact (data
bukan dalam bentuk transaksi dimana customer bisa mempunyai banyak transaksi
atau satu customer bisa punya banyak baris karena transaksinya lebih dari satu,
tetapi data bisa di jadikan menjadi data aggregat sehingga satu user itu satu baris
dengan seluruh atribut yang melekat ke dia di tempatkan di memanjang sebagai
kolom-kolom). Langkah selanjutnya diskretisasi/binning. Ditentukan keperluan
untuk merubah semua atribut numerik menjadi kategori atau dipilih atribut yang
akan dibinning.
6.3 Pemilihan Teknik dan Perangkat lunak Data Mining
Teknik data mining yang digunakan untuk data mining pada sistem GFF
adalah Decision Tree dan Association Rule sesuai dengan tujuan untuk memahami
karakteristik anggota GFF Cobrand selama keanggotaannya sebelum melakukan
terminasi.
Perangkat lunak yang digunakan untuk penelitian ini adalah Rapidminer
(sebelumnya bernama Yale) versi komunitas. Rapidminer memiliki dua lisensi,
lisensi yang bersifat propietary (AGPL) dan yang bersifat free. Dari segi product
Rapidminer terdapat dua versi yaitu versi enterprise dan Rapidminer versi
komunitas. Perbedaan keduanya terutama dalam hal support yang diberikan oleh
Rapid-I sebagai pengembang.
77
6.4 Persiapan Data
Pemodelan data mining dirancang berdasarkan kebutuhan dan
karakteristik data yang ada pada data warehouse GFF. Jumlah data
anggota/customer GFF yang aktif adalah sekitar 300 000 orang. Dari jumlah
tersebut tersebut kemudian dipilih customer yang member type-nya pernah
menjadi atau memiliki Cobrand berdasarkan history dari dimensi tier composition
dan statusnya active yang jumlahnya menjadi 22 970 orang.
Tujuan dari data mining ini adalah untuk melihat karakteristik anggota
Cobrand yang mengundurkan diri melalui Citibank sebagai partner GFF. Dengan
tujuan demikian, maka customer yang dianalisa adalah customer yang telah
mengundurkan diri sebelum masa berlaku keanggotaanya habis, sehingga dari 22
970 orang, mengkerucut menjadi 990 orang yang melakukan terminasi
keanggotaan Cobrand dan berubah menjadi Reguler.
6.4.1 Persiapan Data Teknik Association Rule
Tahap pertama adalah tahap preprocessing yang meliputi operator
frequency discretization dan filter operator nominal to binominal. Frequency
discretization mengubah atribut angka menjadi disktrit dengan memasukan nilai
bins pada operator frequency discretization.
78
Gambar 6.1 Building block menggunakan Rapid miner Community 4.2 dengan teknik data
mining association rule
Preprocessing
Menghitung frequent item sets
Mencari Association Rule berdasarkan frequent item sets dari FFPGrowth
79
ACCOUNT_ID GEN- DER
ENROLL_ CHANNEL
ADDRESS_TYPE
CURRENT- TIERNAME
LIFEDURA- TIONIN- MONTH
DURATION- FROMREGIS- TERINMONTH
725 M BO PRIVATE Silver 10.07 95.63 1377 F BO BUSINESS Blue 11.6 50.03 1448 F BO PRIVATE Silver 1.27 34.73 1528 M BO PRIVATE Silver 0.27 33.83 2190 M BO BUSINESS Gold 1.77 107.2 2239 M BO PRIVATE Platinum 0.03 98.9 2367 M BO BUSINESS Gold 0.07 83.3 2555 M BO PRIVATE Platinum 10.07 85.4 2730 M BO BUSINESS Platinum 0.73 62.73 5304 M CSS BUSINESS Blue 1.07 19.57 7480 M CSS PRIVATE Silver 0.3 14 7787 M CSS PRIVATE Blue 1.37 19.2 9255 M CSS BUSINESS Silver 0.43 2.33
11871 M BO PRIVATE Blue 2.37 47.63 12043 M BO PRIVATE Silver 6 39.07 12045 M BO BUSINESS Blue 11.87 57.27 12700 M BO BUSINESS Blue 4.8 57.8 14208 M BO PRIVATE Blue 2.77 48.4 14773 M BO PRIVATE Blue 13.5 48.4 15433 F BO PRIVATE Blue 5.27 47.27 16375 F BO BUSINESS Silver 1.13 33.63 17128 F BO BUSINESS Blue 2.53 39.37 18692 M BO BUSINESS Blue 0.17 36.5 21893 M BO BUSINESS Silver 2.17 84.33 22147 M BO PRIVATE Blue 4.13 21 25268 F BO PRIVATE Blue 9.83 33.27 28911 M BO PRIVATE Blue 12 19.27 36070 M COBRAND BUSINESS Gold 0 25.73
… … … … … … …
Tabel 6.1 Tabel sebelum transformasi
80
Tabel 6.2 Tabel setelah transformasi/preprocessing
ACCOUNT_ID
CURRENTTIERNAME
GENDER = M
GENDER = F
GENDER = \\N
ENROLL_CHANNEL = BO
ENROLL_CHANNEL = CSS
ENROLL_CHANNEL = COBRAND
ADDRESS_TYPE = PRIVATE
ADDRESS_TYPE = BUSINESS
LIFEDURATIONINMONTH = range1 [-∞ - 0.450]
LIFEDURATIONINMONTH = range2 [0.450 - 1.150]
LIFEDURATIONINMONTH = range3 [1.150 - 2.315]
LIFEDURATIONINMONTH = range4 [2.315 - 5.315]
LIFEDURATIONINMONTH = range5 [5.315 - ∞]
DURATIONFROMREGISTERINMONTH = range1 [-∞ - 0.850]
DURATIONFROMREGISTERINMONTH = range2 [0.850 - 2.415]
DURATIONFROMREGISTERINMONTH = range3 [2.415 - 8.465]
DURATIONFROMREGISTERINMONTH = range4 [8.465 - 29.565]
DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
725
Silver
TRUE
FALSE
FALSE
TRUE
FALSE
FALSE
TRUE
FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE
1377
Blue
FALSE
TRUE
FALSE
TRUE
FALSE
FALSE
FALSE
TRUE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE TRUE
1448
Silver
FALSE
TRUE
FALSE
TRUE
FALSE
FALSE
TRUE
FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
1528
Silver
TRUE
FALSE
FALSE
TRUE
FALSE
FALSE
TRUE
FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
2190
Gold
TRUE
FALSE
FALSE
TRUE
FALSE
FALSE
FALSE
TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
2239
Platinum
TRUE
FALSE
FALSE
TRUE
FALSE
FALSE
TRUE
FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE
… … … … … … … … … … … … … … … .. … … … …
81
Langkah pertama dalam melakukan teknik association rule adalah
preprocessing yang meliputi operator Frequency Discretization dan filter
operator Nominal To Binominal. Frequency Discretization mengubah atribut
angka menjadi disktrit dengan memasukan nilai bins pada operator Frequency
Discretization. Tahap selanjutnya adalah menghitung frequent items dengan
menggunakan FFGrowth operator dan output dari FFGrowth akan menjadi
masukan bagi operator AssociationRuleGenerator untuk menghitung frequent
items.
6.4.2 Persiapan Data Teknik Decision Tree
Teknik Decision Tree adalah metode clasification yang mudah dipahami.
Teknik data mining ini sangat fleksibel terhadap berbagai tipe data input yang
diolah sehingga tidak diperlukan preprocessing pada atribut-atribut yang
digunakan seperti teknik Association Rule dan yang menjadi class/label yang
diprediksi adalah tier, apakah tiernya naik atau turun setelah anggota GFF
tersebut menghentikan keanggotaan Cobrand-nya. Gambar 6.2 menunjukan
building block data mining dengan teknik Decision tree yang tidak memerlukan
preprocessing terhadap atribut inputnya.
82
Gambar 6.2 Building block metode Decision tree menggunakan Rapidminer Community 4.2
6.5 Analisa Hasil Uji Coba
6.5.1 Analisa Hasil Uji Coba Dengan Teknik Association Rule
Pada uji coba ini, minimum support yang digunakan adalah 10%, sehingga
jika persentase kombinasi item dalam dataset lebih dari 10% maka akan dibuatkan
rule yang berkaitan dengan kombinasi item tersebut tetapi jika tidak maka akan
diabaikan dan dengan minimal confidence sebesar 70%. Dari percobaan ini tidak
ditemukan rule-rule yang berhubungan dengan atribut jenis alamat yang
digunakan oleh anggota GFF Cobrand. Hasil uji coba adalah sebagai berikut:
Berdasarkan hasil pemodelan yang nampak pada tabel 6.4 pada tabel
diatas, diperoleh karakteristik anggota Cobrand yang melakukan pendaftarannya
melalui channel Cobrand Citibank dan life duration Cobrand kurang dari 4 bulan,
maka kemungkinan masa keanggotaan GFF-nya kurang dari 8 bulan atau berada
pada range1 (rule no 147 dan 150) dengan nilai confidence rata-rata 98%% dan
nilai support rata-rata 12%.
Prosess Decision tree
83
No Rule Premises Conclusion Support Confidence
156
DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.200405 1
158
GENDER = M, DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.158907 1
163
ADDRESS_TYPE = PRIVATE, DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.112348 1
164
ADDRESS_TYPE = BUSINESS, DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.088057 1
170
GENDER = M, ADDRESS_TYPE = PRIVATE, DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.087045 1
171
GENDER = M, ADDRESS_TYPE = BUSINESS, DURATIONFROMREGISTERINMONTH = range5 [29.565 - ∞]
ENROLL_CHANNEL = BO 0.071862 1
Tabel 6.3 Model Rule dengan kesimpulan masa keanggotaan Cobrand dalam mendaftar melalui
channel BO
Berdasarkan hasil pemodelan yang nampak pada tabel 6.1 pada tabel
diatas, diperoleh karakteristik anggota Cobrand yang melakukan terminasi
setelah masa keanggotaan GFF-nya lebih dari 29.56 bulan adalah anggota
Cobrand yang mendaftar GFF melalui channel BO, dengan nilai confidence 100%
dan support 20%. Dapat dilihat dari rule no 156.
Channel BO atau Back Office adalah adalah channel pendaftaran yang
disediakan GFF yang dapat dilakukan di kantor cabang Garuda, ticket office atau
kantor check in Garuda dengan mengisi formulir yang telah disediakan Garuda.
Cobrand adalah salah satu jalan pintas bagi anggota GFF untuk mendapat posisi
tier tertinggi. Anggota GFF yang telah lama dan ditawari keanggotaan Cobrand,
sehingga jika keanggotaannya berada pada range5 dan anggota tersebut adalah
Cobrand, maka dapat dipastikan sebelumnya adalah anggota Reguler.
84
No Rule Premises Conclusion Support Confidence
147
GENDER = M, ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range1 [-∞ - 0.450]
DURATIONFROMREGISTER INMONTH = range1 [-∞ - 0.850] 0.112348 0.982301
150
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range1 [-∞ - 0.450]
DURATIONFROMREGISTER INMONTH = range1 [-∞ - 0.850] 0.13664 0.985401
153
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range3 [1.150 - 2.315]
DURATIONFROM REGISTER INMONTH = range2 [0.850 - 2.415] 0.121457 0.991736
127
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range4 [2.315 - 5.315]
DURATIONFROMREGISTER INMONTH = range3 [2.415 - 8.465] 0.126518 0.925926
Tabel 6.4 Model Rule dengan kesimpulan masa keanggotaan Cobrand dalam range1, range2, dan range2.
Anggota Cobrand yang melakukan terminasi saat life duration-nya antara
1 hingga 2 bulan dan melakukan channel Cobrand, maka kemungkinan masa
keanggotaan GFF-nya antara 0.8 bulan hingga 2 bulan (rule 153). Pada rule ini
nilai confidence-nya 99% dan nilai support rata-rata 12%.
Dari hasil data mining dengan teknik association rule ini ditemukan
bahwa anggota GFF yang memiliki telah mendaftar dan usia GFF-nya 8 bulan
hingga 2 tahun berkecenderungan akan loyal dengan keanggotaanya sebagai
anggota Cobrand dengan masa lebih 5 dari bulan. Jika keanggotaan GFF-nya
berusia lebih dari 2 tahun maka kemungkinan besar adalah anggota yang
melakukan pendaftaran melalui BO.
Dari hasil data tersebut sebagai hasil data mining, maka bagian marketing
bisa menindak lanjuti dengan menggunakan promosi yang lebih tertarget terhadap
anggota Cobrand. Anggota Cobrand channel BO, memiliki banyak anggota yang
menempati posisi tier Platinum, meskipun telah berubah menjadi anggota
Reguler. Artinya, intensitas penggunaan jasa Garuda mencukupi dan jenis
customer ini memiliki nilai customer equity yang besar untuk ditawarkan produk-
produk dari Garuda atau anak perusahaannya seperti jasa Hotel.
85
6.5.2 Analisa Hasil Uji Coba Dengan Teknik Decision Tree
Pada uji coba dengan menggunakan operator Decision three ini class atau
label yang digunakan adalah tier dari setiap anggota. Nilai confidence saat
eksekusi adalah 10% dan criterion yang digunakan adalah information gain,
atribut selection measure yang digunakan untuk memilih test atribut dari suatu
node. Hasil uji coba adalah sebagai berikut:
Gambar 6.3 Bagian dari diagram pohon karakter anggota Cobrand yang mendaftar melalui
channel Cobrand atau Citibank
Channel Cobrand adalah jalur pendaftaran GFF melalui partner, dalam
hal ini Citibank. Anggota Cobrand yang melakukan pendaftaran melalui channel
Cobrand atau dengan kata lain melakukan pendaftaran melalui Citibank memiliki
pola seperti gambar 6.3 di atas. Nilai confidence yang yang digunakan untuk
memproses data ini adalah sebesar 25%. Level tier anggota setelah melakukan
terminasi, untuk anggota seperti di atas berada pada posisi Blue atau Silver,
tergantung pada berapa lama sudah menjadi anggota GFF dan berapa lama durasi
keanggotaan Cobrand –nya hingga saat melakukan terminasi (mengundurkan diri
dari keanggotaan Cobrand).
Anggota yang memiliki masa keanggotaan, terhitung sejak mendaftar,
kurang dari 12.13 bulan berada pada posisi Blue. Tapi jika masa keanggotaanya
lebih dari 12.13 bulan maka posisi tier bisa menjadi Blue atau Silver, tergantung
pada berapa lama durasi keanggotaan Cobrand-nya.
86
Gambar 6.4 Bagian diagram pohon karakter anggota Cobrand yang mendaftar melalui
Customer Self Service (CSS)
Customer Self Service adalah channel/jalur yang disediakan oleh GFF
bagi customer Garuda untuk melakukan pendaftaran keanggotaan GFF, secara
mandiri melalui media internet. Anggota GFF Cobrand yang melakukan
pendaftaran melalui jalur CSS pun memiliki pola yang hampir sama dengan
anggota Cobrand yang melakukan pendaftaran melalui Citibank, nampak pada
gambar 6.4. Sebagian besar anggota turun level keanggotaannya dari level
Platinum menjadi Blue atau Silver.
Baik anggota yang bergabung melalui CSS atau Citibank memiliki tier
Blue dan Silver. Hal ini dapat dimengerti karena keanggotaan Cobrand yang
bersifat tertutup mengabaikan loyalitas, diabaikan jumlah aktifitasnya bersama
Garuda dan Partner, dan digantikan oleh iuran tahunan yang harus dibayarnya.
Anggota Cobrand langsung menempati posisi tier pada level Platinum. Sehingga
saat anggota mengajukan pengunduran diri dari Cobrand (terminate Cobrand)
yang secara otomatis akan mengganti jenis keanggotaanya menjadi Reguler atau
jenis yang terbuka. Karena jenis keanggotaanya sudah menjadi Reguler, maka
GFF mulai memperhitungkan seberapa setia anggota yang awalnya Cobrand
dengan menjumlah transaksi yang telah dilakukannya.
87
Durasi anggota GFF tidaklah berbanding lurus terhadap level tier yang
dimilikinya. Sistem GFF akan mereset nilai tier mileage dan frequency anggota
GFF setiap tahunnya. Tier mileage berbeda dengan award mileage yang dimana
award mileage tidak akan pernah di reset dan akan terus diakumulasi dan yang
digunakan untuk membeli award dari Garuda adalah award mileage. Sehingga
akan ditemui anggota yang keanggotaanya kurang dari 12 bulan justru mendapat
tier Blue, tier yang paling rendah. Dan yang mendapat tier Silver karena transaksi
selama keanggotaan Cobrand ikut diperhitungkan sehingga masih mencukupi
untuk berada diposisi Silver. Untuk berada di level Blue, anggota tersebut cukup
melakukan aktifitas penerbangan sekali atau melakukan aktifitas bukan
penerbangan sekali, sedangkan untuk berada pada posisi Silver, anggota minimal
melakukan penerbangan 10 kali atau tier mileage yang dimiliki adalah 5000 poin.
Anggota Cobrand yang mendaftarkan diri menggunakan jalur BO (Back
Office) melalui kantor cabang, ticket office, atau kantor check in Garuda dengan
mengisi formulir yang telah disediakan Garuda, didapati karakternya lebih
beragam dibandingkan dengan anggota GFF Cobrand yang melakukan
pendaftaran melalui CSS dan Citibank. Bisa dilihat hasil proses data miningnya
pada lampiran 4.
Keberagaman ini salah satu penyebabnya adalah anggota yang mendaftar
channel BO ini pada awalnya adalah anggota Reguler yang kemudian mengubah
jenis membership-nya menjadi Cobrand. Hal ini bisa dilihat dari tanggal saat
anggota mendaftar yang beberapa bulan bahkan tahun lebih awal daripada tanggal
pertama kali membership Cobrand. Penawaran untuk mendapatkan anggota
Cobrand terhadap anggota Reguler adalah salah satu strategi cross-selling yang
dilakukan oleh Garuda, karena setiap transaksi anggota dengan menggunakan
kartu Citibank-nya akan diberi award mileage oleh Garuda dan Garuda akan
mengirimkan billing untuk setiap mileage yang diberikan pada anggota Cobrand.
Selain itu dengan penawaran ini akan lebih mengelompokkan tidak hanya
berdasar tier tapi berdasar kepemilikan kartu kredit Citibank, sehingga dengan
adanya segementasi yang lebih spesifik akan meningkatkan efisiensi bagian
marketing.
88
Dari hasil data mining, divisi Customer Loyality perlu mendefinisikan
kembali bagaimana managemen tier bagi anggota yang pernah menjadi anggota
Cobrand, sehingga anggota tersebut tidak turun drastis level tier-nya setelah status
keanggotaan Cobrand-nya dihentikan. Hal ini dengan alasan peluang bagi Garuda
untuk menawarkan product-product yang lain terhadap anggota yang memiliki
standar hidup menengah ke atas. Pada prinsipnya berhentinya mereka dari
keanggotaan Cobrand adalah sangat mungkin kecewa terhadap Citibank bukan
terhadap GFF karena terminasi terhadap Cobrand saat ini hanya bisa dilakukan
melalui Citibank sebagai penerbit kartu kredit.
89
BAB VII
KESIMPULAN
Bab ini berisi kesimpulan dan saran dari penelitian yang telah dilakukan.
Kesimpulan yang diperoleh merupakan hasil dari pelaksanaan proses perancangan
data warehouse dan pemanfaatan teknik data nining. Sedangkan saran yang
diberikan merupakan saran yang berguna untuk pengembangan penelitian
selanjutnya.
7.1 Kesimpulan
Kesimpulan yang dapat diambil dari perancangan data warehouse dan
penerapan teknik data mining di GFF antara lain:
a) Perancangan BI dengan cakupan pembangunan data warehouse dan data
mining anggota Cobrand pada tesis ini mengacu kepada kebutuhan bisnis
dengan melihat kebutuhan jenis dan bentuk report pada sistem yang sedang
berjalan. Selain itu juga mempertimbangkan indikator kinerja divisi Customer
Loyality.
b) Platform database yang digunakan untuk data warehouse adalah Oracle 9i
tools yang digunakan untuk presentasi data adalah Mondrian dan JPivot.
Pengembangan data warehouse dan implementasi data mining ini
membutuhkan waktu sekitar 4 bulan.
c) Keberadaan data warehouse sangat membantu dalam membuat report. Proses
yang awalnya memerlukan 3 minggu (mengikuti change request) menjadi satu
hari. Perubahan-perubahan atau kebutuhan report yang baru dapat terpenuhi
satu hari karena pengguna bisa melakukan customization report sesuai dengan
yang diinginkan sesuai dengan kebutuhan stakeholder.
Performance sistem operasional yang pada awalnya terganggu karena report
dibuat dengan mengandalkan modul report GFF yang juga bagian dari sistem
90
operasional, kini tidak lagi karena kebutuhan report disediakan oleh data
warehouse.
d) Penggunaan teknik data mining dapat digunakan untuk mengevaluasi pola
anggota Cobrand yang melakukan terminasi sebelum masa berlakunya selesai.
Hasilnya adalah perlunya peningkatan penawaran-penawaran keanggotaan
anggota GFF Cobrand dengan tujuan melakukan strategi cross-selling
terhadap anggota yang mendaftar melalui channel CSS dan Cobrand Citibank
dan perlunya evaluasi terhadap tier management bagi anggota Cobrand setelah
melakukan proses terminasi.
7.2 Saran
Dari proses pelaksanaan perancangan perancangan data warehouse dan
pemanfaatan teknik data mining yang telah dilakukan, terdapat beberapa saran
yang berguna untuk penelitian selanjutnya maupun untuk pengimplementasian
data warehouse dan data mining pada bidang yang sama. Saran-saran tersebut
adalah:
• Dalam pengembangan selanjutnya, cakupan data warehouse bisa diperluas
lagi ke divisi dan department yang lain untuk memperoleh gambaran utuh
perusahaan dengan informasi dari semua departemen.
• Dari hasil data mining bisa dilakukan umpan balik untuk memperbaiki
proses data mining yang ada dan mencoba teknik data mining dan
algoritma lain yang sesuai untuk menemukan pola-pola yang bisa berguna
bagi penelitian selanjutnya.
Uraian diatas, dapat diketahui kesimpulan dan saran dari penelitian yang
telah dilakukan. Kesimpulan pada bab ini merupakan ringkasan mengenai
pelaksanaan dalam perancangan data warehouse dan penerapan data mining
dalam usaha menghadirkan quality of service yang baik. Sedangkan saran-saran
yang telah diuraikan bisa dijadikan acuan untuk melakukan penelitian selanjutnya.
91
Daftar Pustaka
Ariana, Azimah. 2007. Penggunaan Data Warehouse dan Data Mining Untuk
Data Akademik Sebuah Studi Kasus Pada Universitas Nasional. Jurnal Sistem
Informasi MTI UI Vol.3-No 2.
Berry, Michael J. A, 2004, Data Mining Techniques: for marketing sales and
customer relationship management.
Bilotkach, Volodymyr 2005. Frequent Flyer Program Partnerships,
Substitutability, dan Airlines' Profit
Connoly, Thomas and Carolyn Begg, 2005, “Database Systems A Practical
Approach to Design, Implementation, and Management 4th ed”, England: Addison
Wessley
Emch, Adrian 2007 . Frequent Flyer Programs Under Article 82 EC – Is The Sky
the Only Limit?. World Competition, Vol. 4
Handojo, Andreas dan Silvia Rostianingsih, (2004). Pembuatan Data Warehouse
Pengukuran Kinerja Proses Belajar Mengajar Di Jurusan Teknik Informatika
Universitas Kristen Petra. Jurnal Informatika Vol. 5, No. 1: 53 - 58
http://www.cse.unsw.edu.au/~billw/cs9414/notes/ml/06prop/id3/id3.html. Akses
tanggal 27 October 2008. Induction of Decision Trees.
http://www.vibiznews.com/1new/column.php?sub=column&id=499&page=servic
es. Akses tanggal 8 Desember 2008. Mengenal Customer Equity
92
Pritscher, Lisa dan Hans Feyen. (2001). Data Mining And Strategic Marketing In
The Airline Industry. WS Proceeding September.
Lungu, Ion C. dan Bara, Adela . 2005. Executive Information Systems
Development Lifecycle. Economy Informatics Review, No. 1-4, pp. 19-22
Miele, Raffaele dan Mola, Francesco. 2005 .An Open Source Based Data
Warehouse Architecture to Support Decision Making in the Tourism Sector.
FEEM Working Paper No. 142.05
Muntean, Mihaela dan Brandas, Claudiu. 2007 . Business Intelligence Support
Systems dan Infrastructures. Economy Informatics, No. 7, pp. 100-104
Moertini, Veronica S. 2002. Data Mining Sebagai Solusi Bisnis. Integral, vol. 7
no. 1
Ponniah, Paulraj. 2001. Data Warehousing Fundamentals: A Comprehensive
Guide for IT Professionals., John Wiley & Sons, Inc
Utomo, Priyanto Doyo, 2006, Analisis Terhadap Faktor-Faktor Yang
Mempengaruhi Loyalitas Konsumen Pada Operator Telepon Seluler. Thesis:
Universitas Gadjah Mada
Velicanu, Manole dan Matei, Gheorghe. 2007. Building a Data Warehouse Step
by Step. Economic Informatics, Forthcoming
Velicanu, Manole dan Matei, Gheorghe. 2007. Database versus Data Warehouse.
Editura Economicǎ.
Wijaya , Serli . 2005. The Effect Of Loyalty Programs On Customer Loyalty In
The Hospitality Industry . Jurnal Manajemen Perhotelan, Vol. 1, No. 1: 24-31
93
Zain, Syahreza, 2008, Perancangan Data Warehouse dan Penerapan Data Mining
Pada Sistem Monitoring Jaringan GSM Studi Kasus: PT. INDOSAT TBK. Thesis:
Universitas Indonesia
LAMPIRAN-LAMPIRAN
Lampiran 1
Tabel sistem GFF yang datanya terus bertambah dan update dalam hitungan
harian (lihat bab IV PERANCANGAN DATA WAREHOUSE)
Y= digunakan dalam data warehouse
N= tidak digunakan dalam perancangan data warehouse.
Tabel ACTIVITY:
Nama Field Data Type Digunakan DW ENTITY_ID NUMBER(10,0) Y Id DISCR VARCHAR2(32 CHAR) N ENTITY_STATUS VARCHAR2(20 CHAR) Y ENTITY_STATUS CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N INFO VARCHAR2(64 CHAR) N TITLE VARCHAR2(12 CHAR) N LAST_NAME VARCHAR2(32 CHAR) N FIRST_NAME VARCHAR2(32 CHAR) N CARD_NUMBER VARCHAR2(12 CHAR) N START_DATE TIMESTAMP(6) Y START_DATE END_DATE TIMESTAMP(6) Y END_DATE REF_CODE VARCHAR2(32 CHAR) N ENTRY_TYPE VARCHAR2(32 CHAR) N VOUCHER VARCHAR2(32 CHAR) N EARN_ELIGIBLE NUMBER(1,0) N BOOKING_PERSON_ALIAS VARCHAR2(64 CHAR) N SALES_OFFICE VARCHAR2(32 CHAR) Y SALES_OFFICE PAYMENT_CARD_NUMBER VARCHAR2(60 CHAR) N SENT_OUT_ACTIVITY_STATUS VARCHAR2(10 CHAR) N VOLUME FLOAT Y VOLUME PROMOTION_DATE TIMESTAMP(6) N PROMOTION_REF VARCHAR2(64 CHAR) N OPER_FLIGHT_NO VARCHAR2(10 CHAR) Y FLIGHT_NUMBER MRKT_FLIGHT_NO VARCHAR2(10 CHAR) N OPER_BOOK_CLASS VARCHAR2(10 CHAR) Y BOOKING_CLASS MRKT_BOOK_CLASS VARCHAR2(10 CHAR) N FLOWN_BOOK_CLASS VARCHAR2(10 CHAR) N
94
COMPARTMENT VARCHAR2(255 CHAR) N PAYMENT_TYPE VARCHAR2(20 CHAR) N CHECK_IN_TYPE VARCHAR2(20 CHAR) N BOOKING_IN_TYPE VARCHAR2(20 CHAR) N TKT_NO VARCHAR2(20 CHAR) N COUPON_NO VARCHAR2(20 CHAR) N SEAT_NO VARCHAR2(20 CHAR) N BOARDING_NO VARCHAR2(10 CHAR) N CODESHARE_INDICATOR VARCHAR2(20 CHAR) N DELAYED_DAYS NUMBER(10,0) N DELAYED_HOURS NUMBER(10,0) N LOST_BAGGAGE NUMBER(1,0) N FFP_ID NUMBER(10,0) N AIRLINE_ID NUMBER(10,0) N NON_AIR_ACRL_RULE_ID NUMBER(10,0) Y RULE_NAME SENT_OUT_PARTNER_ID NUMBER(10,0) N PARTNER_ID NUMBER(10,0) Y PARTNER_ID LOCATION_ID NUMBER(10,0) Y LOCATION_ID ACTIVITY_TYPE_ID NUMBER(10,0) N MARKETINGAIRLINE_ENTITY_ID NUMBER(10,0) N OD_RULE_ID NUMBER(10,0) Y OD_RULE_ID ORIGIN_AIRPORT_ID NUMBER(10,0) Y ORI_AIRPORT_ID ACCOUNT_ID NUMBER(10,0) Y ACCOUNT_ID BC_RULE_ID NUMBER(10,0) Y BOOKING_CLASS_ID DEST_AIRPORT_ID NUMBER(10,0) Y DEST_AIRPORT_ID EARN_MILES_RULE_ID NUMBER(10,0) N
Tabel Transaction:
Nama Field Data Type Digunakan DW ENTITY_ID NUMBER(10,0) Y TRANSACTION_ID DISCR VARCHAR2(32 CHAR) Y TRANSACTION_TYPE ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N TRX_COMMENT VARCHAR2(255 CHAR) N HAS_SEEN NUMBER(1,0) N TRANS_TYPE VARCHAR2(20 CHAR) N TRANS_DATE DATE Y TRANSACTION_DATE CURR_TWO NUMBER(10,0) Y AWARD_MILEAGE CURR_THREE NUMBER(10,0) Y FREQUENCY CURR_ONE NUMBER(10,0) Y TIER_MILEAGE BILLED NUMBER(1,0) N CURR_FOUR NUMBER(10,0) N CURR_FIVE NUMBER(10,0) N FREE_TEXT_DESCRIPTION VARCHAR2(255 CHAR) N PROMO_CODE VARCHAR2(255 CHAR) N
95
INCENTIVE_ID NUMBER(10,0) N ODRULE_ID NUMBER(10,0) Y ORIGIN_DEST_RULE_ID ACTIVITY_ID NUMBER(10,0) Y ACTIVITY_ID INCENTIVE_FULFILLMENT_ID NUMBER(10,0) N TRANSACTION_ID NUMBER(10,0) N STMT_TEMPLATE_ID NUMBER(10,0) N CERTIFICATE_ID NUMBER(10,0) Y CERTIFICATE_ID AIR_ACTIVITY_ID NUMBER(10,0) Y AIR_TRANSACTION_ID BCRULE_ID NUMBER(10,0) Y BOOKING_CLASS_ID NON_AIR_ACT_ID NUMBER(10,0) Y NON_AIR_TRANSAC_ID NON_AIR_ACCRL_RULE_ID NUMBER(10,0) N ACCOUNT_ID NUMBER(10,0) Y ACCOUNT_ID STATEMENT_ID NUMBER(10,0) N INCFULMENT_ACT_ID NUMBER(10,0) N
96
Tabel Customer
Nama Field Data Type Di Gunakan
DW
ENTITY_ID NUMBER(10,0) Y ID DISC VARCHAR2(31 CHAR) N ENTITY_STATUS VARCHAR2(20 CHAR) Y ENTITY_STATUS CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N ENTITY_NAME VARCHAR2(64 CHAR) N ADDRESS VARCHAR2(255 CHAR) N BOUNCECOUNTER NUMBER(10,0) N EMAILSTATUS VARCHAR2(255 CHAR) N VALIDDATE TIMESTAMP(6) Y ENROLMENT_DATE PASSWORD_HASH VARCHAR2(200 CHAR) N ACCOUNTSTATEMENTMEDIA VARCHAR2(255 CHAR) N RECEIVEEMAILNEWSLETTER NUMBER(1,0) N RECEIVESMSINFO NUMBER(1,0) N ACCOUNTINFODELIVERY VARCHAR2(255 CHAR) N ENROLL_CHANNEL VARCHAR2(255 CHAR) Y CHANNEL ENROLLMENT_STATUS VARCHAR2(32 CHAR) N ACTIVATION_CODE VARCHAR2(64 CHAR) N CALL_CENTER_PIN VARCHAR2(200 CHAR) N NOTE CLOB N SPONSOR_NUM VARCHAR2(30 CHAR) N NAME_ON_CARD VARCHAR2(100 CHAR) N FIRST_NAME VARCHAR2(100 CHAR) N DATE_OF_BIRTH TIMESTAMP(6) Y DATE_OF_BIRTH MIDDLE_NAME VARCHAR2(100 CHAR) N GENDER VARCHAR2(10 CHAR) Y GENDER FORM_ENROLLMENT_CODE VARCHAR2(15 CHAR) N REGISTRATIONFORM VARCHAR2(255 CHAR) N IDENTITY_ENTITY_ID NUMBER(10,0) N ADDR_ID NUMBER(10,0) Y ADDRESS_ID CELLPHONENUMBER_ENTITY_ID NUMBER(10,0) Y CELL_PHONE_ID SALUTATION_ID NUMBER(10,0) N PREFERED_LANG_ID NUMBER(10,0) N ACCOUNT_ID NUMBER(10,0) Y ACCOUNT_ID BRANCH_OFFICE_ID NUMBER(10,0) Y BRANCH_OFFICE_ID
97
Lampiran 2
Tabel-tabel catalog yang jarang direfresh.
Y= digunakan dalam data warehouse
N= tidak digunakan dalam perancangan data warehouse.
Tabel ACCRUAL_RULE;
Nama Field Data Type Digunakan DW and DWTEMP ENTITY_ID NUMBER(10,0) Y ACCRUAL_RULE_ID DISCRTR VARCHAR2(20 CHAR) Y DISCRIMINATOR ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N ENTITY_NAME VARCHAR2(64 CHAR) N START_DATE DATE Y START_DATE END_DATE DATE Y END_DATE TIER_MILEAGE FLOAT Y TIER_MILEAGE AWARD_MILEAGE FLOAT Y AWARD_MILEAGE USE_ACTIVITY_VOLUME NUMBER(1,0) N FREQUENCY NUMBER(10,0) Y FREQUENCY FACTOR FLOAT Y FACTOR MIN_MILES NUMBER(10,0) N BOOKING_CLASS_ID NUMBER(10,0) Y BOOKING_CLASS_ID FFP_ID NUMBER(10,0) Y AIRLINE_ID NUMBER(10,0) N NON_AIR_ACTIVITY_ID NUMBER(10,0) N DEST_AIRPORT_ID NUMBER(10,0) Y ORIG_AIRPORT_ID ORIG_AIRPORT_ID NUMBER(10,0) Y DEST_AIRPORT_ID TIER_ID NUMBER(10,0) Y TIER_ID
Tabel BOOKING_CLASS
Nama Field Data Type Digunakan DW dan DWTEMP ENTITY_ID NUMBER(10,0) Y BOOKING_CLASS_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N EFFECTIVE_DATE TIMESTAMP(6) Y START_DATE DISCONTINUE_DATE TIMESTAMP(6) Y END_DATE BOOKING_CLASS_CODE VARCHAR2(10 CHAR) Y BOOKING_CLASS_CODE COMPARTMENT VARCHAR2(15 CHAR) Y COMPARTMENT EARN_MILES NUMBER(1,0) N AIRLINE_ID NUMBER(10,0) Y AIRLINE_ID
98
Tabel AIRPORT
Nama Field Data Type Digunakan DW dan DWTEMP
ENTITY_ID NUMBER(10,0) Y AIRPORT_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N ENTITY_NAME VARCHAR2(64 CHAR) Y AIRPORT_NAME IATA_CODE VARCHAR2(3 CHAR) Y IATA_CODE CITY_NAME VARCHAR2(255 CHAR) Y CITY_NAME PARENT_AIRPORT_ID NUMBER(10,0) N COUNTRY_ID NUMBER(10,0) Y COUNTRY_ID REGION_ID NUMBER(10,0) N
Tabel TICKET_OFFICE
Nama Field Data Type Digunakan DW dan DWTEMP ENTITY_ID NUMBER(10,0) Y TICKET_OFFICE_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N ENTITY_NAME VARCHAR2(64 CHAR) Y TICKET_OFFICE_NAME TICKET_OFFICE_CODE VARCHAR2(10 CHAR) Y TICKET_OFFICE_CODE BRANCH_OFFICE_ID NUMBER(10,0) Y BRANCH_OFFICE_ID
99
Tabel COUNTRY
Nama Field Data Type Digunakan DW and DWTEMP
ENTITY_ID NUMBER(10,0) Y COUNTRY_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N ENTITY_NAME VARCHAR2(64 CHAR) Y COUNTRY_NAME IATACODE VARCHAR2(255 CHAR) Y IATA_COUNTRY CITYLINE1 VARCHAR2(255 CHAR) N CITYLINE2 VARCHAR2(255 CHAR) N NAMELINE VARCHAR2(255 CHAR) N SALUTATIONLINE NUMBER(1,0) N ADDRESSORDER VARCHAR2(255 CHAR) N REGIONCODEREQUIRED NUMBER(1,0) N POSTALCODELENGTH NUMBER(10,0) N POSTALCODEREQUIRED NUMBER(1,0) N PHONECODE VARCHAR2(255 CHAR) N POSTALCODEEXAMPLE VARCHAR2(255 CHAR) N POSTALCODEPATTERN VARCHAR2(255 CHAR) N TIMEZONE VARCHAR2(255 CHAR) N PREFERREDLANGUAGE_ENTITY_ID NUMBER(10,0) N
Tabel ADDRESS
Nama Field Data Type Digunakan DW and DWTEMP
ENTITY_ID NUMBER(10,0) Y ADDRESS_ID DISC VARCHAR2(31 CHAR) Y ADDDRESS_TYPE ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N VALID NUMBER(1,0) N CITY VARCHAR2(50 CHAR) Y CITY STREET_1 VARCHAR2(128 CHAR) N STREET_2 VARCHAR2(128 CHAR) N STREET_3 VARCHAR2(128 CHAR) N POSTAL_CODE VARCHAR2(255 CHAR) N REGION_CODE VARCHAR2(255 CHAR) N VALID_DATE TIMESTAMP(6) N COMPANY VARCHAR2(64 CHAR) N DEPARTMENT VARCHAR2(64 CHAR) N COUNTRY_ID NUMBER(10,0) Y COUNTRY_ID CUSTOMER_ID NUMBER(10,0) Y CUSTOMER_ID
100
Tabel TIER
Nama Field Data Type Digunakan DW and DWTEMP
ENTITY_ID NUMBER(10,0) Y TIER_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N NAME VARCHAR2(255 CHAR) Y TIER_NAME CODE_NUMBER_CSS NUMBER(10,0) N CODE_NUMBER_PARTNER NUMBER(10,0) N CODE_NUMBER_BO NUMBER(10,0) N TEMPORARYTIER NUMBER(1,0) N SEQUENCE NUMBER(10,0) Y SEQUENCE BONUS_TIER FLOAT N CODE_STRING_BO VARCHAR2(255 CHAR) N CODE_STRING_CSS VARCHAR2(255 CHAR) N CODE_STRING_PARTNER VARCHAR2(255 CHAR) N TERMINATABLE NUMBER(1,0) N ELIGIBLE_TO_SPEND_MILEAGE NUMBER(1,0) N
Tabel MEMBER_TYPE
Nama Field Data Type Digunakan DW and DWTEMP ENTITY_ID NUMBER(10,0) Y MEMBER_TYPE_ID ENTITY_STATUS VARCHAR2(20 CHAR) N CREATED_BY VARCHAR2(32 CHAR) N CREATED_ON TIMESTAMP(6) N UPDATED_BY VARCHAR2(32 CHAR) N UPDATED_ON TIMESTAMP(6) N TYPE VARCHAR2(255 CHAR) Y TYPE CODE_NUMBER NUMBER(10,0) N EXPIRY_DATE TIMESTAMP(6) N PERIODE NUMBER(10,0) N EFFECTIVE_DATE TIMESTAMP(6) N DEFINABLE_NUMBER NUMBER(1,0) N EXPIRES NUMBER(1,0) N UPGRADABLE NUMBER(1,0) N ANNUAL_FEE1 FLOAT Y ANNUAL_FEE1 ANNUAL_FEE2 FLOAT Y ANNUAL_FEE2 DELETE_INACTIVE NUMBER(10,0) N CODE_STRING VARCHAR2(255 CHAR) N TIER_ID NUMBER(10,0) Y TIER_ID MIN_AGE NUMBER N MAX_AGE NUMBER N
102
Lampiran 3
Lihat BAB VI. Implementasi data mining
Gambar 8.1 Pola anggota GFF Cobrand yang melakukan pendaftaran melalui jalur BO.
103
Lampiran 4
Gambar 8.2 Pola anggota GFF Cobrand yang melakukan pendaftaran melalui jalur BO, CSS dan jalur Citibank atau disebut channel Cobrand.
104
Lampiran 5
(lihat bab VI bagian 6.5.2)
ENROLL_CHANNEL = BO | DURATIONFROMREGISTERINMONTH <= 76.415 | | DURATIONFROMREGISTERINMONTH <= 17.615 | | | LIFEDURATIONINMONTH <= 4.235 | | | | LIFEDURATIONINMONTH <= 1.915 | | | | | LIFEDURATIONINMONTH <= 1.700 | | | | | | LIFEDURATIONINMONTH <= 1.465 | | | | | | | LIFEDURATIONINMONTH <= 1.200 | | | | | | | | DURATIONFROMREGISTERINMONTH <= 16.865: Silver {Silver=15, Blue=15, Gold=0, Platinum=0} | | | | | | | | DURATIONFROMREGISTERINMONTH > 16.865: Blue {Silver=0, Blue=2, Gold=0, Platinum=0} | | | | | | | LIFEDURATIONINMONTH > 1.200: Blue {Silver=0, Blue=4, Gold=0, Platinum=0} | | | | | | LIFEDURATIONINMONTH > 1.465: Silver {Silver=2, Blue=0, Gold=0, Platinum=0} | | | | | LIFEDURATIONINMONTH > 1.700: Blue {Silver=0, Blue=2, Gold=0, Platinum=0} | | | | LIFEDURATIONINMONTH > 1.915: Silver {Silver=8, Blue=1, Gold=0, Platinum=0} | | | LIFEDURATIONINMONTH > 4.235: Blue {Silver=1, Blue=9, Gold=0, Platinum=0} | | DURATIONFROMREGISTERINMONTH > 17.615 | | | LIFEDURATIONINMONTH <= 2.400 | | | | DURATIONFROMREGISTERINMONTH <= 19.800 | | | | | GENDER = F | | | | | | LIFEDURATIONINMONTH <= 0.965: Platinum {Silver=0, Blue=0, Gold=0, Platinum=2} | | | | | | LIFEDURATIONINMONTH > 0.965: Silver {Silver=1, Blue=1, Gold=0, Platinum=0} | | | | | GENDER = M: Gold {Silver=0, Blue=0, Gold=3, Platinum=0} | | | | DURATIONFROMREGISTERINMONTH > 19.800 | | | | | DURATIONFROMREGISTERINMONTH <= 28.865 | | | | | | DURATIONFROMREGISTERINMONTH <= 27.220 | | | | | | | DURATIONFROMREGISTERINMONTH <= 20.585: Blue {Silver=0, Blue=4, Gold=0, Platinum=0} | | | | | | | DURATIONFROMREGISTERINMONTH > 20.585 | | | | | | | | DURATIONFROMREGISTERINMONTH <= 23.235: Silver {Silver=8, Blue=0, Gold=0, Platinum=0} | | | | | | | | DURATIONFROMREGISTERINMONTH > 23.235: Blue {Silver=5, Blue=8, Gold=1, Platinum=0} | | | | | | DURATIONFROMREGISTERINMONTH > 27.220: Blue {Silver=0, Blue=6, Gold=1, Platinum=0} | | | | | DURATIONFROMREGISTERINMONTH > 28.865 | | | | | | DURATIONFROMREGISTERINMONTH <= 48.600 | | | | | | | DURATIONFROMREGISTERINMONTH <= 31.600 | | | | | | | | DURATIONFROMREGISTERINMONTH <= 29.615: Silver {Silver=3, Blue=0, Gold=0, Platinum=1} | | | | | | | | DURATIONFROMREGISTERINMONTH > 29.615: Blue {Silver=1, Blue=3, Gold=0, Platinum=1} | | | | | | | DURATIONFROMREGISTERINMONTH > 31.600 | | | | | | | | DURATIONFROMREGISTERINMONTH <= 44.185: Silver {Silver=24, Blue=6, Gold=0, Platinum=0}
105
| | | | | | | | DURATIONFROMREGISTERINMONTH > 44.185: Blue {Silver=2, Blue=4, Gold=0, Platinum=0} | | | | | | DURATIONFROMREGISTERINMONTH > 48.600 | | | | | | | DURATIONFROMREGISTERINMONTH <= 52.400: Gold {Silver=1, Blue=1, Gold=5, Platinum=1} | | | | | | | DURATIONFROMREGISTERINMONTH > 52.400 | | | | | | | | LIFEDURATIONINMONTH <= 0.915: Silver {Silver=14, Blue=2, Gold=1, Platinum=3} | | | | | | | | LIFEDURATIONINMONTH > 0.915: Blue {Silver=8, Blue=9, Gold=0, Platinum=0} | | | LIFEDURATIONINMONTH > 2.400 | | | | DURATIONFROMREGISTERINMONTH <= 58.515 | | | | | GENDER = F | | | | | | DURATIONFROMREGISTERINMONTH <= 47.335: Blue {Silver=2, Blue=13, Gold=0, Platinum=0} | | | | | | DURATIONFROMREGISTERINMONTH > 47.335 | | | | | | | ADDRESS_TYPE = BUSINESS: Blue {Silver=0, Blue=2, Gold=0, Platinum=0} | | | | | | | ADDRESS_TYPE = PRIVATE: Gold {Silver=0, Blue=0, Gold=2, Platinum=0} | | | | | GENDER = M | | | | | | DURATIONFROMREGISTERINMONTH <= 41.170 | | | | | | | DURATIONFROMREGISTERINMONTH <= 39.400: Blue {Silver=12, Blue=18, Gold=7, Platinum=1} | | | | | | | DURATIONFROMREGISTERINMONTH > 39.400: Gold {Silver=0, Blue=0, Gold=2, Platinum=1} | | | | | | DURATIONFROMREGISTERINMONTH > 41.170 | | | | | | | LIFEDURATIONINMONTH <= 9.950 | | | | | | | | DURATIONFROMREGISTERINMONTH <= 43.100: Blue {Silver=0, Blue=2, Gold=0, Platinum=0} | | | | | | | | DURATIONFROMREGISTERINMONTH > 43.100: Silver {Silver=6, Blue=4, Gold=0, Platinum=0} | | | | | | | LIFEDURATIONINMONTH > 9.950: Blue {Silver=1, Blue=8, Gold=0, Platinum=0} | | | | DURATIONFROMREGISTERINMONTH > 58.515 | | | | | DURATIONFROMREGISTERINMONTH <= 67.085: Silver {Silver=6, Blue=1, Gold=0, Platinum=0} | | | | | DURATIONFROMREGISTERINMONTH > 67.085: Blue {Silver=1, Blue=3, Gold=2, Platinum=0} | DURATIONFROMREGISTERINMONTH > 76.415 | | LIFEDURATIONINMONTH <= 0.820 | | | LIFEDURATIONINMONTH <= 0.085 | | | | ADDRESS_TYPE = PRIVATE: Platinum {Silver=1, Blue=0, Gold=0, Platinum=1} | | | | ADDRESS_TYPE = BUSINESS: Gold {Silver=0, Blue=0, Gold=3, Platinum=0} | | | LIFEDURATIONINMONTH > 0.085 | | | | DURATIONFROMREGISTERINMONTH <= 82.050 | | | | | DURATIONFROMREGISTERINMONTH <= 79.770: Silver {Silver=3, Blue=0, Gold=0, Platinum=0} | | | | | DURATIONFROMREGISTERINMONTH > 79.770: Platinum {Silver=0, Blue=0, Gold=0, Platinum=2} | | | | DURATIONFROMREGISTERINMONTH > 82.050: Silver {Silver=6, Blue=0, Gold=0, Platinum=0} | | LIFEDURATIONINMONTH > 0.820 | | | DURATIONFROMREGISTERINMONTH <= 84.700 | | | | LIFEDURATIONINMONTH <= 3.135: Silver {Silver=6, Blue=1, Gold=0, Platinum=0} | | | | LIFEDURATIONINMONTH > 3.135: Blue {Silver=1,
106
Blue=2, Gold=1, Platinum=0} | | | DURATIONFROMREGISTERINMONTH > 84.700 | | | | LIFEDURATIONINMONTH <= 1.800: Gold {Silver=0, Blue=0, Gold=5, Platinum=0} | | | | LIFEDURATIONINMONTH > 1.800 | | | | | ADDRESS_TYPE = PRIVATE: Gold {Silver=2, Blue=0, Gold=4, Platinum=1} | | | | | ADDRESS_TYPE = BUSINESS | | | | | | DURATIONFROMREGISTERINMONTH <= 86.715: Blue {Silver=0, Blue=2, Gold=1, Platinum=0} | | | | | | DURATIONFROMREGISTERINMONTH > 86.715: Silver {Silver=2, Blue=1, Gold=0, Platinum=0} ENROLL_CHANNEL = CSS | DURATIONFROMREGISTERINMONTH <= 14.965 | | DURATIONFROMREGISTERINMONTH <= 11.120 | | | LIFEDURATIONINMONTH <= 0.650: Silver {Silver=2, Blue=1, Gold=0, Platinum=0} | | | LIFEDURATIONINMONTH > 0.650: Blue {Silver=0, Blue=3, Gold=0, Platinum=0} | | DURATIONFROMREGISTERINMONTH > 11.120: Silver {Silver=3, Blue=0, Gold=0, Platinum=0} | DURATIONFROMREGISTERINMONTH > 14.965: Blue {Silver=0, Blue=4, Gold=1, Platinum=1} ENROLL_CHANNEL = COBRAND | DURATIONFROMREGISTERINMONTH <= 12.130: Blue {Silver=15, Blue=583, Gold=1, Platinum=13} | DURATIONFROMREGISTERINMONTH > 12.130 | | LIFEDURATIONINMONTH <= 12.515: Silver {Silver=3, Blue=3, Gold=1, Platinum=0} | | LIFEDURATIONINMONTH > 12.515: Blue {Silver=0, Blue=25, Gold=1, Platinum=0}
107
Lampiran 6
Discretization (lihat bab VI bagian 6.4.1)
DURATIONFROMREGISTERINMONTH -Infinity <= range1 [-∞ - 0.850] <= 0.85 <= range2 [0.850 - 2.415] <= 2.415 <= range3 [2.415 - 8.465] <= 8.465 <= range4 [8.465 - 29.565] <= 29.564999999999998 <= range5 [29.565 - ∞] <= Infinity LIFEDURATIONINMONTH -Infinity <= range1 [-∞ - 0.450] <= 0.44999999999999996 <= range2 [0.450 - 1.150] <= 1.15 <= range3 [1.150 - 2.315] <= 2.315 <= range4 [2.315 - 5.315] <= 5.3149999999999995 <= range5 [5.315 - ∞] <= Infinity
108
Lampiran 7
Sebagian hasil dari data mining dengan teknik association rule (lihat bab VI
bagian 6.5.1)
No Rule Premises Conclusion Support Confidence
147
GENDER = M, ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range1 [-∞ - 0.450]
DURATIONFROMREGISTER INMONTH = range1 [-∞ - 0.850] 0.112348 0.982301
150
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range1 [-∞ - 0.450]
DURATIONFROMREGISTER INMONTH = range1 [-∞ - 0.850] 0.13664 0.985401
153
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range3 [1.150 - 2.315]
DURATIONFROM REGISTER INMONTH = range2 [0.850 - 2.415] 0.121457 0.991736
127
ENROLL_CHANNEL = COBRAND, LIFEDURATIONINMONTH = range4 [2.315 - 5.315]
DURATIONFROMREGISTER INMONTH = range3 [2.415 - 8.465] 0.126518 0.925926
No Rule Premises Conclusion Support Confidence
20
ENROLL_CHANNEL = COBRAND, DURATIONFROMREGISTERINMONTH = range3 [2.415 – 8.465]
LIFEDURATIONINMONTH = Range4 [2.315 - 5.315] 0.126518 0.718391
109
Lampiran 8
TANGGAL : 13 November 2008
TEMPAT :
NARASUMBER : Manager Member Service & Production GFF dan 2. IT
Specialist GFF .
Q : Bagaimanakah bisnis proses GFF?
A : Secara umum, GFF berfungsi sebagai custimer loyalty program, berusaha
mendapatkan anggota sebanyak-banyaknya dan berusaha agar anggota dapat
menggunakan jasa Garuda dan partner sehingga anggota dapat mengumpulkan
poin atau mileage dan menggunakan mileage mereka.
Q : Apakah GFF mendapatkan keuntungan langsung atau revenue yang bisa
dikalkulasi?
A : Ada beberapa revenue yang bisa didapatkan dengan berjalannya GFF. Dari
keanggotaan iuran tahunan Gold ECPlus dan Platinum Cobrand. Kedua jenis
keanggotaan tersebut secara langsung dapat memberikan keutungan baik bagi
GFF ataupun Garuda. Selain itu, GFF melakukan penaikan kepada partner atas
setiap mileage yang diberikan Garuda terhadap anggota karena aktivitas angggota
GFF di partner.
Q : Bagaimana mengukur keberhasilan program GFF?
A : Bisa dilihat dari seberapa banak jumlah anggota yang melakukan aktivasi,
jumlah mileage untuk transaksi earning atau pembelian tiket , transaksi redeem
dan peningkatan jumlah partner .
Q : Bagaimana penghitungan mileage dan siapa yang menentukan?
A : Bagian keuangan menentukan konversi mileage ke dalam rupiah. Nilai tukar
itu yang dijasikan dasar penagihan transakasi ke partner sesaui dengan nilai saat
penandatangan kerja sama. Nilai tukar mileage saat ini adalah Rp.110,-