Upload
a-a-mahendra-putra
View
261
Download
0
Embed Size (px)
DESCRIPTION
ghjhgjh
Citation preview
Conformed Dimension
Jika menggunakan referensi dari kimball, maka terdapat istilah conformed
dimension. Conformed dimension adalah dimensi memiliki arti hal yang sama
dengan setiap tabel fakta yang mungkin yang dapat bergabung.
Pembentukan conformed dimension adalah langkah yang sangat signifikan.
Jadi conformed dimension berarti dimensi indentik yang sama di setiap
data mart. Contoh conformed dimension yaitu: kostumer, produk, lokasi,
promosi dan waktu (Kimball et al, 1998).
Pemodelan dimensi (DM) adalah nama dari seperangkat teknik dan konsep yang
digunakan dalam data warehouse design. Hal ini dianggap berbeda dari entity-relationship
modeling (ER).Modeling dimensi tidak selalu melibatkan database relasional. Pendekatan
pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti
database multidimensi atau file bahkan datar. Menurut konsultan data warehousing Ralph
Kimball , [1] DM adalah teknik desain untuk database dimaksudkan untuk mendukung
permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan
kinerja. Menurut dia, meskipun ER berorientasi transaksi sangat berguna untuk menangkap
transaksi , harus dihindari untuk pengiriman end-user.
Pemodelan dimensi selalu menggunakan konsep fakta (ukuran), dan dimensi
(konteks). Fakta biasanya (tetapi tidak selalu) nilai numerik yang dapat dikumpulkan, dan
dimensi adalah kelompok hirarki dan deskriptor yang menentukan fakta-fakta. Sebagai
contoh, jumlah penjualan adalah fakta, timestamp, produk, daftar #, toko #, dll adalah
elemen dimensi. Model dimensi yang dibangun oleh area proses bisnis, misalnya toko
penjualan, persediaan, klaim, dll Karena area proses bisnis yang berbeda berbagi beberapa
tapi tidak semua dimensi, efisiensi dalam desain, operasi, dan konsistensi, ini dicapai
dengan menggunakan dimensi serupa , yaitu menggunakan salah satu salinan dimensi
dibagi di seluruh bidang studi. Istilah "sesuai dimensi" berasal oleh Ralph Kimball .
Proses pemodelan dimensi [ sunting ]
Model dimensi dibangun pada skema bintang seperti ., dengan dimensi sekitar tabel
fakta [2] [3] Untuk membangun skema, model desain berikut digunakan:
1. Pilih proses bisnis
2. Menyatakan gandum
3. Mengidentifikasi dimensi
4. Mengidentifikasi fakta
Pilih proses bisnis
Proses pemodelan dimensi didasarkan pada metode desain 4-langkah yang membantu
untuk memastikan kegunaan dari model dimensi dan penggunaan data warehouse . Dasar-
dasar dalam desain membangun proses bisnis yang sebenarnya dimana data
warehouse harus mencakup. Oleh karena itu langkah pertama dalam model adalah untuk
menggambarkan proses bisnis yang model dibangun di atas. Ini bisa misalnya menjadi
situasi penjualan di toko ritel. Untuk menggambarkan proses bisnis, seseorang dapat
8
9
memilih untuk melakukan hal ini dalam teks biasa atau menggunakan dasar Business
Process Modeling Notation ( BPMN ) atau panduan desain lainnya seperti Unified Modeling
Language ( UML ).
Menyatakan gandum
Setelah menjelaskan Proses Bisnis, langkah berikutnya dalam desain adalah untuk
menyatakan butir model. Gandum dari model adalah deskripsi yang tepat dari apa yang
model dimensi harus berfokus pada. Ini bisa misalnya menjadi "Item baris individu pada slip
pelanggan dari toko ritel". Untuk memperjelas apa artinya gandum, Anda harus memilih
proses pusat dan menggambarkannya dengan satu kalimat. Selain itu biji-bijian (kalimat)
adalah apa yang Anda akan membangun dimensi dan tabel fakta dari. Anda mungkin
merasa perlu untuk kembali ke langkah ini untuk mengubah gandum karena informasi baru
yang diperoleh pada apa model Anda seharusnya dapat memberikan.
Mengidentifikasi dimensi
Langkah ketiga dalam proses desain adalah untuk menentukan dimensi model. Dimensi
harus didefinisikan dalam gandum dari langkah kedua dari proses 4-langkah. Dimensi
adalah dasar dari tabel fakta, dan mana data untuk tabel fakta dikumpulkan. Biasanya
dimensi benda seperti tanggal, toko, persediaan dll Dimensi ini adalah di mana semua data
disimpan. Misalnya, dimensi tanggal bisa berisi data seperti tahun, bulan dan hari kerja.
Mengidentifikasi fakta-fakta
Setelah mendefinisikan dimensi, langkah berikutnya dalam proses ini adalah untuk membuat
kunci untuk tabel fakta. Langkah ini adalah untuk mengidentifikasi fakta-fakta numerik yang
akan mengisi setiap baris tabel fakta. Langkah ini erat terkait dengan pengguna bisnis dari
sistem, karena ini adalah di mana mereka mendapatkan akses ke data yang tersimpan
dalam data warehouse . Oleh karena itu sebagian dari baris tabel fakta adalah numerik,
tokoh aditif seperti kuantitas atau biaya per unit, dll
Dimensi Normalisasi [ sunting ]
Normalisasi dimensi atau snowflaking menghilangkan atribut berlebihan, yang dikenal dalam
meratakan de-dinormalisasi dimensi normal. Dimensi secara ketat bergabung bersama
dalam sub dimensi.
Snowflaking memiliki pengaruh pada struktur data yang berbeda dari banyak filosofi dari
gudang data. [3] Data Tunggal tabel (fakta) yang dikelilingi oleh beberapa deskriptif (dimensi)
tabel
Pengembang sering tidak menormalkan dimensi karena beberapa alasan: [4]
1. Normalisasi membuat struktur data yang lebih kompleks
2. Kinerja dapat lebih lambat, karena banyak bergabung antara tabel
3. Penghematan space minimal
4. Indeks bitmap tidak dapat digunakan
5. Kinerja Query, database 3NF menderita masalah kinerja ketika menggabungkan
atau mengambil banyak nilai dimensi yang mungkin memerlukan analisis. Jika Anda
hanya akan melakukan laporan operasional maka Anda mungkin dapat bertahan
10
dengan 3NF karena pengguna operasional Anda akan mencari data yang sangat
halus butir.
Ada beberapa argumen tentang mengapa normalisasi dapat berguna. [3] Hal ini dapat
menjadi keuntungan ketika bagian dari hirarki umum untuk lebih dari satu dimensi. Misalnya,
dimensi geografis mungkin digunakan kembali karena kedua pelanggan dan pemasok
dimensi menggunakannya.
Manfaat pemodelan dimensi [ sunting ]
Manfaat dari pemodelan dimensi adalah sebagai berikut: [5]
Dimengerti - Dibandingkan dengan model normalisasi, model dimensi lebih mudah
untuk memahami dan lebih intuitif. Dalam model dimensi, informasi dikelompokkan ke
dalam kategori bisnis yang koheren atau dimensi, sehingga lebih mudah untuk
membaca dan menafsirkan. Kesederhanaan juga memungkinkan perangkat lunak untuk
menavigasi database efisien. Dalam model normalisasi, data dibagi menjadi banyak
entitas diskrit dan bahkan proses bisnis sederhana mungkin mengakibatkan puluhan
tabel bergabung bersama-sama dalam cara yang kompleks.
Kinerja Query - model Dimensi lebih denormalized dan dioptimalkan untuk data
query, sementara model dinormalisasi berusaha untuk menghilangkan redudansi data
dan dioptimalkan untuk memuat transaksi dan memperbarui. Kerangka diprediksi dari
model dimensi memungkinkan database untuk membuat asumsi yang kuat tentang data
yang membantu dalam kinerja. Setiap dimensi merupakan entry point yang setara ke
dalam tabel fakta, dan struktur simetris ini memungkinkan penanganan yang efektif dari
query yang kompleks. Optimasi query untuk bergabung star database sederhana, dapat
diprediksi, dan terkendali.
Perluasan - Model Dimensi yang extensible dan mudah menampung data baru yang
tak terduga. Tabel yang ada dapat diubah di tempat baik dengan hanya menambahkan
baris data baru ke dalam tabel atau mengeksekusi SQL mengubah perintah meja. Tidak
ada pertanyaan atau aplikasi lain yang duduk di atas Gudang perlu memprogram untuk
mengakomodasi perubahan.Query Lama dan aplikasi terus berjalan tanpa
menghasilkan hasil yang berbeda. Namun dalam model dinormalisasi setiap modifikasi
harus dipertimbangkan dengan hati-hati, karena ketergantungan yang kompleks antara
tabel database.
Pemodelan dimensi (DM) adalah nama dari teknik desain logis sering digunakan untuk gudang data.Hal ini berbeda dari, dan kontras dengan,
entitas-hubungan pemodelan (ER). Artikel ini menunjukkan banyak perbedaan antara kedua teknik dan menarik garis di pasir. DM adalah satu-
satunya teknik yang layak untuk database yang dirancang untuk mendukung permintaan pengguna akhir di gudang data. ER sangat berguna untuk
menangkap transaksi dan fase administrasi data membangun data warehouse, tetapi harus dihindari untuk pengiriman end-user.
DM adalah teknik desain logis yang berusaha untuk menyajikan data dalam kerangka intuitif standar yang memungkinkan untuk akses kinerja tinggi. Hal
11
ini inheren dimensi, dan menganut disiplin yang menggunakan model relasional dengan beberapa pembatasan penting. Setiap model dimensi
terdiri dari satu meja dengan kunci multi, disebut tabel fakta, dan satu set meja kecil yang disebut tabel dimensi. Setiap tabel dimensi memiliki satu bagian primary key yang sesuai persis dengan salah satu komponen kunci
multipart dalam tabel fakta. (Lihat Gambar 2.) Karakteristik struktur "Bintang-seperti" ini sering disebut bintang bergabung. Bintang Istilah
bergabung tanggal kembali ke hari-hari awal database relasional.
Sebuah tabel fakta, karena memiliki primary key multi bagian yang terdiri dari dua atau lebih kunci asing, selalu mengungkapkan banyak-ke-banyak hubungan. Tabel fakta yang paling berguna juga mengandung satu atau lebih tindakan numerik, atau "fakta," yang terjadi untuk kombinasi tombol yang mendefinisikan setiap record. Dalam Gambar 2, fakta-fakta Dolar Terjual, Unit Terjual, dan Dolar Biaya. Fakta yang paling berguna dalam tabel fakta adalah numerik dan aditif. Aditivitas sangat penting karena aplikasi data warehouse hampir tidak pernah mengambil fakta catatan tabel tunggal, melainkan, mereka mengambil ratusan, ribuan, atau bahkan jutaan catatan ini pada satu waktu, dan satu-satunya hal yang berguna untuk dilakukan dengan begitu banyak catatan adalah untuk menambahkan mereka up.
Tabel dimensi, sebaliknya, yang paling sering mengandung informasi deskriptif tekstual. Atribut dimensi digunakan sebagai sumber sebagian besar kendala yang menarik dalam query data warehouse, dan mereka hampir selalu sumber header baris dalam SQL jawaban set. Dalam Gambar 2, kita membatasi pada produk Lemon rasa melalui atribut Flavor dalam tabel Produk, dan promosi melalui Radio atribut adtype dalam tabel Promosi. Ini harus jelas bahwa kekuatan database pada Gambar 2 sebanding dengan kualitas dan kedalaman tabel dimensi.
Pesona desain database pada Gambar 2 adalah bahwa hal itu sangat dikenali oleh pengguna akhir dalam bisnis tertentu. Saya telah mengamati ratusan kasus di mana pengguna akhir segera setuju bahwa ini adalah "bisnis mereka."
Pembaca yang mengikuti pendekatan Kimball sering dapat melafalkan 4 keputusan penting ketika merancang sebuah model dimensi: mengidentifikasi proses bisnis, biji-bijian, dimensi dan fakta.Sementara ini terdengar sederhana, tim sering tersandung pada langkah pertama. Mereka berjuang untuk mengartikulasikan proses bisnis seperti itu adalah istilah yang tampaknya mengambil makna yang berbeda tergantung pada konteksnya. Karena deklarasi proses bisnis adalah pasak pertama di tanah ketika merancang sebuah model dimensi, kita ingin menghilangkan kebingungan dalam konteks kita.
Pertama, mari kita mulai dengan membahas apa proses bisnis tidak. Ketika merancang sebuah model dimensi, proses bisnis tidak mengacu pada departemen bisnis, organisasi atau fungsi.Demikian juga, tidak harus mengacu pada satu laporan atau analisis spesifik.
Untuk pembuat model dimensi, proses bisnis adalah suatu peristiwa atau kegiatan yang menghasilkan atau mengumpulkan metrik. Metrik ini pengukuran kinerja bagi organisasi. Analis bisnis pasti ingin meneliti dan mengevaluasi metrik ini dengan kombinasi tampaknya tak terbatas dari filter dan kendala. Sebagai pemodel dimensi, itu tugas kita untuk menyajikan
12
metrik ini dalam struktur yang mudah untuk memahami bahwa merespon dengan cepat untuk pertanyaan tak terduga.
Ketika mengidentifikasi proses bisnis untuk pemodelan dimensi, karakteristik dan pola umum yang sering muncul.
1. Proses bisnis biasanya didukung oleh sistem operasional. Sebagai contoh, proses bisnis penagihan didukung oleh sistem penagihan, juga untuk pembelian, pemesanan, atau menerima proses bisnis.
2. Proses bisnis menghasilkan atau mengumpulkan pengukuran unik dengan granularity yang unik dan dimensi yang digunakan untuk mengukur kinerja organisasi. Kadang-kadang metrik adalah akibat langsung dari proses bisnis. Lain kali, pengukuran adalah derivasi. Apapun, proses bisnis memberikan metrik kinerja yang digunakan oleh berbagai proses analitik.Sebagai contoh, proses bisnis penjualan pemesanan mendukung banyak laporan dan analisis, seperti analisis pelanggan, kinerja penjualan rep, dan sebagainya.
3. Proses bisnis sering dinyatakan sebagai kata kerja dengan dimensi diasosiasikan sebagai nomina menjelaskan siapa, apa, di mana, kapan, mengapa dan bagaimana berhubungan dengan proses. Sebagai contoh, hasil proses bisnis penagihan akan diiris-dan-potong dadu dan dianalisis berdasarkan tanggal, pelanggan, layanan / produk, dan sebagainya.
4. Proses bisnis biasanya dipicu oleh input dan hasil output yang perlu dipantau. Misalnya, proposal yang diterima adalah masukan untuk proses pemesanan yang menghasilkan order penjualan dan metrik terkait. Dalam skenario ini, proses bisnis penjualan pemesanan, Anda akan memiliki tabel fakta pesanan dengan pesanan penjualan sebagai dimensi merosot potensial dan jumlah pesanan dan dianggap sebagai fakta. Cobalah untuk membayangkan aliran umum dari input ke dalam proses bisnis, sehingga metrik output. Di kebanyakan organisasi, ada serangkaian proses bisnis di mana output dari satu proses menjadi input ke yang berikutnya. Dalam bahasa pembuat model dimensi, proses bisnis ini akan menghasilkan serangkaian tabel fakta.
5. Analis kadang-kadang ingin mengebor di seluruh proses bisnis, melihat hasil dari satu proses di samping hasil dari yang lain. Pengeboran seluruh proses ini tentu layak jika dimensi umum untuk kedua proses yang sesuai.
BAB 2
LANDASAN TEORI
2.1 Teori-Teori Umum
2.1.1 Pengertian Data
13
Menurut Turban dan Rainer (2009:6), data adalah fakta
mentah atau deskripsi dasar dari benda, peristiwa, aktivitas, dan
transaksi yang didapatkan, direkam, disimpan, diklasifikasi tetapi belum
terorganisir untuk menyampaikan suatu arti spesifik.
Menurut Williams dan Sawyer (2011:25), data data terdiri dari
fakta-fakta, dan gambaran mentah yang akan diproses menjadi
informasi. Data penting karena pengguna memerlukan data untuk
membuat informasi yang berguna.
Menurut Indrajani (2011:48), data adalah fakta mentah tentang
orang, tempat, kejadian, dan apapun yang penting bagi perusahaan, di
mana data itu sendiri tidak memiliki arti dan data juga adalah fakta-
fakta atau observasi yang mentah, biasanya mengenai kejadian atau
transaksi bisnis.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian data adalah fakta atau observasi
mentah yang biasanya menggambarkan benda, peristiwa, aktivitas, dan
transaksi yang akan diproses menjadi informasi.
2.1.2 Pengertian Informasi
Menurut Turban dan Rainer (2009:6), informasi adalah suatu
koleksi fakta (data) yang telah terorganisir dengan beberapa cara
sehingga memberikan suatu arti yang dipahami oleh penerima.
14
Menurut Laudon dan Laudon (2010:14), informasi adalah data
yang telah disusun ke dalam bentuk yang memiliki arti dan berguna
bagi manusia.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian informasi adalah data yang telah
terorganisir atau disusun dalam beberapa cara sehingga memberikan
suatu arti yang mudah dipahami dan berguna bagi manusia.
2.1.3 Pengertian Sistem
Menurut O’Brien dan Marakas (2011:26), sistem didefinisikan
sebagai sekumpulan komponen yang saling terkait, dengan batas yang
jelas, bekerja sama untuk mencapai suatu serangkaian tujuan umum
dengan menerima input dan menghasilkan output dalam proses
transformasi yang terorganisir.
Menurut William dan Sawyer (2011:492), sistem adalah
kumpulan dari komponen-komponen yang berhubungan dan yang
saling berinteraksi untuk melakukan suatu tugas untuk mencapai tujuan.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian sistem adalah sekumpulan
komponen yang saling terkait dan saling berinteraksi dengan batas yang
jelas untuk melakukan suatu tugas guna mencapai suatu tujuan.
2.1.4 Pengertian Sistem Informasi
Menurut O’Brien dan Marakas (2011:4), Sistem Informasi (IS)
adalah kombinasi yang terorganisir dari orang, perangkat keras,
perangkat lunak, jaringan komunikasi, sumber daya data, dan kebijakan
15
dan prosedur yang menyimpan, mengambil, mengubah, dan
mendiseminasi informasi dalam sebuah organisasi. Orang-orang
bergantung pada sistem informasi modern untuk berkomunikasi dengan
satu sama lain menggunakan berbagai perangkat keras (hardware),
petunjuk prosedur pengolahan informasi (Perangkat lunak), jaringan
komunikasi, dan data yang disimpan (data sumber daya).
Menurut O’Brien dan Marakas (2011:6), ada tiga peran utama
dari aplikasi bisnis yang sistem informasi dapat lakukan dari sebuah
business enterprise, yaitu:
1. Mendukung proses bisnis dan operasi (support of business processes
and operations).
2. Mendukung pengambilan keputusan oleh karyawan dan manager
(support of decision making by employees and managers).
3. Mendukung strategi untuk keunggulan kompetitif (support of
strategies for competitive advantage).
Gambar 2.1 Tiga Peran Utama dari Aplikasi Bisnis Sistem
Informasi
16
(Sumber: O’Brien dan Marakas, 2011, p6)
2.1.5 Pengertian Database
Menurut Indrajani (2011:48), Database adalah sebuah
kumpulan data yang saling berhubungan secara logis, dan merupakan
sebuah penjelasan dari data tersebut, yang didesain untuk menemukan
data yang dibutuhkan oleh sebuah organisasi.
Menurut Connolly dan Begg (2010:65), Database adalah
kumpulan data secara logis terkait, dan deskripsi dari data ini, didesain
untuk memenuhi kebutuhan informasi sebuah organisasi. Database
adalah tunggal, tempat penyimpanan data yang besar yang dapat
digunakan secara bersama-sama oleh banyak departemen dan pengguna.
Menurut Cahyono (2009:83), dalam jurnalnya mengatakan
bahwa database adalah salah satu komponen sistem informasi yang
mempunyai posisi yang sangat menentukan dalam menunjang
keberhasilan suatu sistem informasi.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian database adalah kumpulan data
secara logis atau salah satu komponen yang saling berhubungan dan
deskripsi dari data ini didesain untuk memenuhi kebutuhan informasi
dan menunjang keberhasilan suatu sistem informasi dalam sebuah
organisasi.
2.1.6 DBMS (Database Management System)
17
Menurut Sreevani dan Rao (2010:56), dalam jurnalnya
mengatakan bahwa Database Management System (DBMS) tidak dapat
memberikan informasi yang diperlukan ketika datanya tidak konsisten.
2.1.6.1 Pengertian DBMS (Database Management System)
Menurut Connolly dan Begg (2010:66), Database
Management System adalah sebuah sistem software yang
memungkinkan pengguna untuk mendefinisikan, membuat,
memlihara, dan mengontrol akses ke database.
2.1.6.2 Keuntungan DBMS (Database Management System)
Keuntungan DBMS yang diuraikan Connolly dan
Begg (2010:77), adalah sebagai berikut:
1. Mengontrol pengulangan data.
2. Data yang konsisten.
3. Dapat memperoleh informasi yang lebih banyak dan
jumlah data yang sama.
4. Pemakaian data secara bersama-sama.
5. Meningkatkan integritas data.
6. Meningkatkan keamanan.
7. Penetapan standarisasi.
8. Perbandingan skala ekonomi.
9. Menyeimbangi konflik kebutuhan.
10. Meningkatkan akses dan respon dari data.
11. Meningkatkan produktifitas.
12. Meningkatkan pemeliharaan data melalui data independen.
13. Meningkatkan konkurensi.
18
14. Meningkatkan layanan backup dan recovery.
2.1.6.3 Kekurangan DBMS (Database Management System)
Kekurangan dari DBMS menurut Connolly dan Begg
(2010:80), adalah sebagai berikut:
1. Kompleksitas.
2. Ukuran yang besar karena kompleksitas yang terjadi.
3. Biaya DBMS yang beragam tergantung pada lingkungan
dan fungsi yang disediakan.
4. Tambahan biaya untuk hardware.
5. Biaya konversi yang dibutuhkan untuk penggunaan DBMS
yang baru.
6. Peforma kinerja menurun.
7. Tingkat kegagalan yang lebih besar.
2.1.6.4 Fasilitas DBMS (Database Management System)
Menurut Connolly dan Begg (2010:66), fasilitas-
fasilitas yang disediakan oleh DBMS adalah, sebagai berikut:
1. DDL (Data Definition Language) adalah suatu bahasa
yang memperbolehkan DBA (Database Administrator)
ataupun user untuk menentukan tipe, struktur, dan batasan
keamanan data yang akan disimpan pada database.
2. DML (Data Manipulation Language) adalah suatu bahasa
yang memiliki fasilitas untuk mengoperasikan data yang
ada dalam database. Misalnya insert, edit, delete, dan
update.
19
3. SQL (Structured Query Language) adalah suatu bahasa
yang memberikan layanan akses terhadap data. Contoh
dari layanan akses yang diberikan adalah :
Sistem keamanan, yang mecegah pengguna yang tidak
memiliki hak untuk mengakses database.
Sistem integritas, yang mempertahankan konsistensi
data yang tersimpan.
Sistem kontrol konkurensi, yang memungkinkan untuk
mengakses database secara bersama-sama.
2.1.7 Pengertian Activity Diagram
Menurut Satzinger et al (2010:141), Activity diagram
merupakan sebuah tipe dari diagram workflow yang menggambarkan
tentang aktivitas dari pengguna ketika melakukan setiap kegiatan dan
aliran sekuensial.
20
Gambar 2.2 Activity Diagram
(Sumber: Satzinger et al, 2010, p143)
2.1.8 Pengertian ERD (Entity Relationship Diagram)
Menurut Inmon (2005:496), Entity Relationship Diagram
(ERD) adalah diagram yang menunjukkan semua entitas dalam cakupan
integrasi dan hubungan langsung antar entitas tersebut.
2.1.9 Pengertian Data Mart
Menurut Scheps (2008:208) Data Mart dapat menerima data
dari data warehouse, atau secara langsung dari sistem transaksional.
Data mart dapat menampilkan transformasi dan kalkulasi pada data
yang sama dengan data warehouse. Tapi data mart selalu terbatas pada
ruang lingkupnya dan tujuan bisnis.
Menurut Turban, Sharda, Delen dan King (2011:53), data
mart adalah subset dari data warehouse dan berfokus pada topik
tertentu atau departemen, yang biasanya terdiri dari suatu subyek
(misalnya pemasaran, operasi). Terdapat dua jenis data mart, antara
lain:
Dependent Data Mart, adalah sebuah subset yang dibuat secara
langsung dari data warehouse. Memiliki keuntungan dari
21
penggunaan data model yang konsisten dan menyediakan kualitas
data.
Independent Data Mart, adalah data mart yang mendukung konsep
dari single enterprise-wide data model, tetapi data warehouse harus
dibuat terlebih dahulu.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian data mart adalah subset dari data
warehouse atau data secara langsung dari sistem transaksional yang
berfokus pada topik tertentu atau departemen yang biasanya terdiri dari
suatu subyek (misalnya pemasaran).
2.1.10 Data Warehouse
2.1.10.1 Pengertian Data Warehouse
Menurut Turban, Sharda, Delen, dan King (2011:52),
data warehouse adalah kumpulan data yang dihasilkan untuk
mendukung pengambilan keputusan. Data warehouse juga
merupakan tempat penyimpanan data saat ini dan data historis
dari kepentingan manager diseluruh organisasi.
Menurut Laudon dan Laudon (2010:233), data
warehouse adalah database yang menyimpan data penting saat
ini dan historis dari kebutuhan informasi untuk manager
dalam perusahaan.
Berdasarkan pengertian yang dijabarkan oleh para
ahli diatas dapat disimpulkan bahwa pengertian data
warehouse adalah kumpulan data atau database yang
digunakan sebagai tempat penyimpanan data saat ini dan data
22
historis dari kebutuhan informasi untuk manager diseluruh
organisasi untuk mendukung pengambilan keputusan.
2.1.10.2 Karakteristik Data Warehouse
Karakteristik data warehouse terdiri dari subject
oriented, integrated, time variant, dan non volatile.
Karakteristik Data Warehouse menurut Turban, Sharda,
Delen, dan King (2011:52), antara lain:
1. Subject Oriented
Data tersusun berdasarkan subyek yang detil, seperti sales,
product, atau customers, hanya mengandung informasi
yang relevan untuk mengambil keputusan. Subject
Oriented tidak hanya dapat membantu user untuk
menentukan bagaimana proses bisinis mereka berjalan
tetapi juga membantu dalam menentukan mengapa proses
bisnis mereka berjalan.
2. Integrated
Integrasi berhubungan erat dengan subject orientation.
Data warehouse harus menempatkan data dari sumber
yang berbeda ke dalam format yang konsisten untuk
melakukannya, mereka harus menghadapi konflik
penamaan dan perbedaan di antara satuan ukuran.
3. Time Variant
23
Data warehouse menyimpan data historical. Data yang
tidak selalu memberikan status. Mereka mendeteksi tren,
penyimpangan dan hubungan jangka panjang untuk
melakukan peramalan dan perbandingan, yang mengarah
kepada pengambilan keputusan. Setiap data warehouse
mempunyai kualitas yang sementara. Waktu adalah satu-
satunya dimensi yang penting yang semua data warehouse
harus bisa mendukung.
4. Nonvolatile
Setelah data dimasukan ke dalam data warehouse , user
tidak bisa mengganti atau meng-update data. Data yang
lama dibuang dan perubahan data disimpan sebagai data
yang baru.
2.1.10.3 Lifecycle Diagram
Menurut Kimball dan Ross (2010:97), Lifecycle
Diagram adalah roadmap yang menggambarkan secara
keseluruhan dari urutan dari tugas yang dibutuhkan untuk
desain yang efektif, pengembangan, dan penyebaran.
24
Gambar 2.3 Lifecycle Diagram
(Sumber: Kimball dan Ross, 2010, p97)
2.1.10.3.1 Program/Project Planning and Management
Menurut Kimball dan Ross (2010:98), Kotak pertama
dari roadmap adalah berfokus pada peluncuran program atau
proyek, termasuk ruang lingkup, pembenaran, dan susunan
karyawan. Keseluruhan dari lifecycle, program dan tugas proyek
manajemen memastikan aktivitas tetap pada jalur yang benar.
2.1.10.3.2 Business Requirements
Menurut Kimball dan Ross (2010:98), Memilih
kebutuhan bisnis adalah tugas utama dalam Kimball Lifecycle
karena temuan ini mendorong sebagian besar keputusan
upstream dan downstream. Kebutuhan dikumpulkan untuk
menentukan faktor kunci yang mempengaruhi bisnis dengan
berfokus pada apa yang dilakukan oleh pengguna bisnis (atau
apa yang akan dilakukan di masa mendatang), daripada bertanya
25
“apa yang anda inginkan dalam data warehouse?” Kesempatan
utama di seluruh perusahaan diidentifikasi, diberikan prioritas
berdasarkan pada nilai bisnis dan kelayakan, kemudian rincian
kebutuhan dikumpulkan untuk iterasi pertama dari
pembangunan sistem DW/BI.
2.1.10.3.3 Technology Track
Menurut Kimball dan Ross (2010:98), Lingkungan
Data Warehouse atau Business Intelligence berintegrasi dalam
berbagai teknologi, menyimpan data, dan metadata yang terkait.
Jalur teknologi dimulai dengan mendesain sistem arsitektur
(Technical Architecture Design) untuk membuat daftar
kemampuan yang dibutuhkan, kemudian dilanjutkan dengan
pemilihan dan pemasangan produk yang memuaskan kebutuhan-
kebutuhan arsitektur (Product Selection & Installation).
2.1.10.3.4 Data Track
Menurut Kimball dan Ross (2010:98), data track
dimulai dengan merancang sebuah target dari model
dimensional (Dimensional Modeling) dalam memenuhi
kebutuhan bisnis, dengan tetap mempertimbangkan data yang
sebenarnya.
Dibawah ini terdapat 9 tahapan (nine step
methodology) untuk merancang dimensional modeling menurut
Kimball dan Ross (2010:210), adalah sebagai berikut:
1. Choose The Process (Pemilihan Proses)
26
Menurut Kimball dan Ross (2010:211), Dalam
tahap awal ini, proses yang dipilih lebih menunjuk pada
subyek yang ada dari sebuah bagian data mart. Data mart
yang akan dibangun harus tepat waktu yang berdasarkan
dengan anggapan dari menjawab semua pertanyaan bisnis
yang banyak diutarakan atau yang paling penting. Contoh
pemilihan terbaik untuk data mart adalah yang berhubungan
dengan sales, misalnya property sales, property leasing,
property advertising.
2. Choose The Grain (Pilih Grain)
Menurut Kimball dan Ross (2010:211), Dalam
tahap kedua ini, pemilihan grain berarti menentukan secara
tepat apa yang direpresentasikan oleh record pada tabel
fakta. Ketika dalam memilih grain untuk tabel fakta, maka
kita baru dapat mengidentifikasi dimensi dari tabel fakta
tersebut. Keputusan dalam pemilihan grain untuk tabel fakta
juga dapat menentukan grain untuk masing-masing tabel
dimensi. Contohnya, jika sumber dari sebuah tabel fakta
property sales adalah property sales individual maka sumber
dari sebuah dimensi pelanggan berisi rincian pelanggan yang
membeli property tersebut.
3. Identify and Conform The Dimensions (Identifikasi dan
Penyesuaian Dimensi)
Menurut Kimball dan Ross (2010:211), Dalam
tahap ketiga ini, dimensi membentuk konteks untuk bertanya
27
tentang fakta di dalam tabel fakta. Kumpulan dimensi yang
baik membuat data mart mudah dimengerti dan digunakan.
Jika ada dimensi yang digunakan pada dua data mart, maka
dimensi tersebut harus sama atau secara matematis salah
satunya harus merupakan bagian dari yang lainnya.
Hanya dengan cara ini, maka dua data mart dapat
saling berbagi satu atau lebih dimensi pada aplikasi yang
sama. Ketika dimensi digunakan pada lebih dari satu data
mart, maka data mart mengarah sebagai conformed.
Contohnya, dimensi dokter mendeskripsikan atribut ID,
nama dokter, alamat, kota, no telepon.
Set dimensi yang dibangun dengan baik, memberikan
kemudahan untuk memahami dan menggunakan data
mart.
Dimensi tersebut penting untuk menggambarkan fakta-
fakta yang terdapat pada tabel fakta.
Contohnya, setiap data dokter pada tabel dimensi dokter
dilengkapi dengan id_dokter, no_dokter, gelar_dokter,
tempat_tinggal dan lain sebagainya.
Jika ada dimensi yang muncul pada dua data mart, kedua
data mart tersebut harus berdimensi sama, atau paling
tidak salah satunya berupa subset matematis dari yang
lainnya.
Jika sebuah dimensi digunakan pada dua data mart atau
lebih, dan dimensi ini tidak disinkronisasi, maka
28
keseluruhan data warehouse akan gagal, karena dua data
mart tidak dapat digunakan secara bersama-sama.
4. Choose The Fact (Pemilihan Fakta)
Menurut Kimball dan Ross (2010:213), Dalam
tahap keempat ini, Grain yang berasal dari tabel fakta
digunakan untuk menentukan fakta yang dapat digunakan.
Misalnya, grain dari tabel fakta adalah setiap property,
kemudian semua fakta numerik harus menunjuk pada
penjualan ini. Fakta-fakta tersebut harus numerik dapat dapat
ditambah.
Sumber dari sebuah tabel fakta menentukan fakta mana
yang dapat digunakan dalam data mart.
Semua fakta harus diekspresikan pada tingkat yang telah
ditentukan oleh sumber.
5. Store Precalculations in The Fact Table (Penyimpan Pre-
kalkulasi di Tabel Fakta)
Menurut Kimball dan Ross (2010:213), Dalam
tahap kelima ini, setelah melakukan pemilihan fakta-fakta,
maka akan dilakukan pengkajian ulang untuk menentukan
apakah ada fakta-fakta yang dapat diterapkan untuk pre-
calculation atau kalkulasi awal. Contohnya, kebutuhan untuk
penyimapan pre-calculation muncul ketika fakta berisi
pernyataan untung dan rugi. Situasi ini akan meningkat
ketika tabel fakta didasarkan pada invoice atau sales. Contoh
29
lainnya adalah saat membandingkan keuntungan dan
kerugian.
6. Round Out The Dimension Tables (Memastikan
Tabel Dimensi)
Menurut Kimball dan Ross (2010:214), Dalam
tahap keenam ini, untuk memastikan tabel dimensi dengan
menambahkan gambaran teks terhadap dimensi yang
memungkinkan. Gambaran teks harus mudah dimengerti dan
digunakan oleh user. Kegunaan suatu data mart ditentukan
oleh lingkup dan atribut tabel dimensi.
Kita menambahkan gambaran teks atau keterangan
selengkap-lengkapnya pada tabel dimensi.
Keterangannya harus bersifat intuitif dan mudah
dipahami oleh user.
7. Duration of The Database (Durasi Database)
Menurut Kimball dan Ross (2010:215), Dalam
tahap ketujuh ini, durasi tersebut digunakan untuk mengukur
sejauh mana tabel fakta dapat melihat ke beberapa tahun ke
belakang. Banyak perusahaan yang ingin melihat apa saja
yang terjadi pada periode waktu yang sama dalam satu
tahun, dua tahun, atau tiga tahun sebelumnnya. Untuk jenis
perusahaan tertentu, mereka ingin dapat melihat data hingga
lima tahun ke belakang. Tabel fakta yang besar
menimbulkan dua persoalan. Pertama, semakin tua umur
data, akan muncul masalah pembacaan dan interpretasi file
30
lama. Kedua, menimbulkan kemungkinan versi dimensi
lama digunakan, bukan versi terbarunya.
8. Determine The Need to Track Slowly Changing
Dimensions (Determinasi yang Perlu untuk Lacak
Perubahan dari Dimensi secara Perlahan)
Menurut Kimball dan Ross (2010:215), Dalam
tahap kedelapan ini, masalah perubahan dimensi secara
perlahan memiliki arti, contoh: deskripsi yang tepat pada old
client dan old branch harus digunakan sebagai history
transaksi sebelumnya. Perubahan dimensi ini dapat berubah
secara perlahan seiring berjalannya waktu dan kebutuhan.
Terdapat tiga tipe dasar perubahan secara perlahan untuk
mengamati perubahan dari dimensi pada dimensional table,
yaitu:
Tipe 1, Atribut dimensi yang diubah dituliskan ulang.
Tipe 2, Atribut dimensi yang diubah menyebabkan
pembentukan record yang baru.
Tipe 3, Atribut dimensi yang diubah mengakibatkan
sebuah atribut atau kolom alternative dibuat, jadi antara
record yang lama dan baru diakses secara bersama-sama.
9. Decide The Physical Design (Menentukan Perancangan
Fisik)
Menurut Kimball dan Ross (2010:215), Dalam
tahap terakhir ini, dapat mempertimbangkan pengaruh dari
rancangan fisik, seperti penyortiran urutan tabel fakta pada
31
disk dan keberadaan dari penyimpanan awal ringkasan
(summaries) atau penjumlahan. Selain itu, masalah seperti
administrasi, summaries, kinerja indeks, dan keamanan juga
merupakan faktor yang harus diperhatikan.
Setelah itu, model dimensional diubah menjadi
kedalam rancangan fisik (Physical Design) saat strategi
penyesuaian kinerja dipertimbangkan, kemudian rancangan
dan pembangunan diekstrak, transformasi, dan load (ETL
Design and Development) ditangani.
2.1.10.3.5 Business Intelligence Track
Menurut Kimball dan Ross (2010:99), sementara
beberapa anggota proyek berkonsentrasi pada teknologi dan
data, anggota lain berfokus untuk mengidentifikasi dan
membangun aplikasi Business Intelligence dengan cakupan yang
besar, termasuk laporan-laporan standar query berparameter,
dashboards, scorecards, model-model analisis, dan aplikasi data
mining, bersamaan dengan navigasi interface yang
berhubungan.
2.1.10.3.6 Deployment, Maintenance, and Growth
Menurut Kimball dan Ross (2010:99), tiga lifecycle
track berada pada tahap deployment, membawa teknologi, data,
dan aplikasi Business Intelligence (BI) bersama-sama.
Deployment iteration memasuki tahap pemeliharaan, sedangkan
pertumbuhan ditujukan untuk perencanaan proyek dalam iterasi
32
selanjutnya dari sistem data warehouse atau Business
Intelligence (BI).
2.1.11 Dimensionality Modelling
Menurut Connolly dan Begg (2010:1227), Dimensionality
Modeling adalah sebuah teknik desain logika yang bertujuan untuk
menampilkan data dalam bentuk standar, intuitif yang memungkinkan
akses cepat.
Dimensionality Modeling menggunakan konsep model Entity-
Relationship (ER) dengan beberapa batasan penting. Setiap model
dimensi terdiri dari satu tabel dengan satu composite primary key yang
disebut fact table dan memiliki kumpulan dari tabel yang lebih
sederhana yang disebut tabel dimensi (Dimension Table). Tiap tabel
dimensi memiliki primary key (non composite) yang akan
berkorespondensi tepat satu dengan komponen pada composite key
dalam fact table.
2.1.11.1 Star Schema
Menurut Connolly dan Begg (2010:1227), star
schema adalah model data dimensional yang mempunyai fact
table di bagian tengah, dikelilingi oleh tabel dimensi yang
terdiri dari data reference (yang bisa di-denormalized). Star
schema mengambil karakteristik dari factual data yang di-
generate oleh event yang terjadi dimasa lampau.
33
Gambar 2.4 Contoh Star Schema
(Sumber: Connolly dan Begg, 2010, p1228)
2.1.11.2 Snowflake
Menurut Connolly dan Begg (2010:1229), Snowflake
adalah jenis dari star schema dimana tabel dimensinya tidak
mengandung denormalisasi.
Gambar 2.5 Contoh Snowflake
(Sumber: Connolly dan Begg, 2010, p1229)
34
2.1.11.3 Starflake
Menurut Connolly dan Begg (2010:1230), Starflake
adalah struktur gabungan yang mengandung campuran dari
star schema dan snowflake.
Berdasarkan dari kutipan pengertian ketiga schema diatas,
dapat disimpulkan bahwa tabel fakta pada star schema dikelilingi oleh
banyak dimensi dengan hubungan one-to-many, sedangkan pada
snowflake tabel fakta terhubung banyak ke tabel dimensi, yang dimana
dimensi tersebut dapat dihubungkan ke tabel dimensi lain, sedangkan
starflake schema merupakan gabungan antara star schema dengan
snowflake.
2.1.12 Extract, Transform, Loading Data (ETL)
Menurut Rainardi (2008), ETL adalah suatu proses mengambil
dan mengirim data dari sumber data ke data warehouse. Dalam proses
pengambilan data, data harus bersih agar didapat kualitas data yang
baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang
tidak eksis lagi, ada beberapa data yang null, dan lain sebagainya.
Pendekatan tradisional pada proses ETL mengambil data dari data
sumber, meletakkan pada staging area, dan kemudian mentransformasi
dan meng-load ke data warehouse.
Proses ETL (Extract, Transform, Loading) terbagi menjadi 3,
yaitu:
1. Extract
Extract adalah proses penentuan source yang akan digunakan
sebagai sumber data bagi data warehouse. Di sini kita bias
35
menentukan data apa saja yang diperlukan, tabel apa saja yang
dijadikan sumber. Langkah pertama pada proses ETL adalah
mengekstrak data dari sumber-sumber data. Kebanyakan proyek
data warehouse menggabungkan data dari sumber-sumber yang
berbeda. Pada hakekatnya, proses ektraksi adalah proses penguraian,
pembersihan dari data diekstrak untuk mendapatkan struktur atau
pola data yang diharapkan.
2. Transform
Setelah source ditentukan, maka data tersebut diubah agar sesuai
dengan standard yang ada pada data warehouse. Tahapan
transformasi menggunakan serangkaian aturan atau fungsi untuk
mengekstrak data dari sumber dan selanjutnya dimasukkan dalam
data warehouse. Dibawah ini hal-hal yang dilakukan dalam tahapan
transformasi, yaitu:
a. Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam
data warehouse.
b. Menterjemahkan nilai-nilai yang berupa kode, misalnya sumber
database menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk
perempuan, tetapi data warehouse yang telah ada menyimpan A
untuk dewasa dan C untuk anak-anak, maka ini disebut juga
dengan automated data cleaning (tidak ada pembersihan secara
manual yang ditunjukkan selama proses ETL).
c. Melakukan perhitungan nilai-nilai baru seperti total = h_jual *
qty.
36
d. Mengkodekan nilai-nilai ke dalam bentuk bebas seperti
memetakan yang umurnya “65” ke kategori “D”.
e. Membuat ringkasan dari sekumpulan baris data seperti total
penjualan untuk setiap toko atau setiap bagian.
f. Menggabungkan data secara bersama-sama dari berbagai
sumber.
3. Load
Load adalah proses memasukkan data-data yang sudah di
transformasi ke dalam data warehouse untuk disimpan sebagai
summary atau archieve. Fase load merupakan tahapan yang
berfungsi untuk memasukkan data ke dalam target akhir, yang
biasanya ke dalam suatu data warehouse. Jangka waktu proses ini
tergantung pada kebutuhan organisasi. Beberapa data warehouse
dapat setiap minggu menulis keseluruhan informasi yang ada secara
kumulatif, data diubah, sementara data warehouse yang lain satau
bagian lain dari data warehouse yang sama dapat menambahkan
data baru dalam suatu bentuk historical, contohnya setiap jam.
Waktu dan jangkauan untuk mengganti atau menambah data
tergantung dari perancangan data warehouse pada waktu
menganalisis keperluan informasi.
2.1.13 Pengertian On-line Transaction Processing
Menurut Stair dan Reynolds (2010), OLTP adalah suatu
bentuk pengolahan data dimana setiap transaksi diproses dengan
segera, tanpa penundaan mengumpulkan transaksi ke dalam batch.
Memiliki karakteristik dengan jumlah data yang besar namun transaksi
37
yang dilakukan cukup sederhana seperti insert, update, dan delete. Hal
utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah
melakukan query secara cepat dan mudah untuk diperbaiki dan dapat
diakses.
2.1.14 OLAP (Online Analytical Processing)
2.1.14.1 Pengertian OLAP (Online Analytical Processing)
Menurut Turban, Sharda, Delen, dan King (2011:77)
struktur operasional utama dalam OLAP didasarkan pada
konsep yang disebut kubus (cube). Kubus (cube) didalam
OLAP adalah struktur data multidimensional (actual atau
virtual) yang memungkinkan analisis data yang cepat. Juga
dapat didefinisikan sebagai kemampuan dari memanipulasi
dan menganalisis data secara efisien dari berbagai perspektif.
Susunan data ke dalam kubus bertujuan untuk mengatasi
keterbatasan database relational. Database relational tidak
cocok untuk analisis yang cepat dan dekat dari sejumlah besar
data. Sebaliknya, mereka lebih cocok untuk memanipulasi
record (menambahkan, menghapus, dan memperbarui data)
yang mewakili serangkaian transaksi.
Menurut Scheps (2008:68) Online Analytical
Processing adalah sebuah konsep data multidimensional
dengan konsep mentualisasi data transaksional perusahaan.
Bukan hanya mengagregasi data, OLAP memberikan
kemampuan pada sistem BI untuk melihat data dengan cara
baru.
38
Gambar 2.6 Online Analytical Processing
(Sumber: Scheps, 2008, p69)
Berdasarkan pengertian yang dijabarkan oleh para
ahli diatas dapat disimpulkan bahwa pengertian Online
Analytical Processing (OLAP) adalah sebuah konsep data
multidimensional yang mendukung kegiatan mulai dari self
service reporting dan analisis data yang cepat dan efisien dari
berbagai perspektif.
2.1.14.2 Arsitektur OLAP
Menurut Scheps (2008:77), Sistem OLAP
mempunyai dua kategori, yaitu:
OLAP Cube
Di lingkungan OLAP, cube adalah penyimpan
data terspesialisasi dirancang secara spesifik untuk
39
menangani data ringkasan multidimensional
(multidimentional summary data). Data cube disimpan di
cell dan strukturnya seperti 3D spreadsheet.
Gambar 2.7 Cube
(Sumber: Scheps, 2008, p77)
OLAP Access Tools
Lingkungan client yang memungkinkan
pengguna untuk memanipulasi data cube dan akhirnya
menghasilkan Business Intelligence yang berarti dari
berbagai sudut pandang dan dapat lebih dari satu sudut
pandang.
2.1.15 Perbedaan OLAP dan OLTP
Menurut Vercellis (2009:49) terdapat perbedaan antara OLAP
dan OLTP, antara lain dapat dilihat pada tabel dibawah ini:
40
Tabel 2.1 Perbedaan antara OLTP dan OLAP
(Sumber: Vercellis, 2009, p49)
Karakteristik OLAP OLTP
Volatilitas Data statis Data dinamis
Waktu Data saat ini dan historis Data saat ini
Dimensi waktu Eksplisit dan varian Implisit dan terkini
Granuality Data agregasi dan
konsolidasi
Data yang detil
Update Periodic dan regular Berlanjut dan tidak
regular
Aktivitas Tidak dapat diprediksi Berulang kali
Fleksibilitas Tinggi Rendah
Kinerja Rendah untuk query yang
kompleks
Tinggi, satu detik per
query
User Knowledge workers Karyawan
Fungsi Analisis Operasional
Tujuan
penggunaan
Query kompleks dan
pendukung keputusan
Transaksi
Prioritas Fleksibilitas tinggi Kinerja tinggi
Metric Respon efektif Rata-rata transaksi
Ukuran data Gigabyte hingga terabyte Megabyte hingga
gigabyte
41
2.1.16 Pengertian Metadata
Menurut Kimball dan Ross (2010:566), Metadata adalah
semua informasi dalam lingkungan data warehouse yang bukan
merupakan data itu sendiri. Metadata ini hampir sama dengan sebuah
insiklopedia untuk data warehouse.
2.1.17 Data Mining
Menurut Han dan Kamber (2011:36), data mining adalah
proses menemukan pola yang menarik dan pengetahuan dari data yang
berjumlah besar.
Menurut Vercellis (2009:77), data mining adalah aktivitas
yang menggambarkan sebuah proses analisis yang terjadi secara iteratif
pada database yang besar, dengan tujuan mengekstrak informasi dan
knowledge yang akurat dan berpotensial berguna untuk knowledge
workers yang berhubungan dengan pengambilan keputusan dan
pemecahan masalah.
Aktivitas data mining dapat dipisahkan menjadi 2,
berdasarkan tujuan dari analisis yaitu:
Interpretasi
Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan
menghasilkannya dalam bentuk aturan dan kriteria yang dapat
dimengerti eksekutif.
Prediksi
Tujuan dari prediksi adalah untuk mengestimasikan kejadian-
kejadian yang terjadi di masa depan. Contohnya, perusahaan retail
42
dapat menggunakan data mining untuk memprediksikan penjualan
dari produk mereka di masa depan dengan menggunakan data-data
yang telah didapatkan dari beberapa minggu.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian data mining adalah sebuah proses
analisis yang terjadi secara interatif dan menemukan pola yang menarik,
serta pengetahuan dari data yang berjumlah besar.
2.1.18 Pengertian Clustering
Menurut Han dan Kamber (2011), Clustering adalah proses
pengelompokkan kumpulan data menjadi beberapa kelompok sehingga
objek di dalam satu kelompok memiliki banyak kesamaan dan memiliki
banyak perbedaan dengan objek dikelompok lain. Perbedaan dan
persamaannya biasanya berdasarkan nilai atribut dari objek tersebut dan
dapat juga berupa perhitungan jarak. Clustering sendiri juga disebut
Unsupervised Classification, karena clustering lebih bersifat untuk
dipelajari dan diperhatikan. Cluster analysis merupakan proses partisi
satu set objek data ke dalam himpunan bagian. Setiap himpunan bagian
adalah cluster, sehingga objek yang di dalam cluster mirip satu sama
dengan yang lainnya, dan mempunyai perbedaan dengan objek dari
cluster yang lain. Partisi tidak dilakukan dengan manual tetapi dengan
algoritma clustering. Oleh karena itu, Clustering sangat berguna dan
bisa menemukan group yang tidak dikenal dalam data.
43
2.1.19 Business Intelligence
2.1.19.1 Pengertian Business Intelligence
Menurut Scheps (2008:11), Business Intelligence
adalah segala aktivitas, tool, atau proses yang digunakan untuk
mendapatkan informasi yang terbaik untuk mendukung proses
pembuatan keputusan.
Menurut Vercellis (2009:3), Business Intelligence
adalah kumpulan model metematika dan metodologi analisa
yang secara sistematik menghasilkan data untuk menghasilkan
suatu informasi dan pengetahuan yang berguna untuk
mendukung proses pengambilan keputusan yang kompleks.
Tujuan utama dari business intelligence adalah untuk
menyediakan alat dan metodologi bagi knowledge workers
untuk membuat keputusan yang efektif dan tepat waktu.
Keputusan yang efektif
Aplikasi dari metode analisa yang butuh ketelitian tinggi
membuat pengambil keputusan harus mengandalkan
informasi dan pengetahuan mana yang dapat diandalkan.
Hasilnya, mereka dapat membuat keputusan yang lebih
baik dan membuat suatu perencanaan yang dapat membuat
tujuan mereka tercapai dengan efektif.
Keputusan yang tepat waktu
Perusahaan beroperasi dalam lingkungan ekonomi yang
berkarakterisasi oleh tingkatan kompetisi dan dinamisme
yang tinggi. Konsekuensinya, kemampuan untuk bereaksi
44
dengan pesaing dan kondisi pasar baru merupakan faktor
penting dalam kesuksesan ataupun kelangsungan hidup
perusahaan.
Berdasarkan pengertian yang dijabarkan oleh para
ahli diatas dapat disimpulkan bahwa pengertian Business
Intelligence (BI) adalah kumpulan aktivitas, tool, atau proses
yang digunakan, dan metodologi analisa yang secara
sistematis dapat menghasilkan suatu informasi dan
pengetahuan yang berguna untuk mendukung proses
pembuatan keputusan yang kompleks.
2.1.19.2 Arsitektur Business Intelligence
Menurut Vercellis (2009:9), arsitektur dari sebuah
business intelligence system, terdiri dari enam komponen
utama yaitu:
1. Data sources
Pada tahap pertama, diperlukan suatu proses untuk
mengumpulkan dan mengintegrasikan data-data yang
disimpan dalam berbagai sumber yang bervariasi, yang
mana saling berbeda baik itu asal maupun jenisnya.
Sumber ini kebanyakan berasal dari data-data yang
terdapat pada operational systems, tetapi bisa juga berasal
dari dokumen yang tidak terstruktur seperti email dan data-
data yang dikirimkan oleh pihak luar.
2. Data warehouse dan data marts
45
Dengan menggunakan extraction dan transformation tools
yang dikenal sebagai ETL (extract, transform, load), data
yang berasal dari berbagai sumber yang berbeda disimpan
ke dalam database yang ditujukan untuk mendukung
analisis business intelligence. Database inilah yang
biasanya dikenal dengan sebutan data warehouse dan data
marts.
3. Data exploration
Pada level ketiga ini, tools-tools yang berfungsi untuk
keperluan analisis business intelligence pasif digunakan.
Tools-tools ini terdiri dari query dan reporting systems,
serta statistical methods. Metodologi ini bersifat pasif
karena para pengambil keputusan harus mengambil
keputusan berdasarkan hipotesa mereka sendiri atau
mendefinisikan kriteria dari data extraction, kemudian
menggunakan tools analisis untuk menemukan jawaban
dan mencocokkannya dengan hipotesa awal mereka.
4. Data mining
Level keempat ini terdiri dari sejumlah metodologi
business intelligence yang bersifat aktif yang tujuannya
adalah untuk mengekstrak informasi dan pengetahuan dari
data. Metodologi ini berisi sejumlah model matematika
untuk pengenalan pola, pembelajaran mesin, dan teknik
data mining. Tidak seperti tools yang digunakan pada level
sebelumnya, model dari business intelligence yang bersifat
46
aktif ini tidak mengharuskan para pengambil keputusan
untuk mengeluarkan hipotesa apapun.
5. Optimization
Pada level ini, solusi terbaik harus dipilih dari sekian
alternative yang ada, yang biasanya sangat banyak dan
beragam.
6. Decisions
Pada level terakhir ini yang menjadi persoalan utama
adalah bagaimana menentukan keputusan akhir yang akan
diambil yang dikenal sebagai decision making process.
Walaupun metodologi business intelligence berhasil
diterapkan, pilihan untuk mengambil sebuah keputusan ada
pada para pengambil keputusan. Pertimbangkan untuk
mengambil keputusan ini biasanya diambil juga dari
informasi yang tidak terstruktur serta tidak formal dan
memodifikasi rekomendasi serta kesimpula yang dicapai
melalui penggunaan model matematika.
Gambar 2.8 Komponen utama dari Business Intelligence
(Sumber: Vercellis, 2009, p9)
47
2.1.19.3 Siklus Hidup Business Intelligence
Menurut Vercellis (2009:12), ada 4 siklus hidup
business intelligence, yaitu :
1. Analysis
Saat fase analisis, sangat penting untuk mengenali masalah
luar maupun dalam. Pengambil keputusan harus membuat
representasi dari kejadian yang sedang dianalisis, dengan
mengidentifikasikan faktor penting yang paling relevan
dengan masalah.
2. Insight
Fase kedua membuat pengambil keputusan mengerti lebih
dalam mengenai masalah, biasanya dalam tingkatan
kausal. Sebagai contoh, jika analisis dalam fase pertama
menunjukkan bahwa banyak pelanggan yang tidak lagi
melanjutkan asuransi mereka, dalam fase kedua sangat
penting untuk mengidentifikasi profil dan karakteristik
yang dimiliki oleh pelanggan. Informasi yang didapat dari
fase pertama ditransformasikan kedalam fase kedua.
3. Decision
Saat fase ketiga, pengetahuan yang didapat dari fase kedua
diubah menjadi suatu keputusan yang akan diikuti dengan
ksi. Metodologi business intelligence memungkinkan fase
analisis dan pendalaman dieksekusi berkali-kali agar
keputusan yang efektif dan tepat waktu dalam dibuat untuk
memenuhi prioritas strategis suatu perusahaan.
48
4. Evaluation
Fase terakhir dari Business Intelligence meliputi
pengukuran kinerja dan evaluasi. Dengan menunjukkan
indikator kinerja yang dapat digunakan untuk
mengevaluasi kinerja dari perusahaan.
Gambar 2.9 Siklus Hidup Business Intelligence
(Sumber: Vercellis, 2009, p12)
2.1.19.4 Keuntungan Business Intelligence
Menurut Khan (2012:64) dalam jurnalnya
mengatakan bahwa sementara dunia bisnis berubah dengan
cepat dan proses bisnis menjadi lebih dan lebih kompleks
sehingga lebih sulit bagi manager untuk memiliki yang
komprehensif pemahaman lingkungan bisnis. Faktor
globalisasi, deregulasi, merger dan akuisisi, kompetisi dan
inovasi teknologi, telah memaksa perusahaan untuk
memikirkan kembali strategi bisnis mereka dan hanya
perubahan besar telah menggunakan teknik Business
Inteligence (BI) untuk membantu mereka memahami dan
mengendalikan proses bisnis untuk mendapatkan keuntungan
49
kompetitif. BI terutama digunakan untuk meningkatkan
ketepatan waktu dan kualitas informasi, dan memungkinkan
manager lebih memahami posisi perubahan mereka
dibandingkan dengan pesaing.
Aplikasi dan Teknologi BI ini membantu perusahaan
untuk menganalisis perubahan tren dalam pangsa pasar,
perubahan perilaku pelanggan dan pengeluaran pola,
preferensi pelanggan, kemampuan perusahaan dan kondisi
pasar. Hal ini digunakan untuk membantu analisis dan
manager menentukan penyesuaian yang paling mungkin untuk
merespon perubahan tren. Ia telah muncul sebagai sebuah
konsep untuk menganalisis data yang dikumpulkan dengan
tujuan untuk membantu unit pengambilan keputusan
mendapatkan pengetahuan yang lebih baik yang komprehensif
dari sebuah operasi, organisasi dan dengan demikian membuat
keputusan bisnis lebih baik.
2.1.19.5 Komponen Business Intelligence
Menurut Kapoor (2010:22) dalam jurnalnya
mengatakan bahwa komponen Business Intelligence terdiri
dari 4 (empat) sub-system, yaitu:
1. The Data Management sub-system
Mencakup komponen yang berkaitan dengan data
warehouse, data mart, dan Online Analytical Processing
(OLAP). Orang-orang yang bekerja terutama di daerah ini
adalah "teknologi", yang mengkhususkan diri dalam Ilmu
50
Komputer, Sistem Informasi Manajemen (MIS), atau
disiplin terkait.
2. The Advanced Analytics sub-system
Meliputi analisis fungsi berdasarkan statistik, data mining,
peramalan, pemodelan prediktif, analisis prediktif, dan
optimasi. Orang-orang yang bekerja terutama di daerah ini
adalah "Super User", yang mengkhususkan diri dalam
Matematika, Statistik, Ilmu Manajemen atau disiplin yang
terkait.
3. The Business Performance Management sub-system
Terdiri dari proses untuk tujuan strategis dan tujuan,
pengukuran kinerja dan mentoring, menganalisis kinerja
dan membuat keputusan untuk meningkatkan kinerja
bisnis.
4. The Information Delivery sub-system
Memberikan pengguna bisnis kemampuan untuk
mengakses laporan dan terus memantau kinerja organisasi
pada perusahaan dan tingkat yang lebih rendah. Menurut
perannya sebagai teknokrat, super user, manager
menengah, manager eksekutif, atau pengguna operasional,
ia akan diberi peran berbasis hak untuk mengakses laporan
yang relevan dalam ringkasan dan atau format rinci.
Pengguna akhir juga mampu memantau kegiatan kunci
seperti tren, metrik, dan KPI dalam mudah untuk
memahami desain, seperti portal informasi dikonfigurasi,
51
Scorecard dan dashboard. Tergantung pada peran individu
dan tanggung jawab, disajikan dengan tren, metrik, dan
KPI pada tingkat agregasi yang sesuai dengan keamanan
untuk memblokir non-hak istimewa item.
2.1.20 Dashboard
Menurut Scheps (2008:95) Dashboard merupakan keturunan
langsung dari EIS lama dan sistem DSS, dengan meningkatkan
fungsional dan penampilan. Karena mereka terhubung dengan sistem
data yang kuat dan memanfaatkan KPI.
Menurut Scheps (2008:97) terdapat tiga jenis dashboard yaitu:
Tactical Dashboard
Mengukur produktivitas jangka pendek dan efektivitas. Hasilnya
sering digunakan oleh contributor individu.
Operational Dashboard
Mengukur efektivitas jangka pendek dari fungsi bisnis yang
spesifikasi pada tim atau level unit bisnis. Level dashboard ini dapat
secara potensial dikembangkan untuk seorang knowledge worker
atau local team manager.
Strategic Dashboard
Dibangun untuk level pengaturan kebijakan dari organisasi.
Dashboard menampilkan metric yang menggambarkan strategi dan
tujuan korporasi.
2.1.21 Management Reporting
Menurut Jan Barned (2011:4), dalam jurnalnya mengatakan
bahwa pengertian dari Management Reporting adalah suatu pelaporan
52
yang bertujuan untuk memberikan informasi yang berguna secara
berkala kepada pemilik perusahaan dalam pengambilan keputusan.
Dalam Management Financial Framework (2012:1),
Pengertian Management Reporting adalah proses penyediaan informasi
kepada lembaga manajemen dengan tepat waktu, akurat dan relevan
yang dirancang untuk membantu dalam strategis dan operasional
perusahaan. Karena Management Reporting yang efektif sangat penting
untuk manajemen dalam membuat keputusan yang tepat, efisien, dan
efektif. Dibawah ini manfaat bagi lembaga manajemen dengan
menggunakan management reporting yang tepat waktu dan efektif,
adalah sebagai berikut:
- Meningkatkan proses pengambilan keputusan.
- Meningkatkan efektivitas manajemen.
- Penggunaan sumber daya dalam proses pengiriman jasa menjadi
lebih efisien.
- Meningkatkan keyakinan dalam kualitas keputusan manajemen oleh
staf lembaga.
- Meningkatkan responsivitas terhadap isu-isu yang muncul
Pengembangan struktur dan format dari management reporting
merupakan elemen yang mendasar dalam menyediakan informasi
kepada lembaga dan staf manajemen dengan tepat, akurat dan tepat
waktu. Misalnya, laporan diberikan kepada manajemen senior biasanya
mengenai summary laporan tentang berbagai aspek operasional.
Laporan-laporan ini akan didukung dengan fungsi drill-down yang
memungkinkan untuk ulasan transaksional bagi manajemen apabila
53
diperlukan. Reporting diberikan kepada manajemen lini dan staf
umumnya akan menyediakan laporan lebih bertarget dan transaksional
pada fungsi instansi dari laporan manajemen tingkat yang lebih tinggi.
2.2 Teori-Teori Khusus
2.2.1 Instruktur
Menurut Hamalik (2007:144), instruktur (pelatih) adalah
tenaga kependidikan yang bertugas dan berfungsi melaksanakan
pendidikan dan pelatihan.
Menurut Hamalik (2007: 145-147), instruktur memiliki
peranan-peranan tertentu yang meliputi:
1. Peranan sebagai pengajar; instruktur berperan menyampaikan
pengetahuan dengan menyajikan berbagai informasi yang
diperlukan berupa konsep-konsep, fakta, dan informasi yang dapat
memperkaya wawasan pengetahuan para peserta pelatihan dengan
cara melibatkan mereka secara aktif untuk mencari pengetahuan
sendiri yang mereka butuhkan.
2. Peranan sebagai pemimpin kelas; instruktur berperan sebagai
pemimpin kelas secara keseluruhan sehingga dari peranannya itu
pelatih perlu menyusun perencanaan, pelaksanaan, pengawasan, dan
penilaian selama berlangsungnya proses pembelajaran.
3. Peranan sebagai pembimbing; instruktur perlu memberikan bantuan
dan pertolongan bagi peseta pelatihan yang mengalami kesulitan
dalam proses pembelajaran/pelatihan yang pada akhirnya
mengarahkan peserta lebih aktif dan mandiri. Bentuk bimbingannya
54
dapat berupa mengarahkan, memotivasi, membantu memecahkan
masalah dan lain-lain.
4. Peranan sebagai fasilitator; instruktur berperan menciptakan
kondisi lingkungan pelatihan agar peserta pelatihan belajar aktif
sehingga proses pembelajaran menjadi efektif.
5. Peranan sebagai peserta aktif; instruktur dapat berperan serta
sebagai peserta aktif dalam kegiatan diskusi dengan cara
memberikan informasi, mengarahkan pemikiran, menunjukkan
jalan pemecahan (problem solving), dan sumber-sumber yang
diperlukan.
6. Peranan sebagai pengawas; pelatih harus melakukan pengawasan
secara terus menerus agar proses pelatihan senantiasa terarah,
kendala-kendala yang dihadapi peseta pelatihan segera tertangani,
disiplin kelas dapat dibina dengan baik dan ketertiban kelas
terjaga.
7. Peranan sebagai motivator; instruktur perlu secara berkelanjutan
menggerakkan motivasi belajar peserta pelatihan supaya kegiatan
belajarnya lebih aktif.
8. Peranan sebagai evaluator; instruktur berperan melakukan
penilaian pada pra-proses-akhir pelatihan melalui tes, petanyaan
lisan, pengamatan dan lain-lain agar peserta pelatihan mengetahui
kemajuan belajarnya, mengetahui kesulitan belajarnya dan
membantunya dengan bimbingan.
9. Peranan sebagai konselor; instruktur dapat berperan memberikan
penyuluhan tentang kesulitan pribadi dan sosial peserta pelatihan.
55
10. Peranan sebagai penyidik sikap dan nilai; sistem nilai yang
dijadikan panutan dan sikap hidup bagi semua peserta pelatihan,
mengingat semuanya akan didayagunakan sebagai tenaga kerja
yang melayani masyarakat dan dibina sesuai dengan tuntutan
lapangan pekerjaan.
2.2.2 Pengertian Penilaian
Menurut Ahyan (2011), dalam artikelnya mengatakan bahwa
penilaian adalah suatu pernyataan berdasarkan sejumlah fakta untuk
menjelskan karakteristik seseorang atau sesuatu. Menilai pada
hakikatnya adalah mengambil suatu keputusan terhadap sesuatu dengan
ukuran baik atau buruk, sehat atau sakit, panjang atau pendek, pandai
atau bodoh, dan lain sebagainya, dimana keputusan itu diambil
berdasarkan apakah sesuai atau tidak sesuai dengan kriteria yang
ditentukan. Penilaian itu sendiri bersifat kualitatif.
2.2.3 Pengertian Kinerja
Menurut Yohana (2012:133), dalam jurnalnya mengatakan
bahwa pengertian kinerja mengarah pada suatu upaya pencapaian
prestasi kerja yang lebih baik maka keberhasilan dalam melakukan
suatu pekerjaan sangat ditentukan oleh kinerja.
2.2.4 Pengertian Evaluasi
Menurut Sudijono (2010:1), Evaluasi adalah suatu tindakan
atau suatu proses untuk menentukan nilai dari sesuatu.
Menurut Arikunto (2010:3), Evaluasi merupakan sebuah
proses pengumpulan data untuk menentukan sejauh mana, dalam hal
apa, dan bagian mana tujuan pendidikan sudah tercapai.
56
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
dapat disimpulkan bahwa pengertian evaluasi adalah suatu tindakan
atau suatu proses pengumpulan data untuk menentukan nilai dari
sesuatu seperti menentukan sejauh mana, dalam hal apa, dan bagian
mana tujuan pendidikan sudah tercapai.
2.2.5 Pengertian Sertifikasi
Menurut Syafarudin (2008:33), Sertifikasi guru dapat diartikan
sebagai suatu proses pemberian pengakuan bahwa seseorang telah
memiliki kompetensi untuk melaksanakan pelayanan pendidikan pada
satuan pendidikan tertentu, setelah lulus uji kompetensi yang
diselenggarakan oleh lembaga sertifikasi.