74
Conformed Dimension Jika menggunakan referensi dari kimball, maka terdapat istilah conformed dimension. Conformed dimension adalah dimensi memiliki arti hal yang sama dengan setiap tabel fakta yang mungkin yang dapat bergabung. Pembentukan conformed dimension adalah langkah yang sangat signifikan. Jadi conformed dimension berarti dimensi indentik yang sama di setiap data mart. Contoh conformed dimension yaitu: kostumer, produk, lokasi, promosi dan waktu (Kimball et al, 1998). Pemodelan dimensi (DM) adalah nama dari seperangkat teknik dan konsep yang digunakan dalam data warehouse design. Hal ini dianggap berbeda dari entity-relationship modeling (ER).Modeling dimensi tidak selalu melibatkan database relasional. Pendekatan pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti database multidimensi atau file bahkan datar. Menurut konsultan data warehousing Ralph Kimball , [1] DM adalah teknik desain untuk database dimaksudkan untuk mendukung permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan kinerja. Menurut dia, meskipun ER berorientasi transaksi sangat berguna untuk menangkap transaksi , harus dihindari untuk pengiriman end-user. Pemodelan dimensi selalu menggunakan konsep fakta (ukuran), dan dimensi (konteks). Fakta biasanya (tetapi tidak selalu) nilai numerik yang dapat dikumpulkan, dan dimensi adalah kelompok hirarki dan deskriptor yang menentukan fakta-fakta. Sebagai contoh, jumlah penjualan adalah fakta, timestamp, produk, daftar #, toko #, dll adalah elemen dimensi. Model dimensi yang dibangun oleh area proses bisnis, misalnya toko penjualan, persediaan, klaim, dll Karena area proses bisnis yang berbeda berbagi beberapa tapi tidak semua dimensi, efisiensi dalam desain, operasi, dan konsistensi, ini dicapai dengan menggunakan dimensi serupa , yaitu menggunakan salah satu salinan dimensi dibagi di seluruh bidang studi. Istilah "sesuai dimensi" berasal oleh Ralph Kimball . Proses pemodelan dimensi [ sunting ] Model dimensi dibangun pada skema bintang seperti ., dengan dimensi sekitar tabel fakta [2] [3] Untuk membangun skema, model desain berikut digunakan: 1. Pilih proses bisnis 2. Menyatakan gandum 3. Mengidentifikasi dimensi 8

Materi Kimball

Embed Size (px)

DESCRIPTION

ghjhgjh

Citation preview

Page 1: Materi Kimball

Conformed Dimension

Jika menggunakan referensi dari kimball, maka terdapat istilah conformed

dimension. Conformed dimension adalah dimensi memiliki arti hal yang sama

dengan setiap tabel fakta yang mungkin yang dapat bergabung.

Pembentukan conformed dimension adalah langkah yang sangat signifikan.

Jadi conformed dimension berarti dimensi indentik yang sama di setiap

data mart. Contoh conformed dimension yaitu: kostumer, produk, lokasi,

promosi dan waktu (Kimball et al, 1998).

Pemodelan dimensi (DM) adalah nama dari seperangkat teknik dan konsep yang

digunakan dalam data warehouse design. Hal ini dianggap berbeda dari entity-relationship

modeling (ER).Modeling dimensi tidak selalu melibatkan database relasional. Pendekatan

pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti

database multidimensi atau file bahkan datar. Menurut konsultan data warehousing Ralph

Kimball , [1] DM adalah teknik desain untuk database dimaksudkan untuk mendukung

permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan

kinerja. Menurut dia, meskipun ER berorientasi transaksi sangat berguna untuk menangkap

transaksi , harus dihindari untuk pengiriman end-user.

Pemodelan dimensi selalu menggunakan konsep fakta (ukuran), dan dimensi

(konteks). Fakta biasanya (tetapi tidak selalu) nilai numerik yang dapat dikumpulkan, dan

dimensi adalah kelompok hirarki dan deskriptor yang menentukan fakta-fakta. Sebagai

contoh, jumlah penjualan adalah fakta, timestamp, produk, daftar #, toko #, dll adalah

elemen dimensi. Model dimensi yang dibangun oleh area proses bisnis, misalnya toko

penjualan, persediaan, klaim, dll Karena area proses bisnis yang berbeda berbagi beberapa

tapi tidak semua dimensi, efisiensi dalam desain, operasi, dan konsistensi, ini dicapai

dengan menggunakan dimensi serupa , yaitu menggunakan salah satu salinan dimensi

dibagi di seluruh bidang studi. Istilah "sesuai dimensi" berasal oleh Ralph Kimball .

Proses pemodelan dimensi [ sunting ]

Model dimensi dibangun pada skema bintang seperti ., dengan dimensi sekitar tabel

fakta [2] [3] Untuk membangun skema, model desain berikut digunakan:

1. Pilih proses bisnis

2. Menyatakan gandum

3. Mengidentifikasi dimensi

4. Mengidentifikasi fakta

Pilih proses bisnis

Proses pemodelan dimensi didasarkan pada metode desain 4-langkah yang membantu

untuk memastikan kegunaan dari model dimensi dan penggunaan data warehouse . Dasar-

dasar dalam desain membangun proses bisnis yang sebenarnya dimana data

warehouse harus mencakup. Oleh karena itu langkah pertama dalam model adalah untuk

menggambarkan proses bisnis yang model dibangun di atas. Ini bisa misalnya menjadi

situasi penjualan di toko ritel. Untuk menggambarkan proses bisnis, seseorang dapat

8

Page 2: Materi Kimball

9

memilih untuk melakukan hal ini dalam teks biasa atau menggunakan dasar Business

Process Modeling Notation ( BPMN ) atau panduan desain lainnya seperti Unified Modeling

Language ( UML ).

Menyatakan gandum

Setelah menjelaskan Proses Bisnis, langkah berikutnya dalam desain adalah untuk

menyatakan butir model. Gandum dari model adalah deskripsi yang tepat dari apa yang

model dimensi harus berfokus pada. Ini bisa misalnya menjadi "Item baris individu pada slip

pelanggan dari toko ritel". Untuk memperjelas apa artinya gandum, Anda harus memilih

proses pusat dan menggambarkannya dengan satu kalimat. Selain itu biji-bijian (kalimat)

adalah apa yang Anda akan membangun dimensi dan tabel fakta dari. Anda mungkin

merasa perlu untuk kembali ke langkah ini untuk mengubah gandum karena informasi baru

yang diperoleh pada apa model Anda seharusnya dapat memberikan.

Mengidentifikasi dimensi

Langkah ketiga dalam proses desain adalah untuk menentukan dimensi model. Dimensi

harus didefinisikan dalam gandum dari langkah kedua dari proses 4-langkah. Dimensi

adalah dasar dari tabel fakta, dan mana data untuk tabel fakta dikumpulkan. Biasanya

dimensi benda seperti tanggal, toko, persediaan dll Dimensi ini adalah di mana semua data

disimpan. Misalnya, dimensi tanggal bisa berisi data seperti tahun, bulan dan hari kerja.

Mengidentifikasi fakta-fakta

Setelah mendefinisikan dimensi, langkah berikutnya dalam proses ini adalah untuk membuat

kunci untuk tabel fakta. Langkah ini adalah untuk mengidentifikasi fakta-fakta numerik yang

akan mengisi setiap baris tabel fakta. Langkah ini erat terkait dengan pengguna bisnis dari

sistem, karena ini adalah di mana mereka mendapatkan akses ke data yang tersimpan

dalam data warehouse . Oleh karena itu sebagian dari baris tabel fakta adalah numerik,

tokoh aditif seperti kuantitas atau biaya per unit, dll

Dimensi Normalisasi [ sunting ]

Normalisasi dimensi atau snowflaking menghilangkan atribut berlebihan, yang dikenal dalam

meratakan de-dinormalisasi dimensi normal. Dimensi secara ketat bergabung bersama

dalam sub dimensi.

Snowflaking memiliki pengaruh pada struktur data yang berbeda dari banyak filosofi dari

gudang data. [3] Data Tunggal tabel (fakta) yang dikelilingi oleh beberapa deskriptif (dimensi)

tabel

Pengembang sering tidak menormalkan dimensi karena beberapa alasan: [4]

1. Normalisasi membuat struktur data yang lebih kompleks

2. Kinerja dapat lebih lambat, karena banyak bergabung antara tabel

3. Penghematan space minimal

4. Indeks bitmap  tidak dapat digunakan

5. Kinerja Query, database 3NF menderita masalah kinerja ketika menggabungkan

atau mengambil banyak nilai dimensi yang mungkin memerlukan analisis. Jika Anda

hanya akan melakukan laporan operasional maka Anda mungkin dapat bertahan

Page 3: Materi Kimball

10

dengan 3NF karena pengguna operasional Anda akan mencari data yang sangat

halus butir.

Ada beberapa argumen tentang mengapa normalisasi dapat berguna. [3] Hal ini dapat

menjadi keuntungan ketika bagian dari hirarki umum untuk lebih dari satu dimensi. Misalnya,

dimensi geografis mungkin digunakan kembali karena kedua pelanggan dan pemasok

dimensi menggunakannya.

Manfaat pemodelan dimensi [ sunting ]

Manfaat dari pemodelan dimensi adalah sebagai berikut: [5]

Dimengerti - Dibandingkan dengan model normalisasi, model dimensi lebih mudah

untuk memahami dan lebih intuitif. Dalam model dimensi, informasi dikelompokkan ke

dalam kategori bisnis yang koheren atau dimensi, sehingga lebih mudah untuk

membaca dan menafsirkan. Kesederhanaan juga memungkinkan perangkat lunak untuk

menavigasi database efisien. Dalam model normalisasi, data dibagi menjadi banyak

entitas diskrit dan bahkan proses bisnis sederhana mungkin mengakibatkan puluhan

tabel bergabung bersama-sama dalam cara yang kompleks.

Kinerja Query - model Dimensi lebih denormalized dan dioptimalkan untuk data

query, sementara model dinormalisasi berusaha untuk menghilangkan redudansi data

dan dioptimalkan untuk memuat transaksi dan memperbarui. Kerangka diprediksi dari

model dimensi memungkinkan database untuk membuat asumsi yang kuat tentang data

yang membantu dalam kinerja. Setiap dimensi merupakan entry point yang setara ke

dalam tabel fakta, dan struktur simetris ini memungkinkan penanganan yang efektif dari

query yang kompleks. Optimasi query untuk bergabung star database sederhana, dapat

diprediksi, dan terkendali.

Perluasan - Model Dimensi yang extensible dan mudah menampung data baru yang

tak terduga. Tabel yang ada dapat diubah di tempat baik dengan hanya menambahkan

baris data baru ke dalam tabel atau mengeksekusi SQL mengubah perintah meja. Tidak

ada pertanyaan atau aplikasi lain yang duduk di atas Gudang perlu memprogram untuk

mengakomodasi perubahan.Query Lama dan aplikasi terus berjalan tanpa

menghasilkan hasil yang berbeda. Namun dalam model dinormalisasi setiap modifikasi

harus dipertimbangkan dengan hati-hati, karena ketergantungan yang kompleks antara

tabel database.

Pemodelan dimensi (DM) adalah nama dari teknik desain logis sering digunakan untuk gudang data.Hal ini berbeda dari, dan kontras dengan,

entitas-hubungan pemodelan (ER). Artikel ini menunjukkan banyak perbedaan antara kedua teknik dan menarik garis di pasir. DM adalah satu-

satunya teknik yang layak untuk database yang dirancang untuk mendukung permintaan pengguna akhir di gudang data. ER sangat berguna untuk

menangkap transaksi dan fase administrasi data membangun data warehouse, tetapi harus dihindari untuk pengiriman end-user.

DM adalah teknik desain logis yang berusaha untuk menyajikan data dalam kerangka intuitif standar yang memungkinkan untuk akses kinerja tinggi. Hal

Page 4: Materi Kimball

11

ini inheren dimensi, dan menganut disiplin yang menggunakan model relasional dengan beberapa pembatasan penting. Setiap model dimensi

terdiri dari satu meja dengan kunci multi, disebut tabel fakta, dan satu set meja kecil yang disebut tabel dimensi. Setiap tabel dimensi memiliki satu bagian primary key yang sesuai persis dengan salah satu komponen kunci

multipart dalam tabel fakta. (Lihat Gambar 2.) Karakteristik struktur "Bintang-seperti" ini sering disebut bintang bergabung. Bintang Istilah

bergabung tanggal kembali ke hari-hari awal database relasional.

Sebuah tabel fakta, karena memiliki primary key multi bagian yang terdiri dari dua atau lebih kunci asing, selalu mengungkapkan banyak-ke-banyak hubungan. Tabel fakta yang paling berguna juga mengandung satu atau lebih tindakan numerik, atau "fakta," yang terjadi untuk kombinasi tombol yang mendefinisikan setiap record. Dalam Gambar 2, fakta-fakta Dolar Terjual, Unit Terjual, dan Dolar Biaya. Fakta yang paling berguna dalam tabel fakta adalah numerik dan aditif. Aditivitas sangat penting karena aplikasi data warehouse hampir tidak pernah mengambil fakta catatan tabel tunggal, melainkan, mereka mengambil ratusan, ribuan, atau bahkan jutaan catatan ini pada satu waktu, dan satu-satunya hal yang berguna untuk dilakukan dengan begitu banyak catatan adalah untuk menambahkan mereka up.

Tabel dimensi, sebaliknya, yang paling sering mengandung informasi deskriptif tekstual. Atribut dimensi digunakan sebagai sumber sebagian besar kendala yang menarik dalam query data warehouse, dan mereka hampir selalu sumber header baris dalam SQL jawaban set. Dalam Gambar 2, kita membatasi pada produk Lemon rasa melalui atribut Flavor dalam tabel Produk, dan promosi melalui Radio atribut adtype dalam tabel Promosi. Ini harus jelas bahwa kekuatan database pada Gambar 2 sebanding dengan kualitas dan kedalaman tabel dimensi.

Pesona desain database pada Gambar 2 adalah bahwa hal itu sangat dikenali oleh pengguna akhir dalam bisnis tertentu. Saya telah mengamati ratusan kasus di mana pengguna akhir segera setuju bahwa ini adalah "bisnis mereka."

Pembaca yang mengikuti pendekatan Kimball sering dapat melafalkan 4 keputusan penting ketika merancang sebuah model dimensi: mengidentifikasi proses bisnis, biji-bijian, dimensi dan fakta.Sementara ini terdengar sederhana, tim sering tersandung pada langkah pertama. Mereka berjuang untuk mengartikulasikan proses bisnis seperti itu adalah istilah yang tampaknya mengambil makna yang berbeda tergantung pada konteksnya. Karena deklarasi proses bisnis adalah pasak pertama di tanah ketika merancang sebuah model dimensi, kita ingin menghilangkan kebingungan dalam konteks kita.

Pertama, mari kita mulai dengan membahas apa proses bisnis tidak. Ketika merancang sebuah model dimensi, proses bisnis tidak mengacu pada departemen bisnis, organisasi atau fungsi.Demikian juga, tidak harus mengacu pada satu laporan atau analisis spesifik.

Untuk pembuat model dimensi, proses bisnis adalah suatu peristiwa atau kegiatan yang menghasilkan atau mengumpulkan metrik. Metrik ini pengukuran kinerja bagi organisasi. Analis bisnis pasti ingin meneliti dan mengevaluasi metrik ini dengan kombinasi tampaknya tak terbatas dari filter dan kendala. Sebagai pemodel dimensi, itu tugas kita untuk menyajikan

Page 5: Materi Kimball

12

metrik ini dalam struktur yang mudah untuk memahami bahwa merespon dengan cepat untuk pertanyaan tak terduga.

Ketika mengidentifikasi proses bisnis untuk pemodelan dimensi, karakteristik dan pola umum yang sering muncul.

1. Proses bisnis biasanya didukung oleh sistem operasional. Sebagai contoh, proses bisnis penagihan didukung oleh sistem penagihan, juga untuk pembelian, pemesanan, atau menerima proses bisnis.

2. Proses bisnis menghasilkan atau mengumpulkan pengukuran unik dengan granularity yang unik dan dimensi yang digunakan untuk mengukur kinerja organisasi. Kadang-kadang metrik adalah akibat langsung dari proses bisnis. Lain kali, pengukuran adalah derivasi. Apapun, proses bisnis memberikan metrik kinerja yang digunakan oleh berbagai proses analitik.Sebagai contoh, proses bisnis penjualan pemesanan mendukung banyak laporan dan analisis, seperti analisis pelanggan, kinerja penjualan rep, dan sebagainya.

3. Proses bisnis sering dinyatakan sebagai kata kerja dengan dimensi diasosiasikan sebagai nomina menjelaskan siapa, apa, di mana, kapan, mengapa dan bagaimana berhubungan dengan proses. Sebagai contoh, hasil proses bisnis penagihan akan diiris-dan-potong dadu dan dianalisis berdasarkan tanggal, pelanggan, layanan / produk, dan sebagainya.

4. Proses bisnis biasanya dipicu oleh input dan hasil output yang perlu dipantau. Misalnya, proposal yang diterima adalah masukan untuk proses pemesanan yang menghasilkan order penjualan dan metrik terkait. Dalam skenario ini, proses bisnis penjualan pemesanan, Anda akan memiliki tabel fakta pesanan dengan pesanan penjualan sebagai dimensi merosot potensial dan jumlah pesanan dan dianggap sebagai fakta. Cobalah untuk membayangkan aliran umum dari input ke dalam proses bisnis, sehingga metrik output. Di kebanyakan organisasi, ada serangkaian proses bisnis di mana output dari satu proses menjadi input ke yang berikutnya. Dalam bahasa pembuat model dimensi, proses bisnis ini akan menghasilkan serangkaian tabel fakta.

5. Analis kadang-kadang ingin mengebor di seluruh proses bisnis, melihat hasil dari satu proses di samping hasil dari yang lain. Pengeboran seluruh proses ini tentu layak jika dimensi umum untuk kedua proses yang sesuai.

BAB 2

LANDASAN TEORI

2.1 Teori-Teori Umum

2.1.1 Pengertian Data

Page 6: Materi Kimball

13

Menurut Turban dan Rainer (2009:6), data adalah fakta

mentah atau deskripsi dasar dari benda, peristiwa, aktivitas, dan

transaksi yang didapatkan, direkam, disimpan, diklasifikasi tetapi belum

terorganisir untuk menyampaikan suatu arti spesifik.

Menurut Williams dan Sawyer (2011:25), data data terdiri dari

fakta-fakta, dan gambaran mentah yang akan diproses menjadi

informasi. Data penting karena pengguna memerlukan data untuk

membuat informasi yang berguna.

Menurut Indrajani (2011:48), data adalah fakta mentah tentang

orang, tempat, kejadian, dan apapun yang penting bagi perusahaan, di

mana data itu sendiri tidak memiliki arti dan data juga adalah fakta-

fakta atau observasi yang mentah, biasanya mengenai kejadian atau

transaksi bisnis.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data adalah fakta atau observasi

mentah yang biasanya menggambarkan benda, peristiwa, aktivitas, dan

transaksi yang akan diproses menjadi informasi.

2.1.2 Pengertian Informasi

Menurut Turban dan Rainer (2009:6), informasi adalah suatu

koleksi fakta (data) yang telah terorganisir dengan beberapa cara

sehingga memberikan suatu arti yang dipahami oleh penerima.

Page 7: Materi Kimball

14

Menurut Laudon dan Laudon (2010:14), informasi adalah data

yang telah disusun ke dalam bentuk yang memiliki arti dan berguna

bagi manusia.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian informasi adalah data yang telah

terorganisir atau disusun dalam beberapa cara sehingga memberikan

suatu arti yang mudah dipahami dan berguna bagi manusia.

2.1.3 Pengertian Sistem

Menurut O’Brien dan Marakas (2011:26), sistem didefinisikan

sebagai sekumpulan komponen yang saling terkait, dengan batas yang

jelas, bekerja sama untuk mencapai suatu serangkaian tujuan umum

dengan menerima input dan menghasilkan output dalam proses

transformasi yang terorganisir.

Menurut William dan Sawyer (2011:492), sistem adalah

kumpulan dari komponen-komponen yang berhubungan dan yang

saling berinteraksi untuk melakukan suatu tugas untuk mencapai tujuan.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian sistem adalah sekumpulan

komponen yang saling terkait dan saling berinteraksi dengan batas yang

jelas untuk melakukan suatu tugas guna mencapai suatu tujuan.

2.1.4 Pengertian Sistem Informasi

Menurut O’Brien dan Marakas (2011:4), Sistem Informasi (IS)

adalah kombinasi yang terorganisir dari orang, perangkat keras,

perangkat lunak, jaringan komunikasi, sumber daya data, dan kebijakan

Page 8: Materi Kimball

15

dan prosedur yang menyimpan, mengambil, mengubah, dan

mendiseminasi informasi dalam sebuah organisasi. Orang-orang

bergantung pada sistem informasi modern untuk berkomunikasi dengan

satu sama lain menggunakan berbagai perangkat keras (hardware),

petunjuk prosedur pengolahan informasi (Perangkat lunak), jaringan

komunikasi, dan data yang disimpan (data sumber daya).

Menurut O’Brien dan Marakas (2011:6), ada tiga peran utama

dari aplikasi bisnis yang sistem informasi dapat lakukan dari sebuah

business enterprise, yaitu:

1. Mendukung proses bisnis dan operasi (support of business processes

and operations).

2. Mendukung pengambilan keputusan oleh karyawan dan manager

(support of decision making by employees and managers).

3. Mendukung strategi untuk keunggulan kompetitif (support of

strategies for competitive advantage).

Gambar 2.1 Tiga Peran Utama dari Aplikasi Bisnis Sistem

Informasi

Page 9: Materi Kimball

16

(Sumber: O’Brien dan Marakas, 2011, p6)

2.1.5 Pengertian Database

Menurut Indrajani (2011:48), Database adalah sebuah

kumpulan data yang saling berhubungan secara logis, dan merupakan

sebuah penjelasan dari data tersebut, yang didesain untuk menemukan

data yang dibutuhkan oleh sebuah organisasi.

Menurut Connolly dan Begg (2010:65), Database adalah

kumpulan data secara logis terkait, dan deskripsi dari data ini, didesain

untuk memenuhi kebutuhan informasi sebuah organisasi. Database

adalah tunggal, tempat penyimpanan data yang besar yang dapat

digunakan secara bersama-sama oleh banyak departemen dan pengguna.

Menurut Cahyono (2009:83), dalam jurnalnya mengatakan

bahwa database adalah salah satu komponen sistem informasi yang

mempunyai posisi yang sangat menentukan dalam menunjang

keberhasilan suatu sistem informasi.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian database adalah kumpulan data

secara logis atau salah satu komponen yang saling berhubungan dan

deskripsi dari data ini didesain untuk memenuhi kebutuhan informasi

dan menunjang keberhasilan suatu sistem informasi dalam sebuah

organisasi.

2.1.6 DBMS (Database Management System)

Page 10: Materi Kimball

17

Menurut Sreevani dan Rao (2010:56), dalam jurnalnya

mengatakan bahwa Database Management System (DBMS) tidak dapat

memberikan informasi yang diperlukan ketika datanya tidak konsisten.

2.1.6.1 Pengertian DBMS (Database Management System)

Menurut Connolly dan Begg (2010:66), Database

Management System adalah sebuah sistem software yang

memungkinkan pengguna untuk mendefinisikan, membuat,

memlihara, dan mengontrol akses ke database.

2.1.6.2 Keuntungan DBMS (Database Management System)

Keuntungan DBMS yang diuraikan Connolly dan

Begg (2010:77), adalah sebagai berikut:

1. Mengontrol pengulangan data.

2. Data yang konsisten.

3. Dapat memperoleh informasi yang lebih banyak dan

jumlah data yang sama.

4. Pemakaian data secara bersama-sama.

5. Meningkatkan integritas data.

6. Meningkatkan keamanan.

7. Penetapan standarisasi.

8. Perbandingan skala ekonomi.

9. Menyeimbangi konflik kebutuhan.

10. Meningkatkan akses dan respon dari data.

11. Meningkatkan produktifitas.

12. Meningkatkan pemeliharaan data melalui data independen.

13. Meningkatkan konkurensi.

Page 11: Materi Kimball

18

14. Meningkatkan layanan backup dan recovery.

2.1.6.3 Kekurangan DBMS (Database Management System)

Kekurangan dari DBMS menurut Connolly dan Begg

(2010:80), adalah sebagai berikut:

1. Kompleksitas.

2. Ukuran yang besar karena kompleksitas yang terjadi.

3. Biaya DBMS yang beragam tergantung pada lingkungan

dan fungsi yang disediakan.

4. Tambahan biaya untuk hardware.

5. Biaya konversi yang dibutuhkan untuk penggunaan DBMS

yang baru.

6. Peforma kinerja menurun.

7. Tingkat kegagalan yang lebih besar.

2.1.6.4 Fasilitas DBMS (Database Management System)

Menurut Connolly dan Begg (2010:66), fasilitas-

fasilitas yang disediakan oleh DBMS adalah, sebagai berikut:

1. DDL (Data Definition Language) adalah suatu bahasa

yang memperbolehkan DBA (Database Administrator)

ataupun user untuk menentukan tipe, struktur, dan batasan

keamanan data yang akan disimpan pada database.

2. DML (Data Manipulation Language) adalah suatu bahasa

yang memiliki fasilitas untuk mengoperasikan data yang

ada dalam database. Misalnya insert, edit, delete, dan

update.

Page 12: Materi Kimball

19

3. SQL (Structured Query Language) adalah suatu bahasa

yang memberikan layanan akses terhadap data. Contoh

dari layanan akses yang diberikan adalah :

Sistem keamanan, yang mecegah pengguna yang tidak

memiliki hak untuk mengakses database.

Sistem integritas, yang mempertahankan konsistensi

data yang tersimpan.

Sistem kontrol konkurensi, yang memungkinkan untuk

mengakses database secara bersama-sama.

2.1.7 Pengertian Activity Diagram

Menurut Satzinger et al (2010:141), Activity diagram

merupakan sebuah tipe dari diagram workflow yang menggambarkan

tentang aktivitas dari pengguna ketika melakukan setiap kegiatan dan

aliran sekuensial.

Page 13: Materi Kimball

20

Gambar 2.2 Activity Diagram

(Sumber: Satzinger et al, 2010, p143)

2.1.8 Pengertian ERD (Entity Relationship Diagram)

Menurut Inmon (2005:496), Entity Relationship Diagram

(ERD) adalah diagram yang menunjukkan semua entitas dalam cakupan

integrasi dan hubungan langsung antar entitas tersebut.

2.1.9 Pengertian Data Mart

Menurut Scheps (2008:208) Data Mart dapat menerima data

dari data warehouse, atau secara langsung dari sistem transaksional.

Data mart dapat menampilkan transformasi dan kalkulasi pada data

yang sama dengan data warehouse. Tapi data mart selalu terbatas pada

ruang lingkupnya dan tujuan bisnis.

Menurut Turban, Sharda, Delen dan King (2011:53), data

mart adalah subset dari data warehouse dan berfokus pada topik

tertentu atau departemen, yang biasanya terdiri dari suatu subyek

(misalnya pemasaran, operasi). Terdapat dua jenis data mart, antara

lain:

Dependent Data Mart, adalah sebuah subset yang dibuat secara

langsung dari data warehouse. Memiliki keuntungan dari

Page 14: Materi Kimball

21

penggunaan data model yang konsisten dan menyediakan kualitas

data.

Independent Data Mart, adalah data mart yang mendukung konsep

dari single enterprise-wide data model, tetapi data warehouse harus

dibuat terlebih dahulu.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data mart adalah subset dari data

warehouse atau data secara langsung dari sistem transaksional yang

berfokus pada topik tertentu atau departemen yang biasanya terdiri dari

suatu subyek (misalnya pemasaran).

2.1.10 Data Warehouse

2.1.10.1 Pengertian Data Warehouse

Menurut Turban, Sharda, Delen, dan King (2011:52),

data warehouse adalah kumpulan data yang dihasilkan untuk

mendukung pengambilan keputusan. Data warehouse juga

merupakan tempat penyimpanan data saat ini dan data historis

dari kepentingan manager diseluruh organisasi.

Menurut Laudon dan Laudon (2010:233), data

warehouse adalah database yang menyimpan data penting saat

ini dan historis dari kebutuhan informasi untuk manager

dalam perusahaan.

Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian data

warehouse adalah kumpulan data atau database yang

digunakan sebagai tempat penyimpanan data saat ini dan data

Page 15: Materi Kimball

22

historis dari kebutuhan informasi untuk manager diseluruh

organisasi untuk mendukung pengambilan keputusan.

2.1.10.2 Karakteristik Data Warehouse

Karakteristik data warehouse terdiri dari subject

oriented, integrated, time variant, dan non volatile.

Karakteristik Data Warehouse menurut Turban, Sharda,

Delen, dan King (2011:52), antara lain:

1. Subject Oriented

Data tersusun berdasarkan subyek yang detil, seperti sales,

product, atau customers, hanya mengandung informasi

yang relevan untuk mengambil keputusan. Subject

Oriented tidak hanya dapat membantu user untuk

menentukan bagaimana proses bisinis mereka berjalan

tetapi juga membantu dalam menentukan mengapa proses

bisnis mereka berjalan.

2. Integrated

Integrasi berhubungan erat dengan subject orientation.

Data warehouse harus menempatkan data dari sumber

yang berbeda ke dalam format yang konsisten untuk

melakukannya, mereka harus menghadapi konflik

penamaan dan perbedaan di antara satuan ukuran.

3. Time Variant

Page 16: Materi Kimball

23

Data warehouse menyimpan data historical. Data yang

tidak selalu memberikan status. Mereka mendeteksi tren,

penyimpangan dan hubungan jangka panjang untuk

melakukan peramalan dan perbandingan, yang mengarah

kepada pengambilan keputusan. Setiap data warehouse

mempunyai kualitas yang sementara. Waktu adalah satu-

satunya dimensi yang penting yang semua data warehouse

harus bisa mendukung.

4. Nonvolatile

Setelah data dimasukan ke dalam data warehouse , user

tidak bisa mengganti atau meng-update data. Data yang

lama dibuang dan perubahan data disimpan sebagai data

yang baru.

2.1.10.3 Lifecycle Diagram

Menurut Kimball dan Ross (2010:97), Lifecycle

Diagram adalah roadmap yang menggambarkan secara

keseluruhan dari urutan dari tugas yang dibutuhkan untuk

desain yang efektif, pengembangan, dan penyebaran.

Page 17: Materi Kimball

24

Gambar 2.3 Lifecycle Diagram

(Sumber: Kimball dan Ross, 2010, p97)

2.1.10.3.1 Program/Project Planning and Management

Menurut Kimball dan Ross (2010:98), Kotak pertama

dari roadmap adalah berfokus pada peluncuran program atau

proyek, termasuk ruang lingkup, pembenaran, dan susunan

karyawan. Keseluruhan dari lifecycle, program dan tugas proyek

manajemen memastikan aktivitas tetap pada jalur yang benar.

2.1.10.3.2 Business Requirements

Menurut Kimball dan Ross (2010:98), Memilih

kebutuhan bisnis adalah tugas utama dalam Kimball Lifecycle

karena temuan ini mendorong sebagian besar keputusan

upstream dan downstream. Kebutuhan dikumpulkan untuk

menentukan faktor kunci yang mempengaruhi bisnis dengan

berfokus pada apa yang dilakukan oleh pengguna bisnis (atau

apa yang akan dilakukan di masa mendatang), daripada bertanya

Page 18: Materi Kimball

25

“apa yang anda inginkan dalam data warehouse?” Kesempatan

utama di seluruh perusahaan diidentifikasi, diberikan prioritas

berdasarkan pada nilai bisnis dan kelayakan, kemudian rincian

kebutuhan dikumpulkan untuk iterasi pertama dari

pembangunan sistem DW/BI.

2.1.10.3.3 Technology Track

Menurut Kimball dan Ross (2010:98), Lingkungan

Data Warehouse atau Business Intelligence berintegrasi dalam

berbagai teknologi, menyimpan data, dan metadata yang terkait.

Jalur teknologi dimulai dengan mendesain sistem arsitektur

(Technical Architecture Design) untuk membuat daftar

kemampuan yang dibutuhkan, kemudian dilanjutkan dengan

pemilihan dan pemasangan produk yang memuaskan kebutuhan-

kebutuhan arsitektur (Product Selection & Installation).

2.1.10.3.4 Data Track

Menurut Kimball dan Ross (2010:98), data track

dimulai dengan merancang sebuah target dari model

dimensional (Dimensional Modeling) dalam memenuhi

kebutuhan bisnis, dengan tetap mempertimbangkan data yang

sebenarnya.

Dibawah ini terdapat 9 tahapan (nine step

methodology) untuk merancang dimensional modeling menurut

Kimball dan Ross (2010:210), adalah sebagai berikut:

1. Choose The Process (Pemilihan Proses)

Page 19: Materi Kimball

26

Menurut Kimball dan Ross (2010:211), Dalam

tahap awal ini, proses yang dipilih lebih menunjuk pada

subyek yang ada dari sebuah bagian data mart. Data mart

yang akan dibangun harus tepat waktu yang berdasarkan

dengan anggapan dari menjawab semua pertanyaan bisnis

yang banyak diutarakan atau yang paling penting. Contoh

pemilihan terbaik untuk data mart adalah yang berhubungan

dengan sales, misalnya property sales, property leasing,

property advertising.

2. Choose The Grain (Pilih Grain)

Menurut Kimball dan Ross (2010:211), Dalam

tahap kedua ini, pemilihan grain berarti menentukan secara

tepat apa yang direpresentasikan oleh record pada tabel

fakta. Ketika dalam memilih grain untuk tabel fakta, maka

kita baru dapat mengidentifikasi dimensi dari tabel fakta

tersebut. Keputusan dalam pemilihan grain untuk tabel fakta

juga dapat menentukan grain untuk masing-masing tabel

dimensi. Contohnya, jika sumber dari sebuah tabel fakta

property sales adalah property sales individual maka sumber

dari sebuah dimensi pelanggan berisi rincian pelanggan yang

membeli property tersebut.

3. Identify and Conform The Dimensions (Identifikasi dan

Penyesuaian Dimensi)

Menurut Kimball dan Ross (2010:211), Dalam

tahap ketiga ini, dimensi membentuk konteks untuk bertanya

Page 20: Materi Kimball

27

tentang fakta di dalam tabel fakta. Kumpulan dimensi yang

baik membuat data mart mudah dimengerti dan digunakan.

Jika ada dimensi yang digunakan pada dua data mart, maka

dimensi tersebut harus sama atau secara matematis salah

satunya harus merupakan bagian dari yang lainnya.

Hanya dengan cara ini, maka dua data mart dapat

saling berbagi satu atau lebih dimensi pada aplikasi yang

sama. Ketika dimensi digunakan pada lebih dari satu data

mart, maka data mart mengarah sebagai conformed.

Contohnya, dimensi dokter mendeskripsikan atribut ID,

nama dokter, alamat, kota, no telepon.

Set dimensi yang dibangun dengan baik, memberikan

kemudahan untuk memahami dan menggunakan data

mart.

Dimensi tersebut penting untuk menggambarkan fakta-

fakta yang terdapat pada tabel fakta.

Contohnya, setiap data dokter pada tabel dimensi dokter

dilengkapi dengan id_dokter, no_dokter, gelar_dokter,

tempat_tinggal dan lain sebagainya.

Jika ada dimensi yang muncul pada dua data mart, kedua

data mart tersebut harus berdimensi sama, atau paling

tidak salah satunya berupa subset matematis dari yang

lainnya.

Jika sebuah dimensi digunakan pada dua data mart atau

lebih, dan dimensi ini tidak disinkronisasi, maka

Page 21: Materi Kimball

28

keseluruhan data warehouse akan gagal, karena dua data

mart tidak dapat digunakan secara bersama-sama.

4. Choose The Fact (Pemilihan Fakta)

Menurut Kimball dan Ross (2010:213), Dalam

tahap keempat ini, Grain yang berasal dari tabel fakta

digunakan untuk menentukan fakta yang dapat digunakan.

Misalnya, grain dari tabel fakta adalah setiap property,

kemudian semua fakta numerik harus menunjuk pada

penjualan ini. Fakta-fakta tersebut harus numerik dapat dapat

ditambah.

Sumber dari sebuah tabel fakta menentukan fakta mana

yang dapat digunakan dalam data mart.

Semua fakta harus diekspresikan pada tingkat yang telah

ditentukan oleh sumber.

5. Store Precalculations in The Fact Table (Penyimpan Pre-

kalkulasi di Tabel Fakta)

Menurut Kimball dan Ross (2010:213), Dalam

tahap kelima ini, setelah melakukan pemilihan fakta-fakta,

maka akan dilakukan pengkajian ulang untuk menentukan

apakah ada fakta-fakta yang dapat diterapkan untuk pre-

calculation atau kalkulasi awal. Contohnya, kebutuhan untuk

penyimapan pre-calculation muncul ketika fakta berisi

pernyataan untung dan rugi. Situasi ini akan meningkat

ketika tabel fakta didasarkan pada invoice atau sales. Contoh

Page 22: Materi Kimball

29

lainnya adalah saat membandingkan keuntungan dan

kerugian.

6. Round Out The Dimension Tables (Memastikan

Tabel Dimensi)

Menurut Kimball dan Ross (2010:214), Dalam

tahap keenam ini, untuk memastikan tabel dimensi dengan

menambahkan gambaran teks terhadap dimensi yang

memungkinkan. Gambaran teks harus mudah dimengerti dan

digunakan oleh user. Kegunaan suatu data mart ditentukan

oleh lingkup dan atribut tabel dimensi.

Kita menambahkan gambaran teks atau keterangan

selengkap-lengkapnya pada tabel dimensi.

Keterangannya harus bersifat intuitif dan mudah

dipahami oleh user.

7. Duration of The Database (Durasi Database)

Menurut Kimball dan Ross (2010:215), Dalam

tahap ketujuh ini, durasi tersebut digunakan untuk mengukur

sejauh mana tabel fakta dapat melihat ke beberapa tahun ke

belakang. Banyak perusahaan yang ingin melihat apa saja

yang terjadi pada periode waktu yang sama dalam satu

tahun, dua tahun, atau tiga tahun sebelumnnya. Untuk jenis

perusahaan tertentu, mereka ingin dapat melihat data hingga

lima tahun ke belakang. Tabel fakta yang besar

menimbulkan dua persoalan. Pertama, semakin tua umur

data, akan muncul masalah pembacaan dan interpretasi file

Page 23: Materi Kimball

30

lama. Kedua, menimbulkan kemungkinan versi dimensi

lama digunakan, bukan versi terbarunya.

8. Determine The Need to Track Slowly Changing

Dimensions (Determinasi yang Perlu untuk Lacak

Perubahan dari Dimensi secara Perlahan)

Menurut Kimball dan Ross (2010:215), Dalam

tahap kedelapan ini, masalah perubahan dimensi secara

perlahan memiliki arti, contoh: deskripsi yang tepat pada old

client dan old branch harus digunakan sebagai history

transaksi sebelumnya. Perubahan dimensi ini dapat berubah

secara perlahan seiring berjalannya waktu dan kebutuhan.

Terdapat tiga tipe dasar perubahan secara perlahan untuk

mengamati perubahan dari dimensi pada dimensional table,

yaitu:

Tipe 1, Atribut dimensi yang diubah dituliskan ulang.

Tipe 2, Atribut dimensi yang diubah menyebabkan

pembentukan record yang baru.

Tipe 3, Atribut dimensi yang diubah mengakibatkan

sebuah atribut atau kolom alternative dibuat, jadi antara

record yang lama dan baru diakses secara bersama-sama.

9. Decide The Physical Design (Menentukan Perancangan

Fisik)

Menurut Kimball dan Ross (2010:215), Dalam

tahap terakhir ini, dapat mempertimbangkan pengaruh dari

rancangan fisik, seperti penyortiran urutan tabel fakta pada

Page 24: Materi Kimball

31

disk dan keberadaan dari penyimpanan awal ringkasan

(summaries) atau penjumlahan. Selain itu, masalah seperti

administrasi, summaries, kinerja indeks, dan keamanan juga

merupakan faktor yang harus diperhatikan.

Setelah itu, model dimensional diubah menjadi

kedalam rancangan fisik (Physical Design) saat strategi

penyesuaian kinerja dipertimbangkan, kemudian rancangan

dan pembangunan diekstrak, transformasi, dan load (ETL

Design and Development) ditangani.

2.1.10.3.5 Business Intelligence Track

Menurut Kimball dan Ross (2010:99), sementara

beberapa anggota proyek berkonsentrasi pada teknologi dan

data, anggota lain berfokus untuk mengidentifikasi dan

membangun aplikasi Business Intelligence dengan cakupan yang

besar, termasuk laporan-laporan standar query berparameter,

dashboards, scorecards, model-model analisis, dan aplikasi data

mining, bersamaan dengan navigasi interface yang

berhubungan.

2.1.10.3.6 Deployment, Maintenance, and Growth

Menurut Kimball dan Ross (2010:99), tiga lifecycle

track berada pada tahap deployment, membawa teknologi, data,

dan aplikasi Business Intelligence (BI) bersama-sama.

Deployment iteration memasuki tahap pemeliharaan, sedangkan

pertumbuhan ditujukan untuk perencanaan proyek dalam iterasi

Page 25: Materi Kimball

32

selanjutnya dari sistem data warehouse atau Business

Intelligence (BI).

2.1.11 Dimensionality Modelling

Menurut Connolly dan Begg (2010:1227), Dimensionality

Modeling adalah sebuah teknik desain logika yang bertujuan untuk

menampilkan data dalam bentuk standar, intuitif yang memungkinkan

akses cepat.

Dimensionality Modeling menggunakan konsep model Entity-

Relationship (ER) dengan beberapa batasan penting. Setiap model

dimensi terdiri dari satu tabel dengan satu composite primary key yang

disebut fact table dan memiliki kumpulan dari tabel yang lebih

sederhana yang disebut tabel dimensi (Dimension Table). Tiap tabel

dimensi memiliki primary key (non composite) yang akan

berkorespondensi tepat satu dengan komponen pada composite key

dalam fact table.

2.1.11.1 Star Schema

Menurut Connolly dan Begg (2010:1227), star

schema adalah model data dimensional yang mempunyai fact

table di bagian tengah, dikelilingi oleh tabel dimensi yang

terdiri dari data reference (yang bisa di-denormalized). Star

schema mengambil karakteristik dari factual data yang di-

generate oleh event yang terjadi dimasa lampau.

Page 26: Materi Kimball

33

Gambar 2.4 Contoh Star Schema

(Sumber: Connolly dan Begg, 2010, p1228)

2.1.11.2 Snowflake

Menurut Connolly dan Begg (2010:1229), Snowflake

adalah jenis dari star schema dimana tabel dimensinya tidak

mengandung denormalisasi.

Gambar 2.5 Contoh Snowflake

(Sumber: Connolly dan Begg, 2010, p1229)

Page 27: Materi Kimball

34

2.1.11.3 Starflake

Menurut Connolly dan Begg (2010:1230), Starflake

adalah struktur gabungan yang mengandung campuran dari

star schema dan snowflake.

Berdasarkan dari kutipan pengertian ketiga schema diatas,

dapat disimpulkan bahwa tabel fakta pada star schema dikelilingi oleh

banyak dimensi dengan hubungan one-to-many, sedangkan pada

snowflake tabel fakta terhubung banyak ke tabel dimensi, yang dimana

dimensi tersebut dapat dihubungkan ke tabel dimensi lain, sedangkan

starflake schema merupakan gabungan antara star schema dengan

snowflake.

2.1.12 Extract, Transform, Loading Data (ETL)

Menurut Rainardi (2008), ETL adalah suatu proses mengambil

dan mengirim data dari sumber data ke data warehouse. Dalam proses

pengambilan data, data harus bersih agar didapat kualitas data yang

baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang

tidak eksis lagi, ada beberapa data yang null, dan lain sebagainya.

Pendekatan tradisional pada proses ETL mengambil data dari data

sumber, meletakkan pada staging area, dan kemudian mentransformasi

dan meng-load ke data warehouse.

Proses ETL (Extract, Transform, Loading) terbagi menjadi 3,

yaitu:

1. Extract

Extract adalah proses penentuan source yang akan digunakan

sebagai sumber data bagi data warehouse. Di sini kita bias

Page 28: Materi Kimball

35

menentukan data apa saja yang diperlukan, tabel apa saja yang

dijadikan sumber. Langkah pertama pada proses ETL adalah

mengekstrak data dari sumber-sumber data. Kebanyakan proyek

data warehouse menggabungkan data dari sumber-sumber yang

berbeda. Pada hakekatnya, proses ektraksi adalah proses penguraian,

pembersihan dari data diekstrak untuk mendapatkan struktur atau

pola data yang diharapkan.

2. Transform

Setelah source ditentukan, maka data tersebut diubah agar sesuai

dengan standard yang ada pada data warehouse. Tahapan

transformasi menggunakan serangkaian aturan atau fungsi untuk

mengekstrak data dari sumber dan selanjutnya dimasukkan dalam

data warehouse. Dibawah ini hal-hal yang dilakukan dalam tahapan

transformasi, yaitu:

a. Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam

data warehouse.

b. Menterjemahkan nilai-nilai yang berupa kode, misalnya sumber

database menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk

perempuan, tetapi data warehouse yang telah ada menyimpan A

untuk dewasa dan C untuk anak-anak, maka ini disebut juga

dengan automated data cleaning (tidak ada pembersihan secara

manual yang ditunjukkan selama proses ETL).

c. Melakukan perhitungan nilai-nilai baru seperti total = h_jual *

qty.

Page 29: Materi Kimball

36

d. Mengkodekan nilai-nilai ke dalam bentuk bebas seperti

memetakan yang umurnya “65” ke kategori “D”.

e. Membuat ringkasan dari sekumpulan baris data seperti total

penjualan untuk setiap toko atau setiap bagian.

f. Menggabungkan data secara bersama-sama dari berbagai

sumber.

3. Load

Load adalah proses memasukkan data-data yang sudah di

transformasi ke dalam data warehouse untuk disimpan sebagai

summary atau archieve. Fase load merupakan tahapan yang

berfungsi untuk memasukkan data ke dalam target akhir, yang

biasanya ke dalam suatu data warehouse. Jangka waktu proses ini

tergantung pada kebutuhan organisasi. Beberapa data warehouse

dapat setiap minggu menulis keseluruhan informasi yang ada secara

kumulatif, data diubah, sementara data warehouse yang lain satau

bagian lain dari data warehouse yang sama dapat menambahkan

data baru dalam suatu bentuk historical, contohnya setiap jam.

Waktu dan jangkauan untuk mengganti atau menambah data

tergantung dari perancangan data warehouse pada waktu

menganalisis keperluan informasi.

2.1.13 Pengertian On-line Transaction Processing

Menurut Stair dan Reynolds (2010), OLTP adalah suatu

bentuk pengolahan data dimana setiap transaksi diproses dengan

segera, tanpa penundaan mengumpulkan transaksi ke dalam batch.

Memiliki karakteristik dengan jumlah data yang besar namun transaksi

Page 30: Materi Kimball

37

yang dilakukan cukup sederhana seperti insert, update, dan delete. Hal

utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah

melakukan query secara cepat dan mudah untuk diperbaiki dan dapat

diakses.

2.1.14 OLAP (Online Analytical Processing)

2.1.14.1 Pengertian OLAP (Online Analytical Processing)

Menurut Turban, Sharda, Delen, dan King (2011:77)

struktur operasional utama dalam OLAP didasarkan pada

konsep yang disebut kubus (cube). Kubus (cube) didalam

OLAP adalah struktur data multidimensional (actual atau

virtual) yang memungkinkan analisis data yang cepat. Juga

dapat didefinisikan sebagai kemampuan dari memanipulasi

dan menganalisis data secara efisien dari berbagai perspektif.

Susunan data ke dalam kubus bertujuan untuk mengatasi

keterbatasan database relational. Database relational tidak

cocok untuk analisis yang cepat dan dekat dari sejumlah besar

data. Sebaliknya, mereka lebih cocok untuk memanipulasi

record (menambahkan, menghapus, dan memperbarui data)

yang mewakili serangkaian transaksi.

Menurut Scheps (2008:68) Online Analytical

Processing adalah sebuah konsep data multidimensional

dengan konsep mentualisasi data transaksional perusahaan.

Bukan hanya mengagregasi data, OLAP memberikan

kemampuan pada sistem BI untuk melihat data dengan cara

baru.

Page 31: Materi Kimball

38

Gambar 2.6 Online Analytical Processing

(Sumber: Scheps, 2008, p69)

Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian Online

Analytical Processing (OLAP) adalah sebuah konsep data

multidimensional yang mendukung kegiatan mulai dari self

service reporting dan analisis data yang cepat dan efisien dari

berbagai perspektif.

2.1.14.2 Arsitektur OLAP

Menurut Scheps (2008:77), Sistem OLAP

mempunyai dua kategori, yaitu:

OLAP Cube

Di lingkungan OLAP, cube adalah penyimpan

data terspesialisasi dirancang secara spesifik untuk

Page 32: Materi Kimball

39

menangani data ringkasan multidimensional

(multidimentional summary data). Data cube disimpan di

cell dan strukturnya seperti 3D spreadsheet.

Gambar 2.7 Cube

(Sumber: Scheps, 2008, p77)

OLAP Access Tools

Lingkungan client yang memungkinkan

pengguna untuk memanipulasi data cube dan akhirnya

menghasilkan Business Intelligence yang berarti dari

berbagai sudut pandang dan dapat lebih dari satu sudut

pandang.

2.1.15 Perbedaan OLAP dan OLTP

Menurut Vercellis (2009:49) terdapat perbedaan antara OLAP

dan OLTP, antara lain dapat dilihat pada tabel dibawah ini:

Page 33: Materi Kimball

40

Tabel 2.1 Perbedaan antara OLTP dan OLAP

(Sumber: Vercellis, 2009, p49)

Karakteristik OLAP OLTP

Volatilitas Data statis Data dinamis

Waktu Data saat ini dan historis Data saat ini

Dimensi waktu Eksplisit dan varian Implisit dan terkini

Granuality Data agregasi dan

konsolidasi

Data yang detil

Update Periodic dan regular Berlanjut dan tidak

regular

Aktivitas Tidak dapat diprediksi Berulang kali

Fleksibilitas Tinggi Rendah

Kinerja Rendah untuk query yang

kompleks

Tinggi, satu detik per

query

User Knowledge workers Karyawan

Fungsi Analisis Operasional

Tujuan

penggunaan

Query kompleks dan

pendukung keputusan

Transaksi

Prioritas Fleksibilitas tinggi Kinerja tinggi

Metric Respon efektif Rata-rata transaksi

Ukuran data Gigabyte hingga terabyte Megabyte hingga

gigabyte

Page 34: Materi Kimball

41

2.1.16 Pengertian Metadata

Menurut Kimball dan Ross (2010:566), Metadata adalah

semua informasi dalam lingkungan data warehouse yang bukan

merupakan data itu sendiri. Metadata ini hampir sama dengan sebuah

insiklopedia untuk data warehouse.

2.1.17 Data Mining

Menurut Han dan Kamber (2011:36), data mining adalah

proses menemukan pola yang menarik dan pengetahuan dari data yang

berjumlah besar.

Menurut Vercellis (2009:77), data mining adalah aktivitas

yang menggambarkan sebuah proses analisis yang terjadi secara iteratif

pada database yang besar, dengan tujuan mengekstrak informasi dan

knowledge yang akurat dan berpotensial berguna untuk knowledge

workers yang berhubungan dengan pengambilan keputusan dan

pemecahan masalah.

Aktivitas data mining dapat dipisahkan menjadi 2,

berdasarkan tujuan dari analisis yaitu:

Interpretasi

Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan

menghasilkannya dalam bentuk aturan dan kriteria yang dapat

dimengerti eksekutif.

Prediksi

Tujuan dari prediksi adalah untuk mengestimasikan kejadian-

kejadian yang terjadi di masa depan. Contohnya, perusahaan retail

Page 35: Materi Kimball

42

dapat menggunakan data mining untuk memprediksikan penjualan

dari produk mereka di masa depan dengan menggunakan data-data

yang telah didapatkan dari beberapa minggu.

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data mining adalah sebuah proses

analisis yang terjadi secara interatif dan menemukan pola yang menarik,

serta pengetahuan dari data yang berjumlah besar.

2.1.18 Pengertian Clustering

Menurut Han dan Kamber (2011), Clustering adalah proses

pengelompokkan kumpulan data menjadi beberapa kelompok sehingga

objek di dalam satu kelompok memiliki banyak kesamaan dan memiliki

banyak perbedaan dengan objek dikelompok lain. Perbedaan dan

persamaannya biasanya berdasarkan nilai atribut dari objek tersebut dan

dapat juga berupa perhitungan jarak. Clustering sendiri juga disebut

Unsupervised Classification, karena clustering lebih bersifat untuk

dipelajari dan diperhatikan. Cluster analysis merupakan proses partisi

satu set objek data ke dalam himpunan bagian. Setiap himpunan bagian

adalah cluster, sehingga objek yang di dalam cluster mirip satu sama

dengan yang lainnya, dan mempunyai perbedaan dengan objek dari

cluster yang lain. Partisi tidak dilakukan dengan manual tetapi dengan

algoritma clustering. Oleh karena itu, Clustering sangat berguna dan

bisa menemukan group yang tidak dikenal dalam data.

Page 36: Materi Kimball

43

2.1.19 Business Intelligence

2.1.19.1 Pengertian Business Intelligence

Menurut Scheps (2008:11), Business Intelligence

adalah segala aktivitas, tool, atau proses yang digunakan untuk

mendapatkan informasi yang terbaik untuk mendukung proses

pembuatan keputusan.

Menurut Vercellis (2009:3), Business Intelligence

adalah kumpulan model metematika dan metodologi analisa

yang secara sistematik menghasilkan data untuk menghasilkan

suatu informasi dan pengetahuan yang berguna untuk

mendukung proses pengambilan keputusan yang kompleks.

Tujuan utama dari business intelligence adalah untuk

menyediakan alat dan metodologi bagi knowledge workers

untuk membuat keputusan yang efektif dan tepat waktu.

Keputusan yang efektif

Aplikasi dari metode analisa yang butuh ketelitian tinggi

membuat pengambil keputusan harus mengandalkan

informasi dan pengetahuan mana yang dapat diandalkan.

Hasilnya, mereka dapat membuat keputusan yang lebih

baik dan membuat suatu perencanaan yang dapat membuat

tujuan mereka tercapai dengan efektif.

Keputusan yang tepat waktu

Perusahaan beroperasi dalam lingkungan ekonomi yang

berkarakterisasi oleh tingkatan kompetisi dan dinamisme

yang tinggi. Konsekuensinya, kemampuan untuk bereaksi

Page 37: Materi Kimball

44

dengan pesaing dan kondisi pasar baru merupakan faktor

penting dalam kesuksesan ataupun kelangsungan hidup

perusahaan.

Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian Business

Intelligence (BI) adalah kumpulan aktivitas, tool, atau proses

yang digunakan, dan metodologi analisa yang secara

sistematis dapat menghasilkan suatu informasi dan

pengetahuan yang berguna untuk mendukung proses

pembuatan keputusan yang kompleks.

2.1.19.2 Arsitektur Business Intelligence

Menurut Vercellis (2009:9), arsitektur dari sebuah

business intelligence system, terdiri dari enam komponen

utama yaitu:

1. Data sources

Pada tahap pertama, diperlukan suatu proses untuk

mengumpulkan dan mengintegrasikan data-data yang

disimpan dalam berbagai sumber yang bervariasi, yang

mana saling berbeda baik itu asal maupun jenisnya.

Sumber ini kebanyakan berasal dari data-data yang

terdapat pada operational systems, tetapi bisa juga berasal

dari dokumen yang tidak terstruktur seperti email dan data-

data yang dikirimkan oleh pihak luar.

2. Data warehouse dan data marts

Page 38: Materi Kimball

45

Dengan menggunakan extraction dan transformation tools

yang dikenal sebagai ETL (extract, transform, load), data

yang berasal dari berbagai sumber yang berbeda disimpan

ke dalam database yang ditujukan untuk mendukung

analisis business intelligence. Database inilah yang

biasanya dikenal dengan sebutan data warehouse dan data

marts.

3. Data exploration

Pada level ketiga ini, tools-tools yang berfungsi untuk

keperluan analisis business intelligence pasif digunakan.

Tools-tools ini terdiri dari query dan reporting systems,

serta statistical methods. Metodologi ini bersifat pasif

karena para pengambil keputusan harus mengambil

keputusan berdasarkan hipotesa mereka sendiri atau

mendefinisikan kriteria dari data extraction, kemudian

menggunakan tools analisis untuk menemukan jawaban

dan mencocokkannya dengan hipotesa awal mereka.

4. Data mining

Level keempat ini terdiri dari sejumlah metodologi

business intelligence yang bersifat aktif yang tujuannya

adalah untuk mengekstrak informasi dan pengetahuan dari

data. Metodologi ini berisi sejumlah model matematika

untuk pengenalan pola, pembelajaran mesin, dan teknik

data mining. Tidak seperti tools yang digunakan pada level

sebelumnya, model dari business intelligence yang bersifat

Page 39: Materi Kimball

46

aktif ini tidak mengharuskan para pengambil keputusan

untuk mengeluarkan hipotesa apapun.

5. Optimization

Pada level ini, solusi terbaik harus dipilih dari sekian

alternative yang ada, yang biasanya sangat banyak dan

beragam.

6. Decisions

Pada level terakhir ini yang menjadi persoalan utama

adalah bagaimana menentukan keputusan akhir yang akan

diambil yang dikenal sebagai decision making process.

Walaupun metodologi business intelligence berhasil

diterapkan, pilihan untuk mengambil sebuah keputusan ada

pada para pengambil keputusan. Pertimbangkan untuk

mengambil keputusan ini biasanya diambil juga dari

informasi yang tidak terstruktur serta tidak formal dan

memodifikasi rekomendasi serta kesimpula yang dicapai

melalui penggunaan model matematika.

Gambar 2.8 Komponen utama dari Business Intelligence

(Sumber: Vercellis, 2009, p9)

Page 40: Materi Kimball

47

2.1.19.3 Siklus Hidup Business Intelligence

Menurut Vercellis (2009:12), ada 4 siklus hidup

business intelligence, yaitu :

1. Analysis

Saat fase analisis, sangat penting untuk mengenali masalah

luar maupun dalam. Pengambil keputusan harus membuat

representasi dari kejadian yang sedang dianalisis, dengan

mengidentifikasikan faktor penting yang paling relevan

dengan masalah.

2. Insight

Fase kedua membuat pengambil keputusan mengerti lebih

dalam mengenai masalah, biasanya dalam tingkatan

kausal. Sebagai contoh, jika analisis dalam fase pertama

menunjukkan bahwa banyak pelanggan yang tidak lagi

melanjutkan asuransi mereka, dalam fase kedua sangat

penting untuk mengidentifikasi profil dan karakteristik

yang dimiliki oleh pelanggan. Informasi yang didapat dari

fase pertama ditransformasikan kedalam fase kedua.

3. Decision

Saat fase ketiga, pengetahuan yang didapat dari fase kedua

diubah menjadi suatu keputusan yang akan diikuti dengan

ksi. Metodologi business intelligence memungkinkan fase

analisis dan pendalaman dieksekusi berkali-kali agar

keputusan yang efektif dan tepat waktu dalam dibuat untuk

memenuhi prioritas strategis suatu perusahaan.

Page 41: Materi Kimball

48

4. Evaluation

Fase terakhir dari Business Intelligence meliputi

pengukuran kinerja dan evaluasi. Dengan menunjukkan

indikator kinerja yang dapat digunakan untuk

mengevaluasi kinerja dari perusahaan.

Gambar 2.9 Siklus Hidup Business Intelligence

(Sumber: Vercellis, 2009, p12)

2.1.19.4 Keuntungan Business Intelligence

Menurut Khan (2012:64) dalam jurnalnya

mengatakan bahwa sementara dunia bisnis berubah dengan

cepat dan proses bisnis menjadi lebih dan lebih kompleks

sehingga lebih sulit bagi manager untuk memiliki yang

komprehensif pemahaman lingkungan bisnis. Faktor

globalisasi, deregulasi, merger dan akuisisi, kompetisi dan

inovasi teknologi, telah memaksa perusahaan untuk

memikirkan kembali strategi bisnis mereka dan hanya

perubahan besar telah menggunakan teknik Business

Inteligence (BI) untuk membantu mereka memahami dan

mengendalikan proses bisnis untuk mendapatkan keuntungan

Page 42: Materi Kimball

49

kompetitif. BI terutama digunakan untuk meningkatkan

ketepatan waktu dan kualitas informasi, dan memungkinkan

manager lebih memahami posisi perubahan mereka

dibandingkan dengan pesaing.

Aplikasi dan Teknologi BI ini membantu perusahaan

untuk menganalisis perubahan tren dalam pangsa pasar,

perubahan perilaku pelanggan dan pengeluaran pola,

preferensi pelanggan, kemampuan perusahaan dan kondisi

pasar. Hal ini digunakan untuk membantu analisis dan

manager menentukan penyesuaian yang paling mungkin untuk

merespon perubahan tren. Ia telah muncul sebagai sebuah

konsep untuk menganalisis data yang dikumpulkan dengan

tujuan untuk membantu unit pengambilan keputusan

mendapatkan pengetahuan yang lebih baik yang komprehensif

dari sebuah operasi, organisasi dan dengan demikian membuat

keputusan bisnis lebih baik.

2.1.19.5 Komponen Business Intelligence

Menurut Kapoor (2010:22) dalam jurnalnya

mengatakan bahwa komponen Business Intelligence terdiri

dari 4 (empat) sub-system, yaitu:

1. The Data Management sub-system

Mencakup komponen yang berkaitan dengan data

warehouse, data mart, dan Online Analytical Processing

(OLAP). Orang-orang yang bekerja terutama di daerah ini

adalah "teknologi", yang mengkhususkan diri dalam Ilmu

Page 43: Materi Kimball

50

Komputer, Sistem Informasi Manajemen (MIS), atau

disiplin terkait.

2. The Advanced Analytics sub-system

Meliputi analisis fungsi berdasarkan statistik, data mining,

peramalan, pemodelan prediktif, analisis prediktif, dan

optimasi. Orang-orang yang bekerja terutama di daerah ini

adalah "Super User", yang mengkhususkan diri dalam

Matematika, Statistik, Ilmu Manajemen atau disiplin yang

terkait.

3. The Business Performance Management sub-system

Terdiri dari proses untuk tujuan strategis dan tujuan,

pengukuran kinerja dan mentoring, menganalisis kinerja

dan membuat keputusan untuk meningkatkan kinerja

bisnis.

4. The Information Delivery sub-system

Memberikan pengguna bisnis kemampuan untuk

mengakses laporan dan terus memantau kinerja organisasi

pada perusahaan dan tingkat yang lebih rendah. Menurut

perannya sebagai teknokrat, super user, manager

menengah, manager eksekutif, atau pengguna operasional,

ia akan diberi peran berbasis hak untuk mengakses laporan

yang relevan dalam ringkasan dan atau format rinci.

Pengguna akhir juga mampu memantau kegiatan kunci

seperti tren, metrik, dan KPI dalam mudah untuk

memahami desain, seperti portal informasi dikonfigurasi,

Page 44: Materi Kimball

51

Scorecard dan dashboard. Tergantung pada peran individu

dan tanggung jawab, disajikan dengan tren, metrik, dan

KPI pada tingkat agregasi yang sesuai dengan keamanan

untuk memblokir non-hak istimewa item.

2.1.20 Dashboard

Menurut Scheps (2008:95) Dashboard merupakan keturunan

langsung dari EIS lama dan sistem DSS, dengan meningkatkan

fungsional dan penampilan. Karena mereka terhubung dengan sistem

data yang kuat dan memanfaatkan KPI.

Menurut Scheps (2008:97) terdapat tiga jenis dashboard yaitu:

Tactical Dashboard

Mengukur produktivitas jangka pendek dan efektivitas. Hasilnya

sering digunakan oleh contributor individu.

Operational Dashboard

Mengukur efektivitas jangka pendek dari fungsi bisnis yang

spesifikasi pada tim atau level unit bisnis. Level dashboard ini dapat

secara potensial dikembangkan untuk seorang knowledge worker

atau local team manager.

Strategic Dashboard

Dibangun untuk level pengaturan kebijakan dari organisasi.

Dashboard menampilkan metric yang menggambarkan strategi dan

tujuan korporasi.

2.1.21 Management Reporting

Menurut Jan Barned (2011:4), dalam jurnalnya mengatakan

bahwa pengertian dari Management Reporting adalah suatu pelaporan

Page 45: Materi Kimball

52

yang bertujuan untuk memberikan informasi yang berguna secara

berkala kepada pemilik perusahaan dalam pengambilan keputusan.

Dalam Management Financial Framework (2012:1),

Pengertian Management Reporting adalah proses penyediaan informasi

kepada lembaga manajemen dengan tepat waktu, akurat dan relevan

yang dirancang untuk membantu dalam strategis dan operasional

perusahaan. Karena Management Reporting yang efektif sangat penting

untuk manajemen dalam membuat keputusan yang tepat, efisien, dan

efektif. Dibawah ini manfaat bagi lembaga manajemen dengan

menggunakan management reporting yang tepat waktu dan efektif,

adalah sebagai berikut:

- Meningkatkan proses pengambilan keputusan.

- Meningkatkan efektivitas manajemen.

- Penggunaan sumber daya dalam proses pengiriman jasa menjadi

lebih efisien.

- Meningkatkan keyakinan dalam kualitas keputusan manajemen oleh

staf lembaga.

- Meningkatkan responsivitas terhadap isu-isu yang muncul

Pengembangan struktur dan format dari management reporting

merupakan elemen yang mendasar dalam menyediakan informasi

kepada lembaga dan staf manajemen dengan tepat, akurat dan tepat

waktu. Misalnya, laporan diberikan kepada manajemen senior biasanya

mengenai summary laporan tentang berbagai aspek operasional.

Laporan-laporan ini akan didukung dengan fungsi drill-down yang

memungkinkan untuk ulasan transaksional bagi manajemen apabila

Page 46: Materi Kimball

53

diperlukan. Reporting diberikan kepada manajemen lini dan staf

umumnya akan menyediakan laporan lebih bertarget dan transaksional

pada fungsi instansi dari laporan manajemen tingkat yang lebih tinggi.

2.2 Teori-Teori Khusus

2.2.1 Instruktur

Menurut Hamalik (2007:144), instruktur (pelatih) adalah

tenaga kependidikan yang bertugas dan berfungsi melaksanakan

pendidikan dan pelatihan.

Menurut Hamalik (2007: 145-147), instruktur memiliki

peranan-peranan tertentu yang meliputi:

1. Peranan sebagai pengajar; instruktur berperan menyampaikan

pengetahuan dengan menyajikan berbagai informasi yang

diperlukan berupa konsep-konsep, fakta, dan informasi yang dapat

memperkaya wawasan pengetahuan para peserta pelatihan dengan

cara melibatkan mereka secara aktif untuk mencari pengetahuan

sendiri yang mereka butuhkan.

2. Peranan sebagai pemimpin kelas; instruktur berperan sebagai

pemimpin kelas secara keseluruhan sehingga dari peranannya itu

pelatih perlu menyusun perencanaan, pelaksanaan, pengawasan, dan

penilaian selama berlangsungnya proses pembelajaran.

3. Peranan sebagai pembimbing; instruktur perlu memberikan bantuan

dan pertolongan bagi peseta pelatihan yang mengalami kesulitan

dalam proses pembelajaran/pelatihan yang pada akhirnya

mengarahkan peserta lebih aktif dan mandiri. Bentuk bimbingannya

Page 47: Materi Kimball

54

dapat berupa mengarahkan, memotivasi, membantu memecahkan

masalah dan lain-lain.

4. Peranan sebagai fasilitator; instruktur berperan menciptakan

kondisi lingkungan pelatihan agar peserta pelatihan belajar aktif

sehingga proses pembelajaran menjadi efektif.

5. Peranan sebagai peserta aktif; instruktur dapat berperan serta

sebagai peserta aktif dalam kegiatan diskusi dengan cara

memberikan informasi, mengarahkan pemikiran, menunjukkan

jalan pemecahan (problem solving), dan sumber-sumber yang

diperlukan.

6. Peranan sebagai pengawas; pelatih harus melakukan pengawasan

secara terus menerus agar proses pelatihan senantiasa terarah,

kendala-kendala yang dihadapi peseta pelatihan segera tertangani,

disiplin kelas dapat dibina dengan baik dan ketertiban kelas

terjaga.

7. Peranan sebagai motivator; instruktur perlu secara berkelanjutan

menggerakkan motivasi belajar peserta pelatihan supaya kegiatan

belajarnya lebih aktif.

8. Peranan sebagai evaluator; instruktur berperan melakukan

penilaian pada pra-proses-akhir pelatihan melalui tes, petanyaan

lisan, pengamatan dan lain-lain agar peserta pelatihan mengetahui

kemajuan belajarnya, mengetahui kesulitan belajarnya dan

membantunya dengan bimbingan.

9. Peranan sebagai konselor; instruktur dapat berperan memberikan

penyuluhan tentang kesulitan pribadi dan sosial peserta pelatihan.

Page 48: Materi Kimball

55

10. Peranan sebagai penyidik sikap dan nilai; sistem nilai yang

dijadikan panutan dan sikap hidup bagi semua peserta pelatihan,

mengingat semuanya akan didayagunakan sebagai tenaga kerja

yang melayani masyarakat dan dibina sesuai dengan tuntutan

lapangan pekerjaan.

2.2.2 Pengertian Penilaian

Menurut Ahyan (2011), dalam artikelnya mengatakan bahwa

penilaian adalah suatu pernyataan berdasarkan sejumlah fakta untuk

menjelskan karakteristik seseorang atau sesuatu. Menilai pada

hakikatnya adalah mengambil suatu keputusan terhadap sesuatu dengan

ukuran baik atau buruk, sehat atau sakit, panjang atau pendek, pandai

atau bodoh, dan lain sebagainya, dimana keputusan itu diambil

berdasarkan apakah sesuai atau tidak sesuai dengan kriteria yang

ditentukan. Penilaian itu sendiri bersifat kualitatif.

2.2.3 Pengertian Kinerja

Menurut Yohana (2012:133), dalam jurnalnya mengatakan

bahwa pengertian kinerja mengarah pada suatu upaya pencapaian

prestasi kerja yang lebih baik maka keberhasilan dalam melakukan

suatu pekerjaan sangat ditentukan oleh kinerja.

2.2.4 Pengertian Evaluasi

Menurut Sudijono (2010:1), Evaluasi adalah suatu tindakan

atau suatu proses untuk menentukan nilai dari sesuatu.

Menurut Arikunto (2010:3), Evaluasi merupakan sebuah

proses pengumpulan data untuk menentukan sejauh mana, dalam hal

apa, dan bagian mana tujuan pendidikan sudah tercapai.

Page 49: Materi Kimball

56

Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian evaluasi adalah suatu tindakan

atau suatu proses pengumpulan data untuk menentukan nilai dari

sesuatu seperti menentukan sejauh mana, dalam hal apa, dan bagian

mana tujuan pendidikan sudah tercapai.

2.2.5 Pengertian Sertifikasi

Menurut Syafarudin (2008:33), Sertifikasi guru dapat diartikan

sebagai suatu proses pemberian pengakuan bahwa seseorang telah

memiliki kompetensi untuk melaksanakan pelayanan pendidikan pada

satuan pendidikan tertentu, setelah lulus uji kompetensi yang

diselenggarakan oleh lembaga sertifikasi.