Click here to load reader

Materi Kimball

  • View
    240

  • Download
    0

Embed Size (px)

DESCRIPTION

ghjhgjh

Text of Materi Kimball

12

Conformed Dimension

Jika menggunakan referensi dari kimball, maka terdapat istilah conformed dimension.Conformed dimension adalah dimensi memiliki arti hal yang sama dengan setiap tabel fakta yang mungkin yang dapat bergabung. Pembentukan conformed dimension adalah langkah yang sangat signifikan. Jadi conformed dimension berarti dimensi indentik yang sama di setiap datamart. Contoh conformed dimension yaitu: kostumer, produk, lokasi, promosi dan waktu (Kimball et al, 1998).

Pemodelan dimensi(DM) adalah nama dari seperangkat teknik dan konsep yang digunakan dalamdata warehousedesign.Hal ini dianggap berbeda darientity-relationship modeling(ER).Modeling dimensi tidak selalu melibatkan database relasional.Pendekatan pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti database multidimensi atau file bahkan datar.Menurut konsultan data warehousingRalph Kimball,[1]DM adalah teknik desain untuk database dimaksudkan untuk mendukung permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan kinerja.Menurut dia, meskipun ER berorientasi transaksi sangat berguna untukmenangkap transaksi, harus dihindari untuk pengiriman end-user.Pemodelan dimensi selalu menggunakan konsep fakta (ukuran), dan dimensi (konteks).Fakta biasanya (tetapi tidak selalu) nilai numerik yang dapat dikumpulkan, dan dimensi adalah kelompok hirarki dan deskriptor yang menentukan fakta-fakta.Sebagai contoh, jumlah penjualan adalah fakta, timestamp, produk, daftar #, toko #, dll adalah elemen dimensi.Model dimensi yang dibangun oleh area proses bisnis, misalnya toko penjualan, persediaan, klaim, dll Karena area proses bisnis yang berbeda berbagi beberapa tapi tidak semua dimensi, efisiensi dalam desain, operasi, dan konsistensi, ini dicapai dengan menggunakandimensi serupa, yaitu menggunakan salah satu salinan dimensi dibagi di seluruh bidang studi.Istilah "sesuai dimensi" berasal olehRalph Kimball.Proses pemodelan dimensi[sunting]Model dimensi dibangun padaskema bintang seperti., dengan dimensi sekitar tabel fakta[2][3]Untuk membangun skema, model desain berikut digunakan:1. Pilih proses bisnis2. Menyatakan gandum3. Mengidentifikasi dimensi4. Mengidentifikasi faktaPilih proses bisnisProses pemodelan dimensi didasarkan pada metode desain 4-langkah yang membantu untuk memastikan kegunaan dari model dimensi dan penggunaandata warehouse.Dasar-dasar dalam desain membangun proses bisnis yang sebenarnya dimanadata warehouseharus mencakup.Oleh karena itu langkah pertama dalam model adalah untuk menggambarkan proses bisnis yang model dibangun di atas.Ini bisa misalnya menjadi situasi penjualan di toko ritel.Untuk menggambarkan proses bisnis, seseorang dapat memilih untuk melakukan hal ini dalam teks biasa atau menggunakan dasar Business Process Modeling Notation (BPMN) atau panduan desain lainnya seperti Unified Modeling Language (UML).Menyatakan gandumSetelah menjelaskan Proses Bisnis, langkah berikutnya dalam desain adalah untuk menyatakan butir model.Gandum dari model adalah deskripsi yang tepat dari apa yang model dimensi harus berfokus pada.Ini bisa misalnya menjadi "Item baris individu pada slip pelanggan dari toko ritel".Untuk memperjelas apa artinya gandum, Anda harus memilih proses pusat dan menggambarkannya dengan satu kalimat.Selain itu biji-bijian (kalimat) adalah apa yang Anda akan membangun dimensi dan tabel fakta dari.Anda mungkin merasa perlu untuk kembali ke langkah ini untuk mengubah gandum karena informasi baru yang diperoleh pada apa model Anda seharusnya dapat memberikan.Mengidentifikasi dimensiLangkah ketiga dalam proses desain adalah untuk menentukan dimensi model.Dimensi harus didefinisikan dalam gandum dari langkah kedua dari proses 4-langkah.Dimensi adalah dasar dari tabel fakta, dan mana data untuk tabel fakta dikumpulkan.Biasanya dimensi benda seperti tanggal, toko, persediaan dll Dimensi ini adalah di mana semua data disimpan.Misalnya, dimensi tanggal bisa berisi data seperti tahun, bulan dan hari kerja.Mengidentifikasi fakta-faktaSetelah mendefinisikan dimensi, langkah berikutnya dalam proses ini adalah untuk membuat kunci untuk tabel fakta.Langkah ini adalah untuk mengidentifikasi fakta-fakta numerik yang akan mengisi setiap baris tabel fakta.Langkah ini erat terkait dengan pengguna bisnis dari sistem, karena ini adalah di mana mereka mendapatkan akses ke data yang tersimpan dalamdata warehouse.Oleh karena itu sebagian dari baris tabel fakta adalah numerik, tokoh aditif seperti kuantitas atau biaya per unit, dllDimensi Normalisasi[sunting]Normalisasi dimensi atau snowflaking menghilangkan atribut berlebihan, yang dikenal dalam meratakan de-dinormalisasi dimensi normal.Dimensi secara ketat bergabung bersama dalam sub dimensi.Snowflaking memiliki pengaruh pada struktur data yang berbeda dari banyak filosofi dari gudang data.[3]Data Tunggal tabel (fakta) yang dikelilingi oleh beberapa deskriptif (dimensi) tabelPengembang sering tidak menormalkan dimensi karena beberapa alasan:[4]1. Normalisasi membuat struktur data yang lebih kompleks2. Kinerja dapat lebih lambat, karena banyak bergabung antara tabel3. Penghematan space minimal4. Indeks bitmaptidak dapat digunakan5. Kinerja Query,database 3NFmenderita masalah kinerja ketika menggabungkan atau mengambil banyak nilai dimensi yang mungkin memerlukan analisis.Jika Anda hanya akan melakukan laporan operasional maka Anda mungkin dapat bertahan dengan 3NF karena pengguna operasional Anda akan mencari data yang sangat halus butir.Ada beberapa argumen tentang mengapa normalisasi dapat berguna.[3]Hal ini dapat menjadi keuntungan ketika bagian dari hirarki umum untuk lebih dari satu dimensi.Misalnya, dimensi geografis mungkin digunakan kembali karena kedua pelanggan dan pemasok dimensi menggunakannya.Manfaat pemodelan dimensi[sunting]Manfaat dari pemodelan dimensi adalah sebagai berikut:[5] Dimengerti - Dibandingkan dengan model normalisasi, model dimensi lebih mudah untuk memahami dan lebih intuitif.Dalam model dimensi, informasi dikelompokkan ke dalam kategori bisnis yang koheren atau dimensi, sehingga lebih mudah untuk membaca dan menafsirkan.Kesederhanaan juga memungkinkan perangkat lunak untuk menavigasi database efisien.Dalam model normalisasi, data dibagi menjadi banyak entitas diskrit dan bahkan proses bisnis sederhana mungkin mengakibatkan puluhan tabel bergabung bersama-sama dalam cara yang kompleks. Kinerja Query - model Dimensi lebih denormalized dan dioptimalkan untuk data query, sementara model dinormalisasi berusaha untuk menghilangkan redudansi data dan dioptimalkan untuk memuat transaksi dan memperbarui.Kerangka diprediksi dari model dimensi memungkinkan database untuk membuat asumsi yang kuat tentang data yang membantu dalam kinerja.Setiap dimensi merupakan entry point yang setara ke dalam tabel fakta, dan struktur simetris ini memungkinkan penanganan yang efektif dari query yang kompleks.Optimasi query untuk bergabung star database sederhana, dapat diprediksi, dan terkendali. Perluasan - Model Dimensi yang extensible dan mudah menampung data baru yang tak terduga.Tabel yang ada dapat diubah di tempat baik dengan hanya menambahkan baris data baru ke dalam tabel atau mengeksekusi SQL mengubah perintah meja.Tidak ada pertanyaan atau aplikasi lain yang duduk di atas Gudang perlu memprogram untuk mengakomodasi perubahan.Query Lama dan aplikasi terus berjalan tanpa menghasilkan hasil yang berbeda.Namun dalam model dinormalisasi setiap modifikasi harus dipertimbangkan dengan hati-hati, karena ketergantungan yang kompleks antara tabel database.Pemodelan dimensi (DM) adalah nama dari teknik desain logis sering digunakan untuk gudang data.Hal ini berbeda dari, dan kontras dengan, entitas-hubungan pemodelan (ER).Artikel ini menunjukkan banyak perbedaan antara kedua teknik dan menarik garis di pasir.DM adalah satu-satunya teknik yang layak untuk database yang dirancang untuk mendukung permintaan pengguna akhir di gudang data.ER sangat berguna untuk menangkap transaksi dan fase administrasi data membangun data warehouse, tetapi harus dihindari untuk pengiriman end-user.

DM adalah teknik desain logis yang berusaha untuk menyajikan data dalam kerangka intuitif standar yang memungkinkan untuk akses kinerja tinggi.Hal ini inheren dimensi, dan menganut disiplin yang menggunakan model relasional dengan beberapa pembatasan penting.Setiap model dimensi terdiri dari satu meja dengan kunci multi, disebut tabel fakta, dan satu set meja kecil yang disebut tabel dimensi.Setiap tabel dimensi memiliki satu bagian primary key yang sesuai persis dengan salah satu komponen kunci multipart dalam tabel fakta.(Lihat Gambar 2.) Karakteristik struktur "Bintang-seperti" ini sering disebut bintang bergabung.Bintang Istilah bergabung tanggal kembali ke hari-hari awal database relasional.

Sebuah tabel fakta, karena memiliki primary key multi bagian yang terdiri dari dua atau lebih kunci asing, selalu mengungkapkan banyak-ke-banyak hubungan.Tabel fakta yang paling berguna juga mengandung satu atau lebih tindakan numerik, atau "fakta," yang terjadi untuk kombinasi tombol yang mendefinisikan setiap record.Dalam Gambar 2, fakta-fakta Dolar Terjual, Unit Terjual, dan Dolar Biaya.Fakta yang paling berguna dalam tabel fakta adalah numerik dan aditif.Aditivitas sangat penting karena aplikasi data warehouse hampir tidak pernah mengambil fakta catatan tabel tunggal, melainkan, mereka mengambil ratusan, ribuan, atau bahkan jutaan catatan ini pada satu waktu, dan satu-satunya hal yang berguna untuk dilakukan dengan begitu banyak catatan adalah untuk menambahkan mereka up.Tabel dimensi, sebaliknya, yang paling sering mengandung informasi deskriptif tekstual.Atribut dimensi digunakan sebagai sumber sebagian besar kendala yang menarik dalam query data warehouse, dan mereka hampir selalu sumber header baris dalam SQL jawaban set.Dalam Gambar 2, kita membatasi pada produk Lemon rasa melalui atribut Flavor dalam tabel Produ