6
Physical Database Design and Performance Zaldy Adrianto [email protected] Objectives Memahami statistik penggunaan dan volume penyimpanan fisik Merancang record fisikal Memilih organisasi file yang tepat Menjelaskan tiga tipe organisasi file Menjelaskan index dan penggunaannya Menjabarkan model database ke struktur yang efisien Physical Design physical database design Project Identification and Selection Project Initiation and Planning Analysis Implementation Maintenance Logical Design Physical Design Physical Design Maksudnya untuk mengubah deskripsi logis ke spesifikasi teknik untuk menyimpan dan memperoleh data Rancangan penyimpanan data yang akan menyediakan kinerja yang memadai dan memastikan integritas, keamanan dan recoverability. Tujuan Menghasilkan efisiensi dalam pemrosesan data Meminimalkan waktu yang diperlukan user untuk berinteraksi dengan sistem informasi Informasi yang dibutuhkan dalam perancangan fisik Tabel ternormalisasi, termasuk perkiraan jumlah baris dalam tiap tabel. Definisi dari atribut, beserta spesifikasi teknis seperti digit maksimum. Deskripsi kapan dan dimana data akan digunakan: entered, retrieved, deleted, and updated.

06 Physical Database Design

Embed Size (px)

DESCRIPTION

06 Physical Database Design

Citation preview

  • Physical Database Design and Performance

    Zaldy Adrianto

    [email protected]

    Objectives

    Memahami statistik penggunaan dan volume penyimpanan fisik

    Merancang record fisikal

    Memilih organisasi file yang tepat

    Menjelaskan tiga tipe organisasi file

    Menjelaskan index dan penggunaannya

    Menjabarkan model database ke struktur

    yang efisien

    Physical DesignPurpose develop technology specs

    Deliverable program/data structures, technology purchases,

    organization redesigns

    Database activity physical database design

    Project Identification

    and Selection

    Project Initiation

    and Planning

    Analysis

    Physical Design

    Implementation

    Maintenance

    Logical Design

    Physical Design

    Physical Design

    Maksudnya untuk mengubah deskripsi logis ke spesifikasi teknik untuk menyimpan dan memperoleh data

    Rancangan penyimpanan data yang akan menyediakan kinerja yang memadai dan memastikan integritas, keamanan dan recoverability.

    Tujuan

    Menghasilkan efisiensi dalam pemrosesan data

    Meminimalkan waktu yang diperlukan user untuk berinteraksi dengan sistem informasi

    Informasi yang dibutuhkan dalam perancangan fisik

    Tabel ternormalisasi, termasuk perkiraan jumlah baris dalam tiap tabel.

    Definisi dari atribut, beserta spesifikasi teknis seperti digit maksimum.

    Deskripsi kapan dan dimana data akan digunakan: entered, retrieved, deleted, and updated.

  • Informasi yang dibutuhkan dalam perancangan fisik

    Kebutuhan dari waktu response dan keamanan data

    Deskripsi dari teknologi yang digunakan untuk implementasi database.

    Key decision

    Memilih format penyimpanan (data type) untuk setiap atribut dari model data logical

    Mengkelompokan atribut dari model data logical kedalam physical records.

    Mengelompokan records yang sama kedalam memori sekunder (umumnya harddisk).

    Key decision (cont)

    Memilih struktur (index dan database architecture) untuk penyimpanan dan menghubungkan file sehingga pengambilan data lebih efisien.

    Menyiapkan strategi agar query database lebih optimal.

    Key decision (cont)

    lRelasi yang ternormalisasi

    lEstimasi Volume

    lDefinisi Attribute

    lEkspektasi Waktu Respon

    lKebutuhan keamanan data

    lKebutuhan Backup/recovery

    lEkspektasi Integrity

    lTeknologi DBMS yang digunakan

    Inputs

    lTipe data Attribute

    lDeskripsi record fisikal (tidak selalu

    pas dengan logical design)

    lOrganisasi File

    l Index dan Arsitektur

    lQuery optimization

    Leads to

    Decisions

    Data Volume and Usage Analysis

    Volume data dan statistik penggunaan data adalah input penting dalam proses perancangan fisik

    Menambahkan notasi pada diagram EER yang merepresentasikan tabel yang telah di normalisasi.

    Data Volume and Usage Analysis

  • Figure 6-1 - Composite usage map

    (Pine Valley Furniture Company)

    Data volumes

    suku cadangnya ada yang di beli dan ada yang di produksi serta ada yang keduanya sehingga presentase total lebih dari 100 %

    menerima 50 quotations dari 50 supplier (2500 quotations)

    Figure 6-1 - Composite usage map

    (Pine Valley Furniture Company) (Cont.)

    Access Frequencies (per hour)

    Figure 6-1 - Composite usage map

    (Pine Valley Furniture Company) (Cont.)

    Usage analysis: 140 purchased parts accessed

    per hour

    80 quotations accessed from

    these 140 purchased part accesses

    70 suppliers accessed from these 80 quotation accesses

    Figure 6-1 - Composite usage map

    (Pine Valley Furniture Company) (Cont.)

    Usage analysis: 75 suppliers accessed per hour

    40 quotations accessed from these 75 supplier accesses 40 purchased parts accessed

    from these 40 quotation accesses

    Merancang Field

    Fields adalah Unit terkecil dari data aplikasi yang dapat dikenali oleh software sistem seperti bahasa pemrograman atau DBMS.

    Aktivitasnya meliputi :

    Memilih tipe data

    Teknik coding dan compression

    Mengendalikan integritas data

    Memilih tipe data Tipe data adalah skema coding yang dikenali

    oleh software sistem seperti DBMS untuk merepresentasikan organisasi data.

    Pemilihan tipe data yang tepat akan menghasilkan :

    Minimalisasi tempat penyimpanan

    Merepresentasikan value keseluruhan

    Meningkatkan integritas data

    Mendukung semua perubahan data.

  • Contoh tipe data dalam Oracle 9iTipe data Deskripsi

    VARCHAR2 Variable length character, only consumed required space

    CHAR Fixed length character data

    LONG Capable storing 4 Gb of one variable length character (e.g Medical Instruction or customer comment)

    NUMBER Positive/ negative number

    DATE Any date, and stores the century, year, month, day,hour, minute and second

    BLOB Binary Large Object, storing 4 Gb of binary data (e.g. Photograph, sound, or video)

    Teknik coding dan compression

    Field dengan jumlah nilai yang terbatas dapat di translasikan kepada kode - kode yang membutuhkan ruang lebih sedikit

    Sama konsepnya dengan Foreign-Key

    Teknik coding dan compression (lanjutan)

    Code saves space, but costs an additional lookup

    to obtain actual value.

    Mengendalikan integritas data

    Default value nilai asumsi jika tidak ada nilai spesifik

    Range control batasan nilai yang diperbolehkan (constraints or validation rules)

    Null value control membolehkan atau melarang field kosong

    Referential integrity range control (dan null value allowances) agar FK ke PK cocok

    Handling Missing Data

    (Babad & Hoffer : 1984)

    Menggantikan perkiraan nilai yang hilang

    Membangun laporan yang berisi nilai yang

    hilang

    Dalam program, akan mengabaikan data yang hilang sampai nilai tersebut signifikan.

    Babad Y M, and J A Hoffer.1984.Even No Data Has a Value. Communications of the ACM.

    Key

    Numeric Subtypes or text length

    Table Definition in Access

  • Keys

    Graphical Table Definition in SQL Server

    Physical Record: kumpulan field yang disimpan dalam lokasi memori terpisah dan diambil secara bersamaan sebagai suatu unit.

    Page: jumlah data yang dibaca atau ditulis dalam satu operasi input output

    Blocking Factor: The number of physical records per page

    Merancang Record Physical

    Pada model data logikal, atribut-atribut yang ditentukan oleh PK yang sama dikelompokkan kedalam sebuah relasi.

    Pada model data fisik, atribut/field tersebut disimpan dalam lokasi memori yang saling berdekatan dan diambil dan ditulis secara bersama sebagai sebuah unit oleh aplikasi DBMS.

    Merancang Record Physical

    Tujuan perancangan fisik:

    !

    Penggunaan media penyimpanan secondary yang efisien; fokus pada ukuran record fisik dan struktur penyimpanan secondary

    !

    Kecepatan pemrosesan data

    Seringkali setiap atribut yang muncul dalam sebuah relasi tidak digunakan semuanya, dan data dari berbagai relasi justru dibutuhkan bersama untuk menjawab sebuah query untuk membuat sebuah laporan.

    Merancang Record Fisikal Merancang Record Fisikal (lanjutan)

    Sehingga walaupun model relasional yang ternormalisasi sudah memecahkan persoalan anomali dan mengurangi duplikasi (serta ruang storage), namun bila diterapkan secara fisik, belum tentu mampu mencapai pemrosesan data yang cepat.

  • ?