20
Skladištenje podataka Prof.dr.sc. Dražena Gašpar 24.10.2016.

Predavanje br. 1 iz predmeta Skladištenje podataka

  • Upload
    phamnga

  • View
    231

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Predavanje br. 1 iz predmeta Skladištenje podataka

Skladištenje podataka

Prof.dr.sc. Dražena Gašpar

24.10.2016.

Page 2: Predavanje br. 1 iz predmeta Skladištenje podataka

Sadržaj

• Uvod i definiranje pojmova• Izvori podataka• Osnove i geneza skladišta podataka• Arhitektura skladišta podataka• Pro iš avanje podataka – ETL• Dimenzijsko modeliranje

Page 3: Predavanje br. 1 iz predmeta Skladištenje podataka

Literatura

• Inmon, W.H.: Building the Data Warehouse – 4th Edition, Wiley Inc. USA, 2005.

• Inmon, W.H., Strauss, D., Neushloss,G.: DW2.0 – The Architecture for the Next Generation of Data Warehousing, 2008.

• Kimball,R., Ross,M.: The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley

• Kimball,R., Ross,M., Thornthwaite,W., Mundy,J., Becker,B.: The Data Warehouse Lifecycle Toolkit, Wiley Inc. USA, 2008

Page 4: Predavanje br. 1 iz predmeta Skladištenje podataka

OCJENJIVANJE• Priprema za svako predavanje na zadanu temu

+• Projekt - implementacija – od problema do skladišta podataka i izvješ a

Dimenzijskimodel

ETL, Data mart, Izvješ a (min 5)

Aktivnost na nastavi

max. 20 bodovamax. 60 bodova max. 20 bodova

Page 5: Predavanje br. 1 iz predmeta Skladištenje podataka

PROJEKT: Implementacija – od problema do skladišta podataka i izvješ a

• Definirati i opisati problem (dijagrami: use case, aktivnosti i klasa)• Napraviti bazu podataka (relacijsku) u Access-u• Razviti dimenzijski model podataka• Pomo u ETL alata provesti ETL proceshttp://butleranalytics.com/5-free-open-source-etl-tools/• Formirati kocku pomo u CubeIt alata• Napraviti najmanje 8-10 razli itih izvješ a koriste i dimenzijske

operatore

Page 6: Predavanje br. 1 iz predmeta Skladištenje podataka

Evolucija digitalne pohrane podataka

Page 7: Predavanje br. 1 iz predmeta Skladištenje podataka

Evolucija digitalne pohrane podataka

Page 8: Predavanje br. 1 iz predmeta Skladištenje podataka

Evolucija digitalne pohrane podataka

Page 9: Predavanje br. 1 iz predmeta Skladištenje podataka

ZAŠTO

baze podataka nisu dovoljne

??

Page 10: Predavanje br. 1 iz predmeta Skladištenje podataka

Podatkovna eksplozija• Kvantiteta podataka, i onih koji su potrebni i

digitaliziranih je enormno pove ana• Donositelji odluka trebaju pristup sve ve em broju

podataka i izvora podataka • IT tj. pohranjivanje podataka omogu ava izniman

porast digitalno pohranjenih podataka (relativno jeftino)

• Na jednoj strani su ogromne koli ine podataka, dok s druge strane postoji stalni nedostatak kvalitetnih podataka

Page 11: Predavanje br. 1 iz predmeta Skladištenje podataka

www.internetlivestats.com

Page 12: Predavanje br. 1 iz predmeta Skladištenje podataka

ZAŠTO skladištenje podataka

??

Page 13: Predavanje br. 1 iz predmeta Skladištenje podataka

13

Istraživa i, Farmeri i Turisti

Istraživa i: Pronalaze nepoznate i neo ekivane informacije skrivene u detaljnim podacima

Farmeri: Sakupljaju informacije Kroz poznate pristupe

Turisti: Pretražuju informacije dobivene of farmera

Page 14: Predavanje br. 1 iz predmeta Skladištenje podataka

Definicija Inmon-a

Skladište podataka je predmetno orijentirani, integrirani, relativno stabilni i vremenski orijentirani skup podataka u funkciji potpore odlu ivanja menadžera.

Page 15: Predavanje br. 1 iz predmeta Skladištenje podataka

2 osnovna tipa podataka

Primitivni/Operativni podaci Izvedeni/DSS podaci

Aplikacijski orijentirani Predmetno orijentirani

Detaljni Sumarni, redefinirani

Mogu se mijenjati Ne mogu se mijenjati

Izvršavanje je kontinuirano Izvršavanje je heuristi ko

Zahtjevi za obradu su unaprijed poznati

Zahtjevi za obradu nisu unaprijed poznati

Transakcijski orijentirani Analiti ki orijentirani

Visoka raspoloživost Raspoloživost nije kriti na

Page 16: Predavanje br. 1 iz predmeta Skladištenje podataka

2 osnovna tipa podataka

Primitivni/Operativni podaci Izvedeni/DSS podaci

Cjelovitost održavanja Održavanje po podskupovima

Neredundantni Redundancija kao životna istina

Struktura stati na, sadržaj promjenjiv Fleksibilna struktura

Obrade koriste manju koli inu podataka

Obrade koriste ogromne koli ine podataka

Podržavaju dnevne operacije Podržavaju potrebe menadžera

Odnose se na kra i vremenski period(naj eš e jednu godinu)

Nemaju vremensku ograni enost, prate povijest podataka u poduze u

Page 17: Predavanje br. 1 iz predmeta Skladištenje podataka

Mjerne jedinice - DW

• Terabytes -- 10^12 bytes:

• Petabytes -- 10^15 bytes:

• Exabytes -- 10^18 bytes:

• Zettabytes -- 10^21 bytes:

• Zottabytes -- 10^24 bytes:

Walmart -- 24 Terabytes

Geographic Information Systems

National Medical Records

Weather images

Intelligence Agency Videos

Page 18: Predavanje br. 1 iz predmeta Skladištenje podataka

18

• OLTP sustavi “vode” poslovanje

• Skladište podataka omogu ava inteligentnije poslovanje

Page 19: Predavanje br. 1 iz predmeta Skladištenje podataka

Za sljede e predavanje

• Datum: 07.11.2016.

1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju

2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:- minimalno 1 vanjski izvor- podaci iz baze podataka

Page 20: Predavanje br. 1 iz predmeta Skladištenje podataka

PITANJA