12
DWH @ Adatb haladóknak Adattárház specifikus RDBMS funkciók MPP implementáció Lévai Ákos [email protected] Adatbázisok haladóknak 2012. 2012. október 30.

9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

  • Upload
    others

  • View
    16

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Adattárház specifikus RDBMS funkciókMPP implementáció

Lévai Á[email protected]

Adatbázisok haladóknak 2012.

2012. október 30.

Page 2: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Miről lesz szó? (1p)

Adattárház és céljaiÜzleti és műszaki elvárásokMPP RDBMSEgy implementáció: Teradata

Ajánlott irodalom / Keresések

2.

Page 3: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Adattárház és céljai (5p)

Mi az adattárház? (Inmon/Kimball)Célok

A döntéshozókat időben ellátni információkkalR&D elemzések támogatásaAktív részvétel a proaktív üzletmenetben„Single version of truth”

3.

Page 4: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Néhány elvárás – Megoldások (5p)

• Előre definiált és ad-hoc kérdések megválaszolása

• Hosszú időszak lefedése• Feladatnak megfelelő válaszidő

– Kevert „workload” kezelése• Hosszabb táv: Skálázhatóság

Célra optimalizált ApplikációCélra optimalizált (R)DBMS

4.

Page 5: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Néhány technika (3p)

• DB-n kívüli párhuzamos processzálás (Hadoop,MapReduce)

• Denormalizált Logikai-Fizikai adatmodellezés• „Multi temperature” adattárolás• Dinamikus resource management• Párhuzamosítás – MPP architektúra

5.

Page 6: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

MPP RDBMS architektúra (6p)

• Egyforma unit-ok• Feladat (lehetőleg) egyenlő felosztása• Implementációk: Greenplum, Netezza,Teradata• Tipikusan share nothing felépítés (pl Teradata [1])

6.

Page 7: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Adattárház feladatelemek (5p)

A tipikus RDBMS mumusok• Full table scan

– Összegzések,összetett keresések• Sort

– Analitikai műveletek,indexfelépítés• Join

Nem kell tőlük félni,hatékonyan párhuzamosíthatók!

7.

Page 8: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Teradata aspektus (10p)

• Felhasználó felé transzparens párhuzamosítás– Hashing

• Tervezési irányelvek– „Know data” – „Know workload”

– Fő feladat: megfelelő disztribúció• Nem mindig a legegyenletesebb az optimális!

– Indexelés: ritka– Cost based optimizer: tábla-mező statisztikák

létfontosságúak8.

Page 9: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

MPP RDBMS előnyök (5p)

• „Olcsó” SMP építőelemek• SQL interface – általánosan használható• Optimális esetben ~1/N* futásidő• Lineáris skálázhatóság! (>1000 unit bizonyítva )• Dinamikus bővíthetőség

• *N: unitok száma9.

Page 10: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Kérdések…

2012. október 30. Lévai Ákos 10.

Page 11: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

GoogleWords - Ajánlott irodalom

MPP RDBMS, Teradata, Greenplum, Big Data, Hadoop, MapReduce, Teradata Express

http://scs.web.elte.hu/Work/DW/papers/sidlo_dipl.pdf

http://www.cubrid.org/blog/dev-platform/platforms-for-big-data/

http://www.teradata.com/teradata-express/

Források[1]

http://www.coffingdw.com/Teradata_Basics/chapter_9___advanced_topics_that_you_will_be_tested_on/teradata_is_a_shared_nothing_architecture.htm

Page 12: 9. eloadas DWH Teradata alapokon.ppt [Kompatibilis mód]gajdos/2012adatb2/9. eloadas DWH... · DWH @ Adatb haladóknak Adattárház és céljai (5p) zMi az adattárház?(Inmon/Kimball)

DW

H @

Adatb haladóknak

Köszönöm a figyelmet!

Lévai Á[email protected]

Adatbázisok haladóknak 2012.

2012. október 30.