23
Entrepôt de Entrepôt de données et OLAP données et OLAP Par: David Coderre Tony Létourneau

Entrepôt de données et OLAP Par:David Coderre Tony Létourneau

Embed Size (px)

Citation preview

Entrepôt de données et Entrepôt de données et OLAPOLAP

Par: David Coderre Tony Létourneau

22 INF7115INF7115

PlanPlan

IntroductionIntroduction

Entrepôts de donnéesEntrepôts de données

OLAP OLAP

ConclusionConclusion

33 INF7115INF7115

IntroductionIntroduction

Entrepôts de donnéesEntrepôts de données DéfinitionDéfinition Les structuresLes structures Les architecturesLes architectures

OLAPOLAP DéfinitionDéfinition Nouveaux opérateursNouveaux opérateurs

DIFFDIFFRELAXERELAXE

Outils OLAPOutils OLAP

44 INF7115INF7115

Entrepôts de donnéesEntrepôts de données

DéfinitionDéfinition

Un entrepôt de données est une collection Un entrepôt de données est une collection de données orientées sujet, intégrées, non de données orientées sujet, intégrées, non volatiles et comportant un historique, volatiles et comportant un historique, organisées pour le support d’un processus organisées pour le support d’un processus d’aide à la décision. d’aide à la décision.

55 INF7115INF7115

Entrepôts de données (suite)Entrepôts de données (suite)

Les structuresLes structures Les données détailléesLes données détaillées Les données agrégéesLes données agrégées Les méta-donnéesLes méta-données Les données historiquesLes données historiques

66 INF7115INF7115

Entrepôts de données (suite)Entrepôts de données (suite)

77 INF7115INF7115

Entrepôts de données (suite)Entrepôts de données (suite)

Les architecturesLes architectures L’architecture réelleL’architecture réelle L’architecture virtuelleL’architecture virtuelle L’architecture remoteL’architecture remote

88 INF7115INF7115

OLAPOLAP

On Line Analytical Process On Line Analytical Process Permet à des compagnies d'analyser Permet à des compagnies d'analyser (résumer, consolider, visionner, (résumer, consolider, visionner, d’appliquer des formules, de synthétiser d’appliquer des formules, de synthétiser des données selon des dimensions des données selon des dimensions multiples) les bases de données globales multiples) les bases de données globales établies dans leurs entrepôts de données. établies dans leurs entrepôts de données. Est l'infrastructure pour des applications Est l'infrastructure pour des applications de soutien à la décision. de soutien à la décision.

99 INF7115INF7115

OLAP (suite)OLAP (suite)

Permet de restructurer et de stocker dans un Permet de restructurer et de stocker dans un format multidimensionnel les données issues de format multidimensionnel les données issues de fichiers ou de bases relationnelles.fichiers ou de bases relationnelles.Comporte des opérateurs simples et rapides qui Comporte des opérateurs simples et rapides qui peuvent être combinés.peuvent être combinés. Pilage (Roll-up)Pilage (Roll-up) Dépliage (Roll-down)Dépliage (Roll-down) PivotPivot

Résultat dépend beaucoup de l’intuition de Résultat dépend beaucoup de l’intuition de l’analyste.l’analyste.

1010 INF7115INF7115

But des nouveaux opérateursBut des nouveaux opérateurs

Permettre une analyse interactive. Permettre une analyse interactive.

Automatiser une grande partie de l’effort Automatiser une grande partie de l’effort manuel.manuel.

Permettre de combiner la perspicacité du Permettre de combiner la perspicacité du monde externe de l’analyste et les monde externe de l’analyste et les découvertes obtenues à partir des découvertes obtenues à partir des données. données.

1111 INF7115INF7115

Nouveaux opérateursNouveaux opérateurs

DIFFDIFF

RELAXRELAX

1212 INF7115INF7115

Mise en situationMise en situation

Produit Plateforme Géographie Année

Nom_Produit(67) Nom_Plateforme(43) Géographie (4) Année (5)

Catégorie_Produit(14) Type_Plateforme(6)

Groupe_Produit(3) Usager_Plateforme(2)

Figure 1 : Dimensions et hiérarchies des données des revenues des logiciels. Le nombre entre parenthèse indique le format du niveau de la dimension.

1313 INF7115INF7115

Opérateur DIFFOpérateur DIFF

Remplace le dépliage (roll-down) manuel.Remplace le dépliage (roll-down) manuel.

Permet de rapporter une différence Permet de rapporter une différence sommaire entre deux valeurs observées à sommaire entre deux valeurs observées à des niveaux agrégés. des niveaux agrégés.

1414 INF7115INF7115

ProblématiqueProblématique

Plateforme (Tous)

Produit (Tous)

Somme des revenues Année

Géographie 1990 1991 1992 1993 1994

Asie/PacifiqueReste du mondeEtats-UnisEurope de l’ouest

1440.24 1946.82 3453.56 5576.35 6309.88

2170.02 2154.14 4557.42 5203.84 5510.09

6545.49 7524.29 10946.87 13545.42 15817.18

4551.90 6061.23 10053.19 12577.50 13501.03

Figure 2 : Revenue total par géographie et année de la vente de logiciel.

1515 INF7115INF7115

Exemple opérateur DIFFExemple opérateur DIFFProduit Usager_Plat Type_Plat Plateforme Année_1990 Année_1991 Ratio Erreur

(Tous)- (Tous)- (Tous)- (Tous) 1620.02 1820.05 1.12 34.07

Systèmed’exploitation

Multi (Tous)- (Tous) 253.52 197.86 0.78 23.35

Systèmed’exploitation

Multi Autre Multi Mainframe IBM

97.76 1.54 0.02 0.00

Système d’exploitation

Mono Win16 (Tous) 94.26 10.73 0.11 0.00

Middleware & autre

Multi Autre Multi Mainframe IBM

101.45 9.55 0.09 0.00

EDA Multi Unix Multi (Tous) 0.36 76.44 211.74 0.00

EDA Mono Unix mono (Tous) 0.06 13.49 210.78 0.00

EDA Mono Win16 (Tous) 1.80 10.89 60.4 0.00

Figure 3 : Raison de la baisse des revenues indiquée par la figure 2

1616 INF7115INF7115

Opérateur RELAXOpérateur RELAX

Met en valeur un ensemble de régions Met en valeur un ensemble de régions maximales autour du problème où un maximales autour du problème où un changement similaire a été observé. changement similaire a été observé.

Effectue une série de pliages et une Effectue une série de pliages et une succession d’étapes de sélection, de succession d’étapes de sélection, de dépliage et de pivot. dépliage et de pivot.

1717 INF7115INF7115

ProblématiqueProblématiqueType_Plateforme Autre Système

Plateforme Mono usager autre

Géographie Etats-Unis

Catégorie_Prod Applications financières

Produit HRM/Paie

Somme des revenus

Année

1990 1991 1992 1993 1994

Total 0.03 0.07 0.46 5.03 3.87

Figure 4 : La problématique de la baisse de revenue de 1993 à 1994 observée pour le produit ‘HRM/Paie’, Géographie=’États-Unis’ et Plateforme = ‘Mono usager autre’.

1818 INF7115INF7115

Exemple opérateur RELAXExemple opérateur RELAX

No

Catégorie_Prod Produit Géographie Type_Plat Plateforme

Applications financières

HRM/Paie Etats-Unis Autres Syst. Mono usager autre

1 (Chaque) (Chaque)

Autres app.bureautique

Reste du monde

HRM/Paie Asie/Pacifique

Figure 5 : Application de l’opérateur RELAX au problème de la figure 4

1919 INF7115INF7115

Outils OLAPOutils OLAP

MOLAP (Multidimensional OLAP)MOLAP (Multidimensional OLAP)

ROLAP (Relational OLAP)ROLAP (Relational OLAP)

HOLAP (Hybride OLAP)HOLAP (Hybride OLAP)

DOLAP, VOLAP, etc.DOLAP, VOLAP, etc.

2020 INF7115INF7115

MOLAPMOLAP

2121 INF7115INF7115

ROLAPROLAP

2222 INF7115INF7115

ConclusionConclusion

2323 INF7115INF7115

Questions ?Questions ?