14
New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Embed Size (px)

Citation preview

Page 1: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

New Business Intelligence

Big Data Computing in der Cloud

Rosenheim, 4. November 2013Henrik Kemmesies

Page 2: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Henrik Kemmesies, QAware 204. November 2013

Motivation: New Business Intelligence

Megabyte

Gigabyte

Terabyte

Petabyte

100

10

1

100

10

1

100

10

1

100

10

1

100

10

1

ExabyteDas Internet

Facebook

Der Google Index

Alle Schriften der Menschheit

Speichervermögen desmenschlichen Gehirns

Aktuell durchschnittliche Datenmenge in Unternehmen.

Schmerzgrenze klassischer relationaler Datenbanken.

Offshore-Leaks-Daten

Page 3: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Es entsteht eine neue BI-Architekturgeneration, die mit großen und vielfältigen Datenmengen umgehen kann.

Henrik Kemmesies, QAware 304. November 2013

New Business Intelligence

Megabyte

Gigabyte

Terabyte

Petabyte

100

10

1

100

10

1

100

10

1

100

10

1

100

10

1

Exabyte

New

Bu

sin

ess

Inte

llig

ence

(N

ew B

I)

Kla

ssis

che

BI

Big

Dat

a

Big DataVerarbeitung großer Datenmengen durch:verteilte und hochgradig parallelisierte Verarbeitung.verteilte und effizient organisierte Datenablagen.

New BI = BI mit Big Data Technologien

Damit werden zusätzliche Daten für die BI erschlossen, die mit klassischer BI nicht handhabbar sind:groß: Großes Datenvolumen.schnell: Daten entstehen mit hoher Geschwindigkeit und müssen schnell weiterverarbeitet werden. vielfältig: Daten in vielfältiger Form aus vielfältigen Quellsystemen. dynamisch: Hohe Dynamik der Daten bzgl. ihrer Struktur

New BI ist ein Ersatz für die klassische BI und kann auch mit Small Data umgehen.

NutzenKennzahlengestützte und faktenbasierte Entscheidungs-findungBessere Unter-nehmenssteuerung und Informations-versorgung

Page 4: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Die Technik hinter NewBI ist grundverschieden zur klassischen BI – entstanden im Open-Source-Ökosystem.

Henrik Kemmesies, QAware 404. November 2013

New Business Intelligence

User Interface

Staging Area

Data Warehouse

ETL

ETL

Data Science

Analytics Engines

Realtime Batch

Interactive Analysis Reporting & Dashboards

Data Sources

Mächtige Algorithmen undSprache als Open Source Bausteine.

NewSQL Datenbanken:SQL für große Datenmengen.Sharding (Datenverteilung)Verteilte und parallelisierte VerarbeitungSpaltenorientierte SpeicherungDatenkompressionPartitionierungIn-Memory ComputingEffiziente Indizes

Ein zentraler Data Hub:NewSQL oder NoSQL.

Business Infographics & Data Visualization Werkzeuge zu geringen Lizenzkosten und ohne Lock-In für Power User.

Dateibasierte Staging-Area als ewiges Gedächtnis.Verteiltes DateisystemIntegrierte Kompression

Individuelle BI-Apps mit mächtigen Open Source Charting Bibliotheken statt teurer Reporting Server.

D3

Leichtgewichtige Workflow-Steuerung

Effizient zu entwickelnde Jobs

MassiveParallelisierung

Pig Open Studio

Page 5: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Leistungsfähige Visualisierungen sind frei verfügbar und können in jede Web-App integriert werden.

Henrik Kemmesies, QAware 504. November 2013

New Business Intelligence

Page 6: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

NewBI in der Praxis: T-Online Business Intelligence

Henrik Kemmesies, QAware 604. November 2013

Kennzahl Wert

Datenvolumen im DWH mit Daten vom 15.8. bis 22.10.

500,87 GB

Datensätze im DWH mit Daten vom 15.8. bis 22.10.

1.751.960.156

Anzahl Dimensionen 6

Anzahl Fakten 5

Entwicklungsdauer 3 Monate

Rohdaten: CSV, XML, JSON

Sources:

Staging Area: CSV

Business Intelligence Environment

Data Warehouse

E3E2E1 En

T3T2T1 Tn

L3L2L1 Ln

Extract

Transform

Load … usw. …

… usw. …

… usw. …

Analysen

Data Science Analytics Reporting Dashboards

ET

L-S

teue

rung

GoogleBig Query

Jenkins

Google Cloud Storage

Spr

ing

Bat

ch

JSP / Flot

ATI Targeting Searchmetrics AdServer

Tableau

A B C D

Page 7: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Datenanalyse in der Cloud mit Google Big Query:Besucheranzahl aufgeschlüsselt nach Geschlecht und Tag.

Henrik Kemmesies, QAware 704. November 2013

New Business Intelligence

Page 8: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Liegt das BI-Datenmodell vor, dann sind Auswertungen mit BI-Frontends oder mit Charting-Libs schnell erstellt.

Henrik Kemmesies, QAware 804. November 2013

New Business Intelligence

Page 9: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Visualisierung mit Tableau: geographische Verteilung von Benutzern, differenziert nach Geschlecht:

Henrik Kemmesies, QAware 904. November 2013

New Business Intelligence

Page 10: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Fazit

Henrik Kemmesies, QAware 1004. November 2013

Page 11: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Klassische BI und NewBI im Vergleich: New BI macht BI zum Allgemeingut.

Henrik Kemmesies, QAware 1104. November 2013

New Business Intelligence

Eigenschaft Klassische BI NewBI

Konzeptionelle Grundlage OLAP OLAP

Lizenzkosten I.d.R. sehr hoch durch viele kommerzielle Werkzeuge: Vom ETL-Werkzeug über die Datenbank hin zum BI-Frontend.

Gering durch hohen Anteil an Open-Source-Bausteinen. Kommerzielles Analyse-Frontend ratsam (ca. 1,5k€ pro Power User – ca. 10% der Nutzerbasis).

Vendor Lock-In Geprägt von „rundum glücklich“ Stacks großer Hersteller.

Mehr Freiheit bei der Wahl des richtigen Tools für den Job. Viele Bausteine sind Open Source.

Datenvolumen Bis zu 1 TB möglich mit hohem Aufwand für DB-Optimierung und hohen Hardware-Kosten durch vertikale Skalierung.

Datenvolumen nur durch verfügbaren Speicherplatz und Anzahl an Rechnern begrenzt. Horizontale Skalierung auf billiger Standard-Hardware.

Zielgruppe Management um strategische Entscheidungen fällen zu können.

Alle Hierarchieebenen für operative, taktische und strategische Entscheidungen.

Reife Sehr reife Technologien, die jahrelang erlernt sind und sich im produktiven Einsatz bewährt haben.

Die Technologien sind größtenteils produktionsreif und haben eine aktive Community. Sie sind aber noch nicht jahrelang erlernt & erprobt. Es gibt aber bereits einige Erfolgsgeschichten.

Anreicherung von bestehenden IT-Systemen um BI-Funktionalität

Mit hohen Lizenzkosten verbunden oder individuell entwickelt als „frickelige“ Reports.

Direkt möglich über SQL-Abfragen und Darstellung über JavaScript Charting Bibliotheken.

Die Hürden sinken: Datenvolumina, Heterogene Daten, Lizenzkosten, Herstellerbindung

Page 12: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Diskussion

Henrik Kemmesies, QAware 1204. November 2013

Fragen?

Anmerkungen?

Page 13: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Backup

Henrik Kemmesies, QAware 1304. November 2013

Page 14: New Business Intelligence Big Data Computing in der Cloud Rosenheim, 4. November 2013 Henrik Kemmesies

Extraktion, Transformation und Laden der Daten: die Steuerung übernimmt ein Jenkins.

Henrik Kemmesies, QAware 1404. November 2013

New Business Intelligence