37
版权所有 © 2013Oracle /或其关联公司。保留所有权利。 2

© 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

  • Upload
    others

  • View
    23

  • Download
    0

Embed Size (px)

Citation preview

Page 1: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 2

Page 2: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

运用“大数据”处理平台Hadoop, 丰富您的数据仓库

联合主讲

李迎峰

甲骨文中国区 高级售前顾问

Page 3: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 4

议题

机遇

挑战

战略

案例

最佳实践

Page 4: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 5

充分了解客户

Page 5: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 6

大数据助力改善运营绩效

信息来源:经济学人情报社,“决定性因素:大数据和决策制定”

大数据所表现出的优势不断增加

Page 6: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 7

使用 数据

12%

的高管认为自己

理解数据对其组织

的影响

产生 数据

问题

Page 7: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 8

Page 8: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 9

眼见不一定为实

Page 9: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 10

电源:交流还是直流?

Page 10: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 11

RDBMS RDBMS

当今

发现和分析

商务智能

Page 11: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 12

RDBMS RDBMS

当今

发现和分析

商务智能

外部

ETL 集群

Page 12: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 13

RDBMS RDBMS

归档的数据怎么处理?

发现和分析

商务智能

归档

外部

ETL 集群

Page 13: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 14

RDBMS RDBMS

新数据怎么处理?

发现和分析

商务智能

? 归档

外部

ETL 集群

Page 14: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 15

RDBMS RDBMS

扩展您的数据仓库

发现和分析

商务智能

?

外部

ETL 集群

归档

Page 15: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 16

RDBMS Hadoop

RDBMS Hadoop

将 Hadoop 与 RDBMS 集成

发现和分析

商务智能

Page 16: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 18

“[Facebook] 从一开始就采用了 Hadoop。现在我们在引入关系型数据库系统来增强 Hadoop。我们本来选择的是另一个方向……但我们最后发现使用错误的技术来解决某些问题是非常困难的。”

Ken Rubin 分析总监 Facebook

http://tdwi.org/Articles/2013/05/06/Facebooks-Relational-Platform.aspx?Page=1

Page 17: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 19

快速 解决新问题

建立 数据储藏库

提高 预测准确性

加快数据 驱动的行动

Hadoop 主要使用场合 补充现有数据仓库

ETL

Page 18: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 20

• 事务数据

• 客户信息

• Web 日志和会话数据

• 机器/传感器数据

• 历史数据

数据储藏库 将所有可能有价值的数据存储在一个地方

Page 19: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 21

RDBMS RDBMS

当今

发现和分析

商务智能

? 归档

外部

ETL 集群

Page 20: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 22

RDBMS Hadoop

RDBMS Hadoop

使用 Hadoop 创建活动的归档

发现和分析

商务智能

Σ

Page 21: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 23

Hadoop 中存储着 80 年的历史数据

结构化数据和非结构化数据包括客户数据、经济趋势数据、远程信息处理传感器数据、天气数据和公共数据

与大型机和 EDW 集成

采用 Hadoop 之前只能分析一个州,且耗时 24 小时

使用 Cloudera 则可以分析所有 50 个州的风险,且用时只有 16 小时(提升约 500 倍)

最常见的 3 个使用场合:数据枢纽、ETL 分流、高级分析

全面的风险分析

客户案例:Insurer 实时数据枢纽

Cloudera

Hadoop

EDW 和

大型机 客户数据

Page 22: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 24

优化推介

提高收入

降低成本(推介字节?)

降低复杂性

更快实现价值

最大限度提升推介有效性

客户案例:旅游业

大数据机 原有

数据仓库 客户数据

Page 23: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 25

快速访问的数据量增加 85%

降低成本

简化架构

更快实现价值

合规、成本降低

客户案例:地区银行

大数据机 Oracle

Exadata

大型机、

RDBMS

Oracle Data Integrator

Page 24: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 26

• 批处理窗口限制

• 增加价值 vs. 增加成本

• 分析 vs. 转换

• 分析 vs. 数据移动和复制

• 新数据源的价值不确定

当今的 ETL 挑战

Page 25: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 27

发现和分析

商务智能

RDBMS RDBMS

当今典型的 ETL

外部

ETL 集群

Page 26: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 28

RDBMS Hadoop

RDBMS Hadoop

使用 Hadoop 实现 ETL 分流

发现和分析

商务智能

Σ

Page 27: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 29

普通消费者所用新设备产生的数据呈指数级增长

ETL 和存储限制将分析囿于 1% 采样

如今,Oracle Exadata 与 Cloudera Hadoop 的结合可以将分析扩展到 100% 的数据上(每天 0.5 PB!)

显著缩短查询时间(即,从 4 天缩短至 53 分钟)

ETL 代码库缩小 90%

从 1% 采样到 100% 分析

客户案例:通信服务

归档存储

数据仓库

复杂关联

报警

筛选和

分割

事件监视

流式 ETL

流式 ETL

电信

服务

之前

Page 28: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 30

普通消费者所用新设备产生的数据呈指数级增长

ETL 和存储限制将分析囿于 1% 采样

如今,Oracle Exadata 与 Cloudera Hadoop 的结合可以将分析扩展到 100% 的数据上(每天 0.5 PB!)

显著缩短查询时间(即,从 4 天缩短至 53 分钟)

ETL 代码库缩小 90%

从 1% 采样到 100% 分析

客户案例:通信服务

归档存储

数据仓库

复杂关联

报警

筛选和

分割

事件监视

流式 ETL

流式 ETL

电信

服务

之前

数据仓库

报警

筛选和

分割

事件监视

Hadoop 归档存储

ETL

关联

第 1 阶段 DWH

电信

服务

之后

Page 29: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 31

发现潜在机会

您遇到过 ETL 性能问题吗?

您是否有一些可能有价值的数据您目前未使用但可能会提供新

的洞察?

您应该重点分析结构化数据、非结构化数

据还是两者?

大数据解决方案是否已经建成了孤岛?

Page 30: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 32

所面临的挑战 和 Oracle 对策

挑战 ORACLE 对策

• 分散的解决方案 • 专业化、集成的数据存储和工具

• 自助式 BI 难题 • 灵活、引导式和自动化的 BI 及数据发现

• 数据非最新 • 提供实时、定义明确数据的解决方案

• 收回投资的时间/部署时间 • 横向和行业预建的解决方案、集成系统

• 数据和用户日益多样化 • 支持数千用户和 PB 级数据的企业解决方案

• 可管理性、安全性、成本 • 集中管理,具备高级安全性/治理

Page 31: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 33

大数据就绪 研发原型阶段

所需技能

– 分布式数据部署(例如 Hadoop)

– 使用 MapReduce 进行 Python 或 Java 编程

– 统计分析(例如 R)

– 数据集成

– 能形成业务假设

– 可传递大数据的业务价值

Page 32: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 34

准备好迎接大数据了? 联系您的客户管理团队

是否已经为结构化数据提供了成熟的分析解决方案?

大数据能否对企业产生影响?

是否已经建立了大数据原型、培养了所需技能并证实了其价值?

是否为大数据制定了企业集成和部署战略?

Page 33: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 35 版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 35

持续创新

大数据广泛应用

Page 34: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 36

Page 35: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 37

Page 36: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 38

RDBMS Hadoop

RDBMS Hadoop

主示意图

发现和分析

商务智能 外部

ETL 集群

数据集市

数据集市

归档

Σ Σ 事件处理

Page 37: © 2013 Oracle 或其关联公司。保留所有权利。...Enriching Your Data Warehouse with Hadoop Author: Oracle & Cloudera Subject: Big Data Created Date: 11/25/2013 9:55:32 AM

版权所有 © 2013,Oracle 和/或其关联公司。保留所有权利。 39

发现和分析

商务智能

RDBMS RDBMS

没有 Hadoop 的主示意图

外部

ETL 集群

数据集市

数据集市

归档

Σ 事件处理