48
百百百百百百百百百

Baidu Big Data Driven Artificial Intelligence

Embed Size (px)

Citation preview

Page 1: Baidu Big Data Driven Artificial Intelligence

百度大数据人工智能

Page 2: Baidu Big Data Driven Artificial Intelligence

请求来自 138 个

国家和地区

每天

60 亿次搜索请求

每天每个中国网民

使用 10 次百度

移动搜索份额

79.8%

490 亿元2014 年总营收

15 年健康成长

Page 3: Baidu Big Data Driven Artificial Intelligence

百度海量数据

• >2000PB存储能力

• 10-100PB/ 天数据处理量

• 千亿 ~ 万亿网页

• 百亿 ~ 千亿索引

• 十亿 ~ 百亿 / 天更新量

• 100TB~1PB/ 天日志

百度每天处理的数据量将近 100个 PB , 1PB 就等于 100 万个G ,相当于 5000 个国家图书馆的信息量的总和

Page 4: Baidu Big Data Driven Artificial Intelligence

自诞生第一天起,百度就是一家人工智能公司

搜索数据Mega Data

商业价值Monetization

大数据人工智能Data - driven AI

Page 5: Baidu Big Data Driven Artificial Intelligence

人工智能,正在成为科技创新的主战场

Page 6: Baidu Big Data Driven Artificial Intelligence

什么是人工智能?

Page 7: Baidu Big Data Driven Artificial Intelligence

感知

控制思考

Page 8: Baidu Big Data Driven Artificial Intelligence

无处不在的“ 智能 XX ”

智能水杯智能手表

智能手环智能汤匙智能冰箱

智能手机

Page 9: Baidu Big Data Driven Artificial Intelligence

如何区分这些产品是否真的智能?

VS.

Page 10: Baidu Big Data Driven Artificial Intelligence

随着经验演化,越变越聪明

学习的能力,是智能的本质!

Page 11: Baidu Big Data Driven Artificial Intelligence

一个时代正在来临

Page 12: Baidu Big Data Driven Artificial Intelligence

20102008 201420122004 20202006 2016 2018

电脑

智能手机

平板

联网设备

联网电视

联网汽车可穿戴设备

260 亿 互联设备

移动时代 万物互联

Page 13: Baidu Big Data Driven Artificial Intelligence

40ZB 数据量

20102008 201420122004 20202006 2016 2018

万物互联 数据暴增

数据来源: IDC

Page 14: Baidu Big Data Driven Artificial Intelligence

万物互联 万物智能

大数据时代

Page 15: Baidu Big Data Driven Artificial Intelligence

深度学习为 2013 年十大技术突破之首

MIT Technology Review , April 23rd

, 2013

Page 16: Baidu Big Data Driven Artificial Intelligence

深度学习迅速影响了最前沿的高科技公司

Google Microsoft Facebook

Page 17: Baidu Big Data Driven Artificial Intelligence

百度大脑

无时不刻在学习和演进

千亿级参数

构建世界上最大规模深度神经网络

世界领先的

深度学习算法:

语音识别,图像识别,自然语言理解,广

告精准匹配,用户建模,

Page 18: Baidu Big Data Driven Artificial Intelligence

百度大脑,让连接变得更智能

人 百度

1. 理解用户意图:文本分析,图像识别,语音识别,…

1

2. 匹配用户需求:优化搜索结果的智能排序,…

信息2

3. 精准推送广告和服务:估计和优化点击率和转化率,…

广告服务3

Page 19: Baidu Big Data Driven Artificial Intelligence

• 模拟大脑的行为

• 特别适合大数据

• End-to-end 学习

• 提供一套建模语言

为什么深度学习受到重视?

Page 20: Baidu Big Data Driven Artificial Intelligence

模拟人类大脑的分层结构以及行为

图像像素

不同方向

的边界

物体的各个部位

整个物体

Page 21: Baidu Big Data Driven Artificial Intelligence

大数据和深度学习

数据规模

效果

传统人工智能算法

深度学习算法

Page 22: Baidu Big Data Driven Artificial Intelligence

人工智能的成功应用

Page 23: Baidu Big Data Driven Artificial Intelligence

世界上首次深度学习成功应用于广告变现

凤巢系统从浅层模型时代到深度模型时代

用户

百度 广告主

深度学习显著提升了百度凤巢广告系统

Page 24: Baidu Big Data Driven Artificial Intelligence

未用深度学习 用了深度学习语义模型之后

世界上首次将深度学习成功应用搜索引擎

迄今为止深度神经网络作用于自然语言最成功的例子。

深度学习显著提升了百度搜索满意度领先优势

Page 25: Baidu Big Data Driven Artificial Intelligence

Voice Search

Voice Type-setting

LBS

voice service

Voice Assis-

tant

深度学习提升了语音识别准确率

Page 26: Baidu Big Data Driven Artificial Intelligence

60708090

安静环境 噪声环境

百度

Google

移动语音搜索,世界首屈一指的中文语音识别率

安静环境 噪声环境

Accuracy

Page 27: Baidu Big Data Driven Artificial Intelligence

自然图片 OCR :百度翻译

Page 28: Baidu Big Data Driven Artificial Intelligence

自然图片 OCR :百度作业帮

Page 29: Baidu Big Data Driven Artificial Intelligence

高峰时用户一天上传 9000 万张照片, 连续三周 iOS 应用商店总榜排行第一

百度魔图:基于深度学习的人脸识别技术

人脸验证准确率达到 99.85%

Page 30: Baidu Big Data Driven Artificial Intelligence

百度拥有世界领先的基于内容的图像搜索技术

输入检索图片

百度结果 竞品结果

Page 31: Baidu Big Data Driven Artificial Intelligence

0.380.40

百度 谷歌

全球最好的物体检测模型

来源: ImageNet Challenge 2014

Mean Average Precision

No.1 No.2

Page 32: Baidu Big Data Driven Artificial Intelligence

述说图片的故事

A yellow bus driving down a road with green trees and green grass in the background.

Living room with white couch and blue carpeting. The room in the apartment gets some afternoon sun.

这些字幕是深度学习程序写的

Page 33: Baidu Big Data Driven Artificial Intelligence

舆情分析,让营销活动更具针对性舆论趋势监测

网民正负面意见挖掘舆论传播路径追踪

舆论监督与引导突发事件的及时发现与响应

有针对性的营销活动对竞争对手的了解和针对性策

略“ 肯德基”舆情分析

Page 34: Baidu Big Data Driven Artificial Intelligence

工业领域——智能监控与运维

• 百度基础设施• 200+ 万块硬盘• 硬件故障率:硬盘 > 内存 > 电源

• 预测故障,提前拷贝数据,更换硬盘• 百度经过对近 9 亿条实例进行采集处理• 选取15 万个训练样本• 从历史的硬盘故障病例中,选取了 240 个特征• 人工智能模型预测硬盘故障

• 对比无预测的故障恢复的好处• 提前一天预测出硬盘故障• 提前拷贝数据,更换硬盘• 准确率 >85%

• 极大节省带宽和计算资源

• 正在 IT、发电机组、发动机组、汽车制造和基站等的智能监控与运维方面开展合作 34

生产效率 运营成本

数据智能预测

数据查询

数据存储

百度大数据引擎

Page 35: Baidu Big Data Driven Artificial Intelligence

疾病预测,提前防范

借助大数据,让医疗卫生管理和服务真正深入人心、体现公益性: 公共卫生监测 流行疾病追踪 医疗服务质量评测

Page 36: Baidu Big Data Driven Artificial Intelligence

人工智能,不仅仅发生在互联网

Page 37: Baidu Big Data Driven Artificial Intelligence

百度高度自动驾驶项目

Remodeled LBS street-view car Two BMW 335i

LiDAR + Camera + Radar + GPS/IMUThe ATV car as a quick test bed

Page 38: Baidu Big Data Driven Artificial Intelligence

三维高精度地图和感知定位

•开发大规模的三维高精度地图技术 (已完成 G7 和五环 )

• 达到业界最领先精度 10~20 厘米• 高精度定位是包括自动驾驶在内的很多应用的核心技术

3D point clouds around the Baidu headquarter

A 3D high-precision map of the G7 highway

Page 39: Baidu Big Data Driven Artificial Intelligence

Curb Weight: 1650kg

Wheelbase: 2.92m

Turning Circle: 11.8m

Geometry and Physics ParametersEngine Model and Parameters

BMW N55B30 3L

Transmission Model and Parameters

* by estimation

百度自动驾驶项目–动力控制系统建模仿真

Suspension Model and Parameters

Page 40: Baidu Big Data Driven Artificial Intelligence

基于图像的实时道路场景理解

•利用深度学习开发各种图像识别技术•低成本的摄像头和其他感知设备是关键 (compare to Google).

Scene parsing with CDNN Real-time vehicle detection

Page 41: Baidu Big Data Driven Artificial Intelligence

从辅助驾驶到高度自动驾驶

辅助驾驶

主动安全

特定条件下的自动驾驶

高度自动驾驶

Page 42: Baidu Big Data Driven Artificial Intelligence

全景图:基于大数据的人工智能

42

互联网索引知识

人机交互

物理世界传感器 ,3D 建模

百度大脑 Deep Learning Platform

高性能计算

搜索,广告,预测,决策

智能硬件 ,机器人 , 自动驾驶

探索发现,3D打印

信息感知 思考 , 学习 决策 , 行动 , 创造

Page 43: Baidu Big Data Driven Artificial Intelligence

开放+合作

Page 44: Baidu Big Data Driven Artificial Intelligence

中国大脑计划:人工智能基础资源和公共服务平台,面向不同研究领域开放平台资源,高效对接社会资源,依托统一平台协同创新。

建议设立“中国大脑”计划,推动人工智能跨越发展,抢占新一轮科技革命制高点。

Page 45: Baidu Big Data Driven Artificial Intelligence

中国大脑计划总体目标

一个平台

两个技术方向

一系列基础研究与关键技术

多行业示范应用

万亿级产业规模

Page 46: Baidu Big Data Driven Artificial Intelligence

一个平台,整合资源与服务

异构计算(GPU、 CPU、类脑处理器)

深度学习

脑科学研究

大规模机器学习 类脑计算

关键技术

公共民生、国防军事、产业应用

行业数据

Page 47: Baidu Big Data Driven Artificial Intelligence

多行业示范应用

生物医药、医疗健康金融经济调控与预测

智能机器人

军事国防

互联网智能交通与自动驾驶汽车

农业

工业制造

能源化工

Page 48: Baidu Big Data Driven Artificial Intelligence

谢谢各位领导!