View
17
Download
0
Category
Preview:
Citation preview
中国大数据发展调查报告(2017 年)
1
中国大数据发展调查报告(2017 年)
版权声明
本调查报告版权属于中国信息通信研究院,并受法律保护。转载、
摘编或利用其它方式使用本调查报告文字或者观点的,应注明“来源:
中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。
Ⅰ
报告目录
前言
观点摘要
一、调查背景
(一)调查方法及样本
(二)报告术语界定
二、大数据市场规模
(一)市场总体规模
(二)细分领域规模
三、大数据应用
(一)大数据应用现状
(二)大数据应用场景
(三)大数据应用带来的效果
(四)大数据应用的主要障碍
(五)未来大数据投入趋势
四、大数据资源
(一)数据规模
(二)数据来源
(三)数据类型
五、大数据平台建设模式
(一)建设模式占比
(二)自建大数据平台模式
(三)采购公共云服务模式
六、政策需求和资源需求
(一)政策需求
(二)资源需求
3
5
6
8
10
12
1
3
4
5
5
6
8
9
10
12
15
9
10
11
12
14
15
15
Ⅱ
Ⅲ
中国大数据发展调查报告(2017 年)
中国大数据发展调查报告(2017 年)
前言
随着大数据政策环境和技术手段的不断完善,大数据行业应用持续升温,中国企
业级大数据市场进入快速发展时期。互联网、电信、金融等开始实际部署大数据平台
并付诸实践,带动软件、硬件和服务市场快速发展。为进一步掌握中国大数据发展和
应用情况,中国信息通信研究院开展了 2016—2017 年度中国大数据发展状况的调查。
本次活动采用现场访问、电话访谈和在线调查相结合的方式,对中国大数据市场规模、
应用现状、数据资源情况、平台建设情况、政策和数据需求等问题进行了调研,共回
收有效问卷 1,465 份。本报告以调查数据为基础,结合行业专家的访谈,力争详实客
观的反映中国大数据发展现状,为政府和企业了解中国大数据发展状况和制定相关决
策提供参考,也为广大关注大数据的从业人员、专家学者和研究机构提供真实可信的
大数据发展报告。
本报告的数据搜集工作得到了相关政府部门、大数据解决方案提供商、企业用户
以及社会各界的大力支持。我们在此表示最衷心的感谢!同时也对接受大数据调查访
问的企业朋友表示最诚挚的谢意!
中国信息通信研究院
2017 年 3 月 27 日
Ⅲ
中国大数据发展调查报告(2017 年)
1
观点摘要
大数据市场规模
2016年中国大数据市场规模为168.0亿元,增速达到45%;预计2017-2020
年增速保持在30%以上。
1
大数据应用
大部分企业均已意识到数据分析对企业发展的重要性。59.2%的受访企业已经成立了数据分析相关部门;同时,27.3%的企业正在计
划成立数据部门。
大数据应用得到进一步普及。
35.1% 的受访企业已经应用了大数据,与 2015 年调查结果相比有所提高;同时,
22.9% 的企业计划将在未来 1 年内应用大数据,发展前景较为乐观。
企业应用大数据所带来的主要效果包括实现智能决策、提升运营效率和改善风险管
理。
其中应用大数据实现智能决策的企业占比最高(55.8%),其次为提升了运营效率
(48.2%)以及更好的管理风险(25.7%)。
企业将进一步加大在大数据领域的投入。
一半以上的受访企业未来计划加大对大数据的投入,其中近20%的企业预计投入
增长在50%以上。
2
大数据资源
企业数据资源仍以内部数据为主。
包括内部生产数据 (49.0%)、客户 /用户数据 (47.8%)以及内部经营管理数据 (42.4%)。
企业数据资源量占比最重的为非结构化数据。
66.1% 的企业表示非结构化数据的比例在 70% 以上,22.0% 的企业非结构化数据比
例为 50% - 70%。
3
2
中国大数据发展调查报告(2017 年)
大数据平台建设模式
企业更倾向本地部署大数据平台。
64.9% 的受访企业选择本地部署大数据平台,其中倾向选择自建大数据平台的企业占
比达到 48.6%。
Hadoop是最受企业欢迎的大数据平台架构。
接近四成的受访企业倾向选择 Hadoop 作为大数据平台的技术架构;其次,Spark 近
两年发展迅速,22.4% 的企业倾向选择 Spark 作为大数据平台的技术架构。
服务器数量在100台以上的企业增加。
自建大数据平台的企业中,31.0%的企业用于大数据平台的服务器数量在100台以上,
相比2015年显著提高。
在线数据库服务、在线大数据分析工具和通用IaaS是企业通过公共云服务部署大数
据应用时的优先选择。
购买在线数据库服务是企业选择最多的方式,占比 43.3%;其次是在线大数据分析工具
以及通用 IaaS,分别占比 37.1% 和 32.5%。
4
政策需求和资源需求
完善行业标准、健全法律法规对推动大数据发展至关重要。
完善行业标准、健全法律法规是 2016 年新增选项,也是企业关注度最高的选项,可见
大数据行业标准亟需进一步完善;其次为加强个人信息保护 (41.2%) 和开放更多政府
公开信息资源 (35.1%)。
企业对数据资源的需求更加强烈。
其中企业工商信息依旧是需求最大的数据资源,占比达到 49.0%;其次为社会保障数
据 (33.9%)、劳动就业数据 (32.7%) 以及市政管理数据 (29.4%)。
5
中国大数据发展调查报告(2017 年)
3
一、调查背景
(一)调查方法及样本
1、调查方法
本次报告信息收集采用现场访问、电话访谈和在线调查相结合的方式,收集到 1,465 份
大数据用户的有效问卷。其中,通过现场访问收集问卷 635 份,通过电话访谈收集问卷 467
份,通过在线调查收集问卷 363 份。
参与调查企业所在行业:包括互联网、软件及信息技术服务、电信、金融、制造、交通
及物流、能源、医疗、政府、科教文卫以及农林牧渔等行业。
2、样本描述
参与调查企业规模:以中小企业为
主,年营业额在 1 亿元以下的企业占总
体样本的 66.1%。
参与调查企业所在区域:覆盖华北、
东北、华东、中南、西南、西北以及海
外地区。
图1 企业营业额分布 (N=1,465)
14.7%
25.3%
13.9%
12.2%
13.9%
8.6%
11.4%
500万以下
500-2000万
2000-5000万
5000万-1亿
1-5亿
5-10亿
10亿以上
数据来源:中国信息通信研究院
图2 企业区域分布 (N=1,465)
数据来源:中国信息通信研究院
36.7%
27.3%
15.9%
8.3%
7.8%
2.4%
1.6%
华北地区
华东地区
中南地区
东北地区
西南地区
西北地区
海外
4
中国大数据发展调查报告(2017 年)
(二)报告术语界定
大数据硬件:本报告所称大数据硬件,是企业购买的用于支撑企业内部大数据相
关业务的硬件基础设施,主要包括服务器、网络设备和存储设备等。特别说明,
大数据系统一般使用通用硬件,技术上并无特殊性,但同时也包含部分经过专门
优化的一体机设备。
大数据服务:本报告所称大数据服务,主要包括大数据分析公共云服务及大数据
系统相关的咨询、设计和系统集成服务等。
大数据软件:本报告所称大数据软件,主要指以Hadoop、Spark等技术架构为
基础的新型分布式平台软件,以及基于这类平台软件的应用软件。
大数据产业:本报告所称大数据产业,包含大数据直接相关的软件、硬件及专业
服务。大数据市场规模的计算口径,相应的包含大数据软件、硬件及服务的直接
产值,不含因大数据应用产生的附加值。
中国大数据发展调查报告(2017 年)
5
二、大数据市场规模
(一)市场总体规模
目前大数据产业的统计口径尚未建立,对于中国大数据产业的规模,各个研究机构均采
取间接方法估算。中国信息通信研究院结合对大数据相关企业的调研测算,2016 年中国大
数据核心产业的市场规模约为 168 亿元,较 2015 年增速达 45%。
随着国家政策激励以及大数据应用模式的逐步成熟,未来几年中国大数据市场仍将保持
快速增长,预计到 2020 年中国大数据市场规模将达到 578 亿元。
(二)细分领域规模
从大数据市场细分领域来看,近年来,软件和服务在市场整体规模中的比重呈上升趋势,
硬件比重逐年减少,整体变化趋势较为平缓。与 2015 年相比,硬件市场规模为 53.9亿元,
占比下降 1.8%;软件市场规模为 72.6亿元,占比提高 0.8%;大数据服务市场规模 41.5
亿元,占比提高 1.0%。
图3 中国大数据市场规模及增速(单位:亿元)
数据来源:中国信息通信研究院
84 116168
234
327
436
578
38.0%45.0%
39.3% 39.7%
33.3%32.6%
0
100
200
300
400
500
600
700
2014 2015 2016 2017E 2018E 2019E 2020E
市场规模 增速数据来源:中国信息通信研究院
图4 中国大数据细分市场构成
硬件 软件 服务
33.9%
32.1%
42.4%
43.2%
23.7%
24.7%
2015
2016
3
数据来源:中国信息通信研究院
6
中国大数据发展调查报告(2017 年)
三、大数据应用
(一)大数据应用现状
2016 年,国家加大了对大数据应用的推动力度,批复了京津冀等 7 个国家级大数据综
合试验区和超过 10 个大数据国家工程实验室;同时,针对医疗、交通等行业,有关部门均
出台了关于大数据发展的指导意见,继续推动大数据在各垂直领域的应用进程。
超过 1/3 的企业已应用大数据。调查
发现,35.1% 的受访企业已经应用了大
数据,与 2015 年调查结果相比有所提
高,大数据应用得到进一步普及;同时,
22.9% 的企业计划将在未来 1 年内应
用大数据,发展前景较为乐观。
近六成企业已成立数据分析相关部
门。调查发现,59.2% 的受访企业已
经成立了数据分析相关部门;同时,
27.3% 的企业正在计划成立数据部门,
绝大部分企业均已意识到数据分析对企
业发展的重要性。
图5 企业数据分析相关部门建设情况 (N=1,465)
59.2%
27.3%
13.5% 是
否,但正在计划成立相关部门
否,目前没有计划成立相关部门
数据来源:中国信息通信研究院
图6 企业大数据应用状况 (N=1,465)
数据来源:中国信息通信研究院
35.1%
22.9%
34.2%
7.8%已经应用
将在未来1年内应用
正在考虑,但还没有应用计划
暂不考虑
中国大数据发展调查报告(2017 年)
7
使用图形图表和智能可视化展现方式的企业越来越多。传统的数据报表依然是企业选择使
用最多的数据展现方式,占比为 67.5%;而图形图表和智能可视化展现方式被越来越多的企
业选择和使用,选择比例分别为 58.8% 和 50.0%。
使用实时动态大数据做分析的企业最多。已经应用大数据的企业中,38.8% 的企业选择实
时动态数据进行处理和分析;其次为历史数据分析,占比为 37.5%;另外有 22.5% 的企业
选择了通过机器学习的方式辅助决策。
图8 企业数据分析结果的展现方式 (N=514)
50.0%
58.8%
67.5%
智能可视化界面
图形图表
数据报表
数据来源:中国信息通信研究院
图7 企业数据分析方式 (N=514)
数据来源:中国信息通信研究院
38.8%
37.5%
22.5%
1.2%
实时动态处理数据并提供分析结果
分析历史数据
机器学习,以大数据支撑未来决策
其他
8
中国大数据发展调查报告(2017 年)
(二)大数据应用场景
营销分析、客户分析和内部运营管理是大数据应用最广泛的三个领域。调查发现,超过
60%的企业将大数据应用于营销分析;其次,50.2%的企业将大数据应用于客户分析;另外,
将近 50% 的企业将大数据应用于内部运营管理。相比之下大数据分析在企业供应链管理等
方面的应用比例还有待提升。
(三)大数据应用带来的效果
大数据应用为企业带来的最明显效果是实现了智能决策和提升了运营效率。调查发现,应用
大数据后实现智能决策的企业占比最高,达到 55.8%。机器学习和认知计算等技术的发展进
一步推动了大数据对企业决策的支撑。其次,48.2% 的企业表示应用大数据后提升了运营效
率;其他效果还包括:更好的管理风险 (25.7%)、创造了新的业务收入 (22.4%)、提升了客
户满意度 (21.6%) 以及增强生产能力(21.4%)。
图9 企业大数据应用场景 (N=514)
0.8%
22.6%
48.4%
50.2%
61.7%
其他
供应链管理
内部运营管理
客户分析
营销分析
数据来源:中国信息通信研究院
图10 企业应用大数据带来的效果 (N=514)
55.8%
48.2%
25.7%
22.4%
21.6%
21.4%
3.3%
实现了更智能的决策
提升了运营效率
能够更好的管理风险
创造了新的业务收入
提升了客户满意度
增强生产能力
其他
数据来源:中国信息通信研究院
中国大数据发展调查报告(2017 年)
9
(四)大数据应用的主要障碍
政策限制和数据资源短缺是企业推进大数据应用时最突出的障碍。44.1% 的受访企业认为
隐私保护等政策限制是制约企业大数据发展的首要障碍,企业隐私保护、数据权属等大数据
相关政策尚需完善;其次为数据资源短缺 (42.6%),进一步引导企业推动数据的开放,加强
数据共享至关重要;另外,超过 1/3 的受访企业认为数据人才短缺是企业发展大数据所面临
的主要问题之一,大数据专业人才仍有待进一步补充。
(五)未来大数据投入趋势
企业将进一步加大在大数据领域的投入。随着大数据技术的逐步成熟以及国家政策的大力
推进,受访企业普遍看好大数据的发展前景,一半以上的受访企业未来计划加大对大数据的
投入,其中近 20% 的企业预计投入增长在 50% 以上。
图12 企业预计未来大数据投入趋势 (N=1,465)
数据来源:中国信息通信研究院
3.7%13.5%
34.3%33.0%
15.5% 投入增加100%以上
投入增加50%-100%
投入增加50%以内
保持现状
投入减少
图11 制约企业大数据发展主要因素 (N=1,465)
2.4%
14.3%
15.9%
31.2%
35.1%
42.6%
44.1%
其他
投资效果无法考量
应用模式不清晰
技术能力不足
数据人才短缺
数据资源短缺
存在政策限制(如隐私保护)
数据来源:中国信息通信研究院
10
中国大数据发展调查报告(2017 年)
四、大数据资源
(一)数据规模
企业数据资源规模增长迅速。调查发现,目前约 70% 的企业拥有的数据资源总量在 50-
500TB 之间。与 2015 年相比,企业数据资源总量呈增长趋势,2016 年数据量在 500TB
以上企业占比为 18.4%,较 2015 年增加 1.4%;数据资源在 50TB 以下的企业占比由
2015 年的 5.0% 下降到 2016 年的 3.7%。
(二)数据来源
企业数据资源主要来自于企业内部。调查发现,企业数据主要来源包括内部生产数据
(49.0%)、客户 / 用户数据 (47.8%)、内部经营管理数据 (42.4%)。与 2015 年相比,企业
对外部购买的数据和政府免费开放的数据需求越来越多。但外部购买的数据 (16.7%) 和政府
免费开放的数据 (13.5%)的应用比例仍处于较低水平。
图14 企业数据来源情况 (N=1,465)
49.0%
47.8%
42.4%
34.3%
16.7%
13.5%
11.0%
0.4%
企业内部生产数据
客户/用户数据
企业内部经营管理数据
互联网公开数据
从外部购买的数据
政府免费开放的数据
社交平台数据
其他
企业数据需求倾向性变化
数据来源:中国信息通信研究院
企业内部生产数据
客户/用户数据
企业内部经营管理数据
互联网公开数据
从外部购买的数据
政府免费开放的数据
社交平台数据
2015 2016
2016年新增选项两年均有选项
2016年企业数据来源
图13 企业数据资源总量 (N=1,465)
数据来源:中国信息通信研究院
5.0%
3.7%
28.0%
28.2%
45.0%
38.3%
17.0%
18.4%
5.0%
11.4%
2015年
2016年
50TB以下 50-100TB 100-500TB 500TB以上 不清楚
中国大数据发展调查报告(2017 年)
11
(三)数据类型
企业绝大部分数据资源为非结构化数据。66.1% 的受访企业表示非结构化数据的比例在
70% 以上。22.0% 的企业非结构化数据比例为 50% - 70%。根据访谈,在企业新增数据
中非结构化数据的增速远高于结构化数据。
但企业非结构化数据的分析和利用仍有待提高。67.8% 的受访企业表示目前仍是基于结构
化数据为基础的数据库进行大数据分析。仅有 28.2% 和 11.8% 的企业对图像 / 视频、语音
/ 音频等非结构化数据进行了分析。随着大数据技术和处理能力的提升,未来企业对非结构
化数据的利用率将有望进一步得到提升。
图16 企业各类数据分析利用情况 (N=1,465)
0.8%
7.6%
11.8%
28.2%
48.5%
67.8%
其他
社交媒体数据
语音/音频
图像/视频
各类格式的文档、邮件数据或日志文件
数据库(如Oracle, DB2, SQL Server等)
数据来源:中国信息通信研究院
图15 企业非结构化数据比例 (N=1,465)
数据来源:中国信息通信研究院
14.7%
51.4%
22.0%
6.1%
3.4%2.4%
90%以上 70%-90%
50%-70% 30%-50%
10%-30% 10%以下
12
中国大数据发展调查报告(2017 年)
五、大数据平台建设模式
(一)建设模式占比
本次调研根据大数据平台建设模式分为本地部署大数据平台和采购公共云服务模式。本地部
署大数据平台包括:1、购买大数据相关产品或解决方案,在本地建设大数据相关基础设施、
存储和计算平台、分析工具和应用展示等;2、采购大数据服务提供商的集成产品,如大数
据一体机。采购公共云服务指的是购买某一家大数据云服务提供商所提供的在线大数据服务。
企业更倾向本地部署大数据平台。64.9% 的受访企业选择本地部署大数据平台,其中倾
向选择自建大数据平台的企业占比达到 48.6%。另有 33.1% 的企业倾向通过采购云服务的
方式应用大数据,随着以云计算为基础的大数据应用逐渐成熟,未来该比例有望进一步提高。
(二)自建大数据平台模式
1、软件类型选择
企业对开源软件的接受度大幅提高。相比于商业闭源软件,企业更青睐开源软件,86.6%
的受访企业倾向使用开源软件搭建大数据平台,与 2015 年相比大幅提高。其中,受访企业
更青睐开源软件商业版,53.9% 的企业选择了商业版开源软件,相比社区版高 21.2%。
图17 企业大数据平台建设模式占比 (N=1,465)
数据来源:中国信息通信研究院
48.6%
33.1%
16.3%
2.0%
自建大数据平台
云服务商的大数据服务
购买大数据产品
其他
图18 自建大数据平台软件类型选择 (N=1,465)
数据来源:中国信息通信研究院
18.0%
53.9%
11.0%
32.7%
71.0%
13.4%
2015年
2016年
开源软件商业版 开源软件社区版 商业闭源软件
中国大数据发展调查报告(2017 年)
13
2、平台架构选择
Hadoop 是最受企业欢迎的大数据平台架构。调查发现,接近四成的受访企业倾向选择
Hadoop 作为大数据平台的技术架构;其次,Spark 近两年发展迅速,22.4% 的企业倾向
选择 Spark 作为大数据平台的技术架构。
3、选择大数据软件的考虑因素
企业选购大数据软件产品时对安全性、稳定性和可扩展性最为关注。调查发现,受访企业在
选择大数据软件产品时对安全性的关注度最高,达到71.4%;其次是产品的稳定性 (67.8%)、
产品可扩展性 (43.3%)。
图20 自建大数据平台软件选择的考虑因素 (N=1,465)
1.2%
15.1%
21.6%
39.2%
42.4%
43.3%
67.8%
71.4%
其他
产品实施过的成功案例
产品易用性
产品性价比
售后服务质量
产品可扩展性
产品稳定性
产品安全性
数据来源:中国信息通信研究院
图19 自建大数据平台技术架构选择 (N=1,465)
39.2%
22.4%
18.4%
12.7%
6.5%
0.8%
非结构化数据的批处理架构(如Hadoop)
非结构化数据的内存计算架构(如Spark)
分布式SQL架构(如MPP)
基于小型机的传统架构
流处理架构(如Storm)
其他
数据来源:中国信息通信研究院
14
中国大数据发展调查报告(2017 年)
4、服务器规模
服务器数量在 100 台以上的企业增加。调查发现,31.0% 的受访企业用于大数据平台的
服务器数量在100台以上,相比2015年显著提高。由此看出,企业在加大大数据领域的投入。
(三)采购公共云服务模式
在线数据库服务、在线大数据分析工具和通用 IaaS是企业通过公共云服务部署大数据应用
时的优先选择。调查发现,43.3% 的受访企业采购云服务时倾向选择在线数据库服务;其次
是在线大数据分析工具以及通用 IaaS,分别占比 37.1% 和 32.5%。随着企业大数据应用
的逐渐深入,与 2015 年相比,企业购买各项云服务产品的比例显著提高。
图22 企业购买云服务产品类型选择 (N=1,465)
数据来源:中国信息通信研究院
43.3%
37.1%
32.5%
16.8%
14.7%
2.9%
30.0%
27.0%
17.0%
13.0%
12.0%
2.0%
在线数据库服务
在线大数据分析工具
通用IaaS(虚拟机和存储)
在线可视化工具
在线MapReduce服务
其他
2016年 2015年
图21 自建大数据平台的服务器数量 (N=291)
数据来源:中国信息通信研究院
21.0%
27.5%
28.0%
29.5%
25.0%
12.0%
13.0%
16.2%
13.0%
14.8%
2015年
2016年20台服务器以下
20-50台服务器
50-100台服务器
100-500台服务器
500台服务器以上
中国大数据发展调查报告(2017 年)
15
六、政策需求和资源需求
(一)政策需求
完善行业标准、健全法律法规对推动大数据发展至关重要。在企业对大数据发展的政策需
求调查中,完善行业标准、健全法律法规是 2016 年新增选项,也是企业关注度最高的选项,
可见大数据行业标准亟需进一步完善;其次为加强个人信息保护 (41.2%) 和开放更多政府公
开信息资源 (35.1%);其他需求还包括资助更多大数据领域的科研项目 (30.6%)、促进数据
流通交易 (18.8%) 以及扩大大数据相关采购 (13.5%)。
(二)资源需求
企业对数据资源的需求愈加强烈。其中企业工商信息依旧是需求最大的数据资源,占比
达到 49.0%;其次为社会保障数据 (33.9%)、劳动就业数据 (32.7%) 以及市政管理数据
(29.4%)。相比于 2015 年,企业对劳动就业、气象环境等数据资源的需求比例进一步上升。
图23 企业对政府和政策的需求 (N=1,465)
13.5%
18.8%
30.6%
35.1%
41.2%
67.8%
政府扩大大数据相关采购
促进数据流通交易
资助更多大数据领域的科研项目
开放更多政府公开信息资源
加强个人信息保护
完善行业标准,健全法律法规2015 2016
完善行业标准,健全法律法规加强个人信息保护开放更多政府公开信息资源资助大数据的科研项目促进数据流通交易政府扩大大数据相关采购
企业需求倾向性变化2016年对政府和政策需求
数据来源:中国信息通信研究院 2016年新增选项两年均有选项
图24 企业对数据资源的需求 (N=1,465)
4.9%17.1%
22.9%26.5%
28.6%29.0%29.4%
32.7%33.9%
49.0%
其他食品药品医疗健康气象环境交通服务教育科研市政管理劳动就业
社会保障信息企业工商信息 2015 2016
企业工商信息
社会保障信息
劳动就业
市政管理
教育科研
交通服务
气象环境
医疗健康
食品药品
企业需求倾向性变化2016年企业数据资源需求
数据来源:中国信息通信研究院 两年均有选项
16
中国大数据发展调查报告(2017 年)
中国信息通信研究院已经连续两年开展中国大数据发展情况的市场调查工作,并发布《中
国大数据发展调查报告》,在行业内也产生了重要影响。随着大数据技术的发展和大数据应
用的深入,我院将持续跟踪大数据发展情况。欢迎大数据领域广大企业、研究机构、专家学
者和从业人员与报告编写组联系(发邮件至:liuhan@caict.ac.cn),提出您感兴趣的调
研问题,反馈您的宝贵意见和建议,帮助我们持续提升报告的针对性和实用价值。
感谢您对大数据产业的支持!
中国信息通信研究院
2017 年 3 月
编后语
中国大数据发展调查报告(2017 年)
17
Recommended