8
白皮书 英特尔和迈克尔 J. 福克斯基金会 数据中心软件事业部 使用可穿戴技术 推动帕金森氏症研究 英特尔和迈克尔 J. 福克斯基金会将联合开发帕金森氏症研究解决方案,该解决方案 使用可穿戴技术、英特尔算法、大数据分析,以及 Hadoop 的 Cloudera 分发版。 “从我得知患有帕金森氏症这一事实是无 法改变的那一刻起,我开始致力于我所 能够改变的事情,比如,为研究提供资 金支持。” 迈克尔 J. 福克斯 简介 帕金森氏症(PD)是仅次于阿兹海默 氏症的第二大常见神经退化性疾病, 美国预估约有 100 万人患有 PD,而 全球的 PD 患者数量多达 700 万。帕 金森氏症目前无法治愈;药物、手术 和跨学科管理等方法可缓解病情,但 这些治疗手段只能缓解患者出现的部 分症状,而且持续时间也非常有限。 许多治疗方法还会产生严重的副作 用,导致出现与该疾病一样的症状, 即患者无法正常活动。 英特尔与迈克尔 J. 福克斯帕金森氏症 基金会(MJFF)正携手开发基于数 据分析的解决方案,旨在收集和分析 与 PD 有关的数据,识别疾病模式并 进行归纳,并通过所获取的洞察加快 实现治疗方案的突破,最终找到能够 治愈该病症的方法。 挑战 在攻克 “无法治愈的” 疾病时,我们 通常会遇到缺乏认知的问题。对于不 完全了解的问题,解决起来非常困 难。关于帕金森氏症,仍然有许多谜 团尚未解开。所以,第一步是收集尽 可能多的数据。这也是为什么 MJFF 正在积极寻找志愿者进行临床试验。 然而数据科学告诉我们,要想从数据 获取有意义的知识,必须获得可供处 理的相关数据。换句话说,我们面临 的任务有点像大海捞针。 研究人员的目标是识别模式 — “捋 顺” 这项工作所生成的杂乱无章的原 始数据。识别和归纳模式,并将其转 化成可量化的症状,这是大数据分析 流程的一部分。 目前,帕金森氏症研究缺乏客观的症 状测量方法,因此研究人员面临的第 二项挑战是收录和量化可测量、可观 察的症状以供分析。 在 PD 早期,患者可能会出现睡眠障 碍和嗅觉缺失,但最明显的症状出现 在行动方面 — 震颤、肌肉僵硬、运 动迟缓,以及行走困难。这些症状主 要由大脑中生成多巴胺的细胞死亡所 引起,其成因目前尚不明确。在 PD 末期,患者可能会出现认知和行为方 面的问题,包括痴呆和抑郁。 为更好地了解这些症状所出现的条 件,英特尔正在开发一款应用于可穿 戴监控器的可配置解决方案,它可以 主动跟踪患者的运动机能,并自我报

使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

  • Upload
    others

  • View
    16

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

白皮书英特尔和迈克尔 J. 福克斯基金会数据中心软件事业部

使用可穿戴技术 推动帕金森氏症研究英特尔和迈克尔 J. 福克斯基金会将联合开发帕金森氏症研究解决方案,该解决方案

使用可穿戴技术、英特尔算法、大数据分析,以及 Hadoop 的 Cloudera 分发版。

“从我得知患有帕金森氏症这一事实是无

法改变的那一刻起,我开始致力于我所

能够改变的事情,比如,为研究提供资

金支持。”

迈克尔 J. 福克斯

简介

帕金森氏症(PD)是仅次于阿兹海默

氏症的第二大常见神经退化性疾病,

美国预估约有 100 万人患有 PD,而

全球的 PD 患者数量多达 700 万。帕

金森氏症目前无法治愈;药物、手术

和跨学科管理等方法可缓解病情,但

这些治疗手段只能缓解患者出现的部

分症状,而且持续时间也非常有限。

许多治疗方法还会产生严重的副作

用,导致出现与该疾病一样的症状,

即患者无法正常活动。

英特尔与迈克尔 J. 福克斯帕金森氏症

基金会(MJFF)正携手开发基于数

据分析的解决方案,旨在收集和分析

与 PD 有关的数据,识别疾病模式并

进行归纳,并通过所获取的洞察加快

实现治疗方案的突破,最终找到能够

治愈该病症的方法。

挑战

在攻克 “无法治愈的” 疾病时,我们

通常会遇到缺乏认知的问题。对于不

完全了解的问题,解决起来非常困

难。关于帕金森氏症,仍然有许多谜

团尚未解开。所以,第一步是收集尽

可能多的数据。这也是为什么 MJFF

正在积极寻找志愿者进行临床试验。

然而数据科学告诉我们,要想从数据

获取有意义的知识,必须获得可供处

理的相关数据。换句话说,我们面临

的任务有点像大海捞针。

研究人员的目标是识别模式 — “捋

顺” 这项工作所生成的杂乱无章的原

始数据。识别和归纳模式,并将其转

化成可量化的症状,这是大数据分析

流程的一部分。

目前,帕金森氏症研究缺乏客观的症

状测量方法,因此研究人员面临的第

二项挑战是收录和量化可测量、可观

察的症状以供分析。

在 PD 早期,患者可能会出现睡眠障

碍和嗅觉缺失,但最明显的症状出现

在行动方面 — 震颤、肌肉僵硬、运

动迟缓,以及行走困难。这些症状主

要由大脑中生成多巴胺的细胞死亡所

引起,其成因目前尚不明确。在 PD

末期,患者可能会出现认知和行为方

面的问题,包括痴呆和抑郁。

为更好地了解这些症状所出现的条

件,英特尔正在开发一款应用于可穿

戴监控器的可配置解决方案,它可以

主动跟踪患者的运动机能,并自我报

Page 2: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

2

告患者通过智能手机应用 Fox Insight

Mobile 所输入的信息。英特尔开发的

这款 Fox Insight Mobile 应用能够跟

踪运动,并提供电子 “日记” 供患者输

入服药时间/剂量以及服药后当天的感

觉。与纸质日记不同,电子日记能够

提供实用的反馈和信息,与患者保持

互动。

通过可穿戴设备自动收集数据是一回

事,而希望患者手动提供输入又是另

外一回事。因为医生无法每天见到 PD

患者,所以用户主动参与变得至关重

要。那么,如何确保患者主动参与?

过去,患者需要通过在连续几周或

几个月的时间里用纸笔记录下一整

天的感觉和服药剂量来提供数据。

人们认为这些日记并不可靠,因

为患者往往容易失去持续记录的兴

趣,所以研究者只能从不同患者处

收集零散的信息。

为了吸引患者主动、连续地为我们提

供其感觉和服药时间等相关信息 —

这些信息无法通过可穿戴设备自动获

取,所以我们必须将这个流程设计得

既简单,又实用。由于 Fox Insight

Mobile 应用可提醒患者服药,并提

供信息跟踪进展,因此患者会更容易

接受,从而增加一个积极的优势:对

最终用户的价值越大,我们就能吸引

越多的最终用户使用该应用,从而收

集到更多数据。

数据量多是一件好事情,但也因此带

来了一个技术挑战:需处理的绝对

数据量 — 涵盖数据采集、存储和分

析。长期跟踪患者 — 一天 24 小时、

一周 7 天,长达几个月甚至几年 —

这要求系统能够收集海量数据,并一

次性使用所有收集和保存的数据。

监控设备

惯性测量装置(IMU)是一款使用三

轴加速计和陀螺仪的电子设备,可用

来测量速度、方位和地心引力。

过去,IMU 主要安装在船舶和飞机

上,用于监控人体活动。市场上推出

的许多可穿戴 IMU可以通过运动表现

调整和物理疗法为用户提供帮助。这

些设备可以确定人体运动是故意发生

(比如散步或跑步)、偶然发生,还

是因不自主震颤所引起的。

在最近的临床试验中,我们使用配

备了三轴加速计和我们专为其构建

应用的 “现成” 腕带式智能手表,以

及安装了英特尔开发的 Fox Insight

Mobile 应用的智能手机。在校准

设备后,每位患者做出一些正常动

作。这些设备将自动进行配对,并与

MJFF 服务器共享数据。

这些 IMU 具备两项功能:对患者来

说,它们可以跟踪活动水平和用药剂

量,提示患者,并监控震颤。

对研究人员来说,它们可以收集数据

— 通过自动(从本质上来说通过执

行计算的可穿戴设备)或人工方式

(通过借助 Fox Insight Mobile 应用

输入信息的最终用户),并将数据传

输至企业数据中心(EDH),以供大

数据分析。这种中央信息库可供全球

的研究人员使用。

我们的解决方案具备出色的灵活性,

支持研究人员根据不同项目的特定

要求定制数据收集流程。研究人员

可以配置从哪个传感器(加速计或

陀螺仪)收集数据,数据收集的频

率,以及(最重要的一点)收集所

有原始数据还是只收集计算过的数

据(活动水平、震颤等)。就长期

研究而言,例如,患者佩戴设备长

达数月,仅使用有关震颤、活动水

平和其他算法的计算数据可能更加

合适。就短期临床试验而言,当我

们在尝试开发新算法或收集数据以

供后续的全面分析时,我们可能会

收集所有原始数据。

英特尔算法

英特尔为这些设备开发了许多算法,

包括活动水平、震颤、夜间跟踪和步

态检测。

• 活动水平。该算法每隔 30 秒测量一次

腕带式设备的活动强度,计算其绝对加

速平均值(过滤掉震颤常见的频率之

后)。Fox Insight Mobile 应用通过图

表显示用户的活动水平,该图表记录了

用户在一定时间内的活动情况。此外,

它还可汇总每天的活动时间。

该算法无法捕捉物理活动强度(比如

骑自行车或在踏旋器上走动),但我

们可以增加其他传感器(比如心率监

测器或陀螺仪),以方便测量,从而

对这些活动进行量化处理。

• 震颤。我们通过频率分析(特别是在

4-12 Hz 范围内的振幅)了解和量化

手颤,并从活动水平测量结果中减去

这些典型震颤频率。这些值之间平均

差较高的 5 秒钟时段将视作一个震颤

Page 3: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

3

点。我们将出现的这些点整合成 “震颤

记录”,以图形的形式供用户查看每天

的震颤症状。

微弱和短暂的震颤不容易检测到,同

时,有些活动(比如在颠簸的路上行

驶或刷牙等)会被误当作是震颤。为

减少这些 I 类和 II 类错误,我们会在

试验开始时,运用收集到的可控数据

为患者校准设备。

• 步态检测。该算法基于对从患者处收

集的标记加速计数据的监督式学习。

该数据可转换成时间和频率领域的集

体特征,决策树模型可用于将 5 秒时

段分成步行/非步行组。输出可用于计

算有关高活动水平的个性化阀值,并

用作夜间跟踪算法的输入。

根据验证集,该模型的准确率高达

98.5%,假阳性案例通常将频率相同

的周期运动视作步行,假阴性案例通

常受到大量手部运动的影响,无法有

效检测步行周期性。

• 夜间跟踪。PD 患者经常难以入眠和

保持安稳睡眠,还忍受着各种运动症

状,比如快速眼动(REM)和周期性

肢动(PLM)。

现有的睡眠跟踪应用无法满足 PD 患

者的需求,因为大部分应用是针对

没有睡眠障碍的人所设计的。Fox

Insight Mobile 应用可根据用户在

夜间的活动分析其睡眠质量。我们区

分了睡眠状态或清醒状态下的三种运

动水平:最小运动,比如人们正保持

充分的休息或安静地平躺着;适度运

动,包括辗转反侧、周期性肢动和啜

饮/喝酒;大量运动,包括在睡眠期

间起床,或进行剧烈运动。这些计算

基于运动的数量、持续时间和类型,

以及活动水平。

我们将继续改进这些算法,并开发有

助于帕金森氏症研究的其他算法。

Fox Insight Mobile 应用

本研究的另一个重要部分是英特尔

Fox Insight Mobile 智能手机应用(图

1),目前适用于安卓* 平台。除连接

数据仓库外,Fox Insight Mobile 应

用每天都会为用户带来最直接的价

值,为他们显示活动水平,并通过

非分析特性(比如服药提示)为患

者提供帮助。

患者可创建有关具体服药天数、时间

和数量的提示,此外,Fox Insight

Mobile 还可根据对症状和反应(来

源于可穿戴 IMU)的分析提供反馈,

提示最佳的服药剂量和时间。

借助有关活动水平和服药记录的个性

化信息和图表,患者可以将用药剂量

/频率和身体活动进行对比,从而根

据个人偏好和需求选择合适的方式。

为鼓励患者增加身体活动,数据汇总

会显示较低的运动周期,并帮助用户

查看其运动规律。

用户登录 Fox Insight Mobile 后,可

以使用该应用报告活动(比如特定药

物的剂量)或记录下服药后的感觉。

电子日记通过将输入限制在四个情

感符号(差、一般、好、非常好)以

内,简化报告流程,并降低患者的主

观影响。我们的方法可以提高数据的

客观性,而且规范这种方法的使用将

有利于全局分析。

结合使用多个三轴传感器的实验数

据,这些带有时间标记的行为记录将

帮助研究人员建立患者行为、感觉和

药物服用之间的联系,以制定实用的

假设,供标准科学方法进行测试。

图 1 Fox Insight Mobile 屏幕。除标准的时间、电量、信号强度等图标外,Fox Insight Mobile

应用在顶部的黑色栏中添加了额外图标,以显示腕带式 IMU 和智能手机是否正在向云传输数据。

➊ Welcome(欢迎)屏幕显示您已经为研究活动提供数据的时间,并提供简单的导航工具供您

编辑服药计划、查看活动水平并记录数据。➋ Record(记录)屏幕支持您报告药物的服用和服

药后的感觉,提供电子日记供您记录个人主观的总体状态,从而支持研究人员日后建立与腕带式

智能手机的 IMU 传感器数据的联系。➌ Medication Schedule(服药计划)支持您添加每天所服

药物和服药时间,以便 Fox Insight Mobile 提示您按时服药。➍ My Stats(我的状态)为只读屏

幕,以图形的形式显示您的活动水平、是否按时服药,从而支持查看您的行为是否符合药物治疗

程序。该屏幕还可创建面向震颤和夜间活动水平的图表,以便您查看如何进行药物治疗。

Medication Schedule Menu

Delete reminder Delete medicine

Edit

Duopa

10:00AM; 8:00PM

You take 2 times a day:

Delete reminder Delete medicine

Edit

Sinemet

3:00PM; 8:00PM

You take 2 times a day:

Add Medication +

12:3074%

Record

MedicationTell us when you took your medication

SymptomsTell us aboutyour current symptoms

QuestionsAnswer several questions

?

Menu

12:3074%

?

Activity

Tremor

Night Time

High activity time: 39m

My Stats

Mon, Aug 17, 2015 < Previous

09:00 10:00 11:00 12:00 13:00

Menu

Close

View

View

12:3074%

Fox Insight

You’ve contributed: 3h:25m of unique

Record

Menu

My Stats

Medication Alerts See All

See All

Contribution to science: Major ContributorHello Itzik!

20:002 Medications

Activity9h:24m today

Tremor10m longest today

12:3074%

➊ ➋ ➍➌

Page 4: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

4

MQTT over TCP/IP

Page 5: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

5

MQTT over TCP/IP

图 2 系统架构。该图显示了 Fox Insight

Mobile 的基本结构,尤其适用于我们目前正

在开展的临床试验,同时也适用于其他试验

或根据情况进行定制。

1 用户。用户主要分成两类:患者和研究

人员/临床医生或数据分析师。这些用户

通过不同的 API 登录系统以执行不同的职

能。患者与 Fox Insight Mobile 手机应用

交互,而研究人员分析大数据或下载大数

据以供本地分析。

2 IMU。惯性测量装置提供原始数据。在

本示例中,我们使用的是智能手机和智能

手表(事实上,任意数量和类型的设备均

可)。这些设备相互通信,其中一种设备

(在本示例中为智能手表)通过 MQTT 消

息传递功能向 EDH 发送捕捉到的数据。

3 Web API。基于 Web 的应用编程接口

支持患者参与临床试验,可登录并与工具

进行交互,并支持研究人员登录系统,计

算数据、执行分析和导出数据。

4 数据流。面向已传输数据的消息传递框

架基于 MQTT(消息队列遥测传输)—

在 TCP/IP 协议顶层操作的轻量级发布-订

阅消息传递协议。我们使用开源消息代理

Mosquitto* 实施 MQTT 协议。

5 英特尔算法。我们的算法使用英特尔开

发的 Java 库和 Akka* 开源工具套件,有

助于我们在消息传递框架的范围内,在智

能手机上本地处理数据,或在数据传输过

程中进行处理。

6 企业数据中心。Cloudera 可提供安全

的数据仓库和缓冲区。在该项目中,我们

将元数据保存在数据库,而其他 “大数据”

(原始加速计数据、测量值、震颤等)保

存在分布式 Apache* HBase 数据库中。

商用服务器存储支持任意数量的患者以

虚拟方式传输无限量的数据。除包含在

Cloudera Enterprise 中的 SQL 工具外,

我们还可使用 HBase 顶端的 Phoenix* 通

过 SQL 查询数据。

使用大数据的主要原因是其具备出色的分

析功能。Cloudera 支持并行处理和批处

理功能,可帮助数百位并发用户分析数

据,以近乎实时的方式执行大数据分析。

另外,Cloudera Enterprise 还可提供行

业领先的数据安全性,满足相关法律法规

的要求。

Page 6: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

6

系统架构

从架构层面来说,我们的解决方案可

分成两种基于用户的类型:一类面向

患者,一类面向研究人员。(请参见

图 2。)

就患者而言,用户通过移动 API 登

录智能手机上的 Fox Insight Mobile

应用,手动将数据添加至原始或已

计算的数据流(通过佩戴的 IMU 自

动传输)。

就研究而言,研究人员、临床医生

和数据分析师可使用安全的 RESTful

API1 从平台提取数据,并进行查看

和分析。SPARK 用于在数据导出前

处理数据。

此类信息可在 IMU 和 EDH 之间进行

解析和分析。

我们的消息传递框架基于 MQTT(消

息队列遥测传输),这是一种在 TCP/

IP 协议顶层使用的轻量级发布-订阅

消息传递协议。MQTT 所需的代码较

少,并且能够经济高效地使用网络带

宽,因此非常适用于可穿戴设备。由

于其 “发布-订阅” 消息模式要求通过

消息代理将消息发送至感兴趣的客户

端,因此我们还使用了开源 MQTT 代

理 Mosquitto*。

使用这种消息传递方法传输数据还具

有另外一个优势,即我们可以在 IMU

上或数据传输过程中本地处理原始数

据 — 在信息数据包中。这是因为我

们使用了面向算法和 Akka*(用于在

Java 虚拟机上构建消息驱动型应用

的开源工具套件)的独立 Java 库,1. REST = 表述性状态转移。支持表述性状态转移(REST)

的应用编程接口(API)使用 HTTP 请求 GET、PUT、

POST 和 DELETE 数据。

从而能够在数据流传输过程中(无不

是在智能手机或智能手表上)计算数

据。这种灵活性可以支持项目经理

定制研究项目 — 设计一项试验,例

如,手机应用可转换原始数据并仅将

已处理的数据发送至数据库;或发送

原始数据,以供协议流中动态分析并

转发数据;或发送未经计算的数据,

以将原始数据保存在 EDH 中。

数据采集与分析

通过使用各种 Java 库工具,我们开

发了多种算法,可用于解析 IMU 的

原始数据。我们对这些算法进行了改

进并创建了许多新的算法,因为分析

结果表明,未来的研究方向具有非常

乐观的前景。

目前我们定义了有关 IMU 数据采

集的 100 多种特征 — 比如平均加

速(每隔 5 秒)、加速计范围、方

差、零点交叉、描述信号光谱的变

量等 — 并且我们将执行有关这些

所有特征的运算。我们将步行时间

(walking session)作为约定的主

要活动基准,并使用带通过滤器消除

杂音,尤其是震颤,因为我们不希望

将震颤错误地解析为高水平活动。

例如,在最近针对 L-DOPA(用于治

疗的 PD 药)效果所开展的临床试验

中,配备了 Fox Insight Mobile IMU

的患者服药并完成几项体力活动(8

次),以测量该药物对身体的影响。

Fox Insight Mobile 平台具备出色的

灵活性,将有助于研究人员随着需求

的增加添加传感器或专业算法,以开

展后续试验。迄今为止,我们在监控

系统中实施了活动水平、活动识别和

震颤识别算法。如果将来决定将监控

扩展至睡眠分析、运动障碍(检测和

量化),或非运动症状,我们只需在

后续发布版中添加必要的算法,并在

后续试验中添加算法所需的其他传感

器。例如,我们可能需要添加心率传

感器,以进行睡眠、REM 睡眠和深

度睡眠模式分析。其他算法可利用皮

肤温度、汗水、卡路里燃烧、血流量

等身体指标。

在项目后期的数据建模和评估阶段,

分析师将把这些解释变量和记录的实

际活动联系起来。评估涉及对所提取

的模式的有效性进行检查。

使用大数据发现这些模式并进行归

纳,不仅可生成有关 PD(以及其他疾

病)的洞察,还可能会在涉及 “多重

比较” 问题时产生 I 类 “假阳性” 结果。

由于随机生成的数据有时会产生有趣

的模式(与因果关系无关),研究人

员和临床医生不得不运用可控试验处

理这些 “产物”,以验证结果的可复制

性。随着数据集的不断增加,遭遇 I

类错误的几率会不断降低,但研究人

员必须采用科学方法验证所获取的洞

察是否确实有效,并存在因果联系。

大数据方案

从我们收集的信息量来看,显然

Cloudera 是该项目的关键部分。

我们使用的可穿戴 IMU 能够记录震

颤、睡眠模式、步态和平衡 — 每台

设备每秒收集 150-300 个原始数据

样本。由于有 1,000 名穿戴 2 台以

上设备的并发用户,因此我们要求

数据仓库能够每天处理大量数据。

Page 7: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

使用可穿戴技术推动帕金森氏症研究

7

迈克尔 J. 福克斯基金会

作为全球最大的非营利性帕金森

氏症研究基金会,迈克尔 J. 福

克斯帕金森症研究基金会助力

于找到帕金森疾病的治愈办法,

并为当前患者提供改进的治疗方

法。为此,基金会积极资助了一

项极具针对性的研究项目,这一

项目在全球范围内得到了科学

家、帕金森氏症患者、商界领

袖、临床试验参与者、捐助者和

志愿者的积极参与。

截止到 2014 年 12 月 31 日,

除了向研究者发起的研究项目

和优先级驱动的研究项目资助

了超过 450,000,000 美元外,

该基金会还从根本上改变了治

疗方法的进展轨迹。目前该基

金会正致力于对医疗研究企业

进行革新,并创建能够促进治

疗发展的系统。

迄今为止,该基金会已经资助

了超过 600 个治疗靶点,并为

60 项临床试验提供支持。

更多信息请访问:

www.michaeljfox.org

Cloudera Enterprise 能够有效地完

成这种繁重的工作负载,原因如下。

第一,Cloudera 使用了 Apache*

HBase,这是一个运行于 Hadoop 分

布式文件系统(HDFS)上的分布式

可扩展数据库。HDFS 是一个支持容

错和具备自我修复能力的文件系统。

HDFS 能够在商用机器上存储数据。

在此基础之上,随着数据量和空间需

求不断增长,用户将能够在不中断运

行的情况下,经济、轻松地添加新服

务器,或热插拔故障硬盘。简而言

之,基于 Hadoop 的解决方案花费的

成本更低,提供的性能更高。

Cloudera Enterprise 还采用 YARN

和 Apache* Spark 以将繁重的工作

负载分成多个任务并卸载到多台服务

器并行执行。这样,处理大量数据的

时间将显著缩短 — 从数天缩短至数

小时。Apache* Hive 数据仓库软件

有助于查询和管理这类分布式存储中

的大数据集,并提供使用 HiveQL 查

询数据的机制。

第三,在 EDH 中,存储和计算可同

时位于集群中的相同物理节点,因此

数据无需前往供其执行的计算位置。

这种数据邻近性支持非统一大数据应

用结合批处理、流传输和交互分析,

以顺畅处理海量数据,丝毫不受网络

带宽等传统瓶颈的影响。

在研究试验的这一阶段,研究人员导

出 EDH 中的数据以供本地分析,不

过后续阶段还可充分利用 Cloudera

的大数据分析功能。从分析的角度来

说,Search 和 Impala 等 Cloudera

工具可帮助研究人员发现新模式和关

联性。Impala 是一种完全集成的分

析数据库,能够以全保真度收集和获

取任意类型和数量的数据。Impala

可发现新数据中的模式,并支持分析

师收集和访问更多样化的数据,从而

发现哪些数据会被泄漏,同时不会对

系统性能造成影响。

得益于这些特性,EDH 可容纳该研

究生成的几万亿兆数据,并支持分析

师近乎实时地执行大数据分析。

借助 Cloudera,所有数据都处于安全

和加密状态,可有效防止侵犯隐私和

黑客攻击凭借内置于最新一代英特尔®

至强® 处理器家族中的 加密优化特

性,数据在智能手机源就已通过机密

ID 进行了匿名化处理,而且在传输、

静态和分析过程中均可实时加密。

Cloudera 的 Navigator Encrypt 功

能支持高性能透明加密,从而可确

保符合法规(比如 HIPAA)要求。

Navigator Encrypt 仅支持具有相应

权限的授权数据库账户访问服务器上

的持卡人数据,而且必须通过获批准

网络客户端上的应用访问。无法访问

Navigator Encrypt 密钥的操作系统

用户将无法读取加密数据。

Navigator Key Trustee — Cloudera

用于管理加密密钥、证书和其他敏感

Hadoop 安全资产的企业级基于软件

的通用密钥管理解决方案 — 可确保

密钥与加密数据分离,并防止云/操

作系统管理员、黑客和未授权人员访

问加密密钥和敏感数据。

Cloudera 的综合安全软件包包括完

整的数据管理(数据保护、集成验

证、授权、加密、密钥管理、审计和

托管),支持您跟踪数据并管理用户

交互。

Page 8: 使用可穿戴技术 推动帕金森氏症研究 - intel.cn · 人们认为这些日记并不可靠,因 为患者往往容易失去持续记录的兴 趣,所以研究者只能从不同患者处

后续步骤

医疗行业无疑是全面应用信息技术手

段的重要行业。作为美国和许多西方

国家在 GDP 方面贡献最大的行业,

医疗行业通过实施数字化,每年可实

现数千亿美元的成本节省。在发现和

治疗领域,采取大数据方法将为医疗

行业创造无限可能。为此,我们需要

更多数据。为了获取更多数据,我们

需要更多患者的参与。

到 2015 年底,我们希望有 1,000 名

并发用户佩戴这些设备,以确保生成

有效、有价值的数据。我们在荷兰开

展的最新试验标志着英特尔和迈克尔

J. 福克斯基金会在全球达成合作的第

四个项目。通过这些试验,我们希望

采用大数据分析技术,为帕金森氏症

研究带来突破性进展。

分析师在第一次检查患者数据时,很

少能够发现新洞察。通常来说,初步

检验可能为更可行的方法提供启发。

通过对计算进行调整,该信息才开始

对后续步骤产生越来越重要的影响。

全球数百位经验丰富的神经学家、数

学家和数据分析师正在寻找类似于我

们这样的庞大数据集,以运用他们的

专业知识提出创造性想法—这便是漫

长的疾病了解与治愈之旅的第一步。

在英特尔,我们希望提供安全的数据

档案和算法设计,帮助推进第一阶段

的发现进展。随着对 PD 数据分析更

加深入的研究,我们希望创建出与

PD 相关的创新算法(例如在线/离线

检测和客观测量)。借助更加多样化

的算法,我们还应该能够在非临床试

验中监控症状(分析原始数据并传输

已处理的数据)。

尽管当前的目标是提高帕金森患者的

生活质量,帮助临床研究科学家找到

有效的治疗方法,但毫无疑问,通过

这些试验所了解到的信息还将帮助人

们解决其他帕金森障碍。此外,我们

的工具、方法和算法还适用于其他临

床试验,有助于攻克其他疾病并获得

其他科学发现。

如欲了解更多有关此类临床试验合作

的信息,请访问 foxtrialfinder.org 并

注册。

为更好地了解帕金森氏症(PD)的复杂性,

研究人员必须了解患者的真实体验。您可以

参与此次在线研究调查,以帮助收集有关帕

金森患者生活的最大数据集。无论您是否患

有 PD,您的信息(安全、保密)都将为寻

找治愈方法提供巨大的帮助

立即注册:foxinsight.org

英特尔技术的特性和优势取决于系统配置,并需要兼容的硬件、软件或需要激活服务。实际性能会因您使用的具体系统配置的不同而有所差异。

任何计算机系统都无法提供绝对的安全性。请联系您的系统制造商或零售商,或访问 www.intel.cn 了解更多信息,

如欲获得本文涉及的带编号的文档复印件或其它英特尔文献,可致电 1-800-548-4725,

或访问英特尔网站:http://www.intel.com/design/literature.htm

英特尔和 Intel 标识是英特尔公司在美国和其他国家(地区)的商标。

* 其他的名称和品牌可能是其他所有者的资产。

英特尔公司 © 2015 年版权所有。保留所有权利。 C 请注意环保 332124-002

使用可穿戴技术推动帕金森氏症研究