14
1 © 2019 The MathWorks, Inc. MATLABによる大規模フリートデータ解析 Part 2: クラスター編 MathWorks Japan アプリケーションエンジニアリング部 齊藤 甲次朗

MATLABによる大規模フリートデータ解析 Part2: クラスター編 · 3 ビッグデータの扱い フリートデータ解析 サマリー デスクトップPCでの解析

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

1© 2019 The MathWorks, Inc.

MATLABによる大規模フリートデータ解析

Part 2: クラスター編

MathWorks Japan

アプリケーションエンジニアリング部

齊藤 甲次朗

2

アジェンダ

▪ フリートデータ解析実践

– クラスターへのスケールアウト

3

ビッグデータの扱いフリートデータ解析 サマリー

デスクトップPCでの解析

ステップ1 ステップ2

Hadoopクラスターでの解析

Hadoop® / SparkTMPart 1

4

フリートデータ解析実践クラスターへのスケールアウト

▪ Hadoop

– ビッグデータのためのプラットフォーム

– HDFS: 分散ファイルシステム

– YARN:リソース管理やスケジューリング

– Hadoop MapReduce: MapReduceフレームワークの実装

▪ Spark

– クラスター計算のフレームワーク

– フォールトトレラントな分散処理

– 機械学習のような繰り返し演算に適性あり

– Hadoop YARNと連携可能

5

フリートデータ解析実践クラスターへのスケールアウト

▪ MATLABとHadoop/Sparkの2つの連携方法

# 用途 使用する製品 対象ユーザー

1 • MATLABからtall配列の処理をSparkで実行

MATLAB Parallel ServerTM • 試行錯誤でアルゴリズムを検討するユーザー

2 • tall配列の処理をSpark上でスタンドアロンアプリで実行

• Spark APIを使ったスタンドアロンアプリの実行

MATLAB CompilerTM • 定形処理を利用するユーザー

• SparkのAPIを細かく制御した処理を作成したいユーザー

MATLAB

Runtime

※MATLAB Distributed Computing Server TMは、R2019aからMATLAB Parallel Server TMに名称が変わりました。

6

HDFS

フリートデータ解析実践クラスターへのスケールアウト

▪ MATLAB Parallel Serverを使ったHadoop/Spark連携

Master / Nameノード

YARN

Edgeノード

クライアントライブラリ

MATLAB tall処理の投入

Workerノード

Executor Cache

Task

ワーカー

データノード

Workerノード

Executor Cache

Task

ワーカー

データノード

Workerノード

Executor Cache

Task

ワーカー

データノード

凡例

Hadoop

Spark

7

フリートデータ解析実践クラスターへのスケールアウト

MATLABデスクトップでの処理 Hadoop/Sparkクラスターでの処理

クラスターの設定とファイルパスの変更だけで

MATLABの処理は書き直さずにスケールアウト

8

フリートデータ解析実践クラスターへのスケールアウト

9

フリートデータ解析実践走行データ解析

サンプルデータの作成

分類学習器でドライブの8クラスのモデルを作成

10

フリートデータ解析実践走行データ解析

▪ Hadoop/Sparkクラスターで分類分類学習器で作成したモデルを読み込み

分類モデルにtall配列を適用

11

フリートデータ解析実践走行データ解析

分類結果をwordcloudでプロット

ドライバー1ドライバー2 ドライバー3

ドライバー4

ドライバー5

12

まとめ

13

Key Takeaways

1. 大規模なフリートデータをdatastoreやtallを用いて簡単に処理

2. デスクトップPCからHadoop/Sparkクラスターへ、コードを書き直さずに

スケールアウトが容易

眠っているビッグデータをMATLABで解析してみませんか?

14© 2019 The MathWorks, Inc.

© 2019 The MathWorks, Inc. MATLAB and Simulink are registered trademarks of The MathWorks, Inc. See www.mathworks.com/trademarks for

a list of additional trademarks. Other product or brand names may be trademarks or registered trademarks of their respective holders.