78
最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML GMOインターネット 次世代システム研究室 野田純一 1

最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

Embed Size (px)

Citation preview

Page 1: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

最新!2015年 クラウドAI プラットフォーム比較AzureML & AmazonML

GMOインターネット 次世代システム研究室野田純一

1

Page 2: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2

研究の目的

•自前で機械学習基盤を用意しなくても、機械学習での解析ができるクラウドAIサービスが2015年にAmazon、Microsoftから相次いでリリースされた。

!

•それぞれのクラウドAIサービスを使って実際の機械学習の解析を行うことで、機能比較調査を行い今後のクラウドAIのトレンドを掴みたい。

Page 3: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

アジェンダ

1.クラウドAI概要 2. Azure Machine Learningについて 3. Amazon Machine Learningについて 4. Azure ML Project Oxfordについて 5. まとめ

3

Page 4: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

1.クラウドAI概要

4

Page 5: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

1.クラウドAI概要

機械学習の演算処理をクラウドに任せることができる。 クライアントはデータを送り処理結果を受け取るだけ。

機械学習のために大規模インフラを用意することが不要になる。

5

Page 6: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

1.クラウドAI概要

6

Page 7: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

1.クラウドAI概要

クラウドAI自体にWEBデプロイ機能(REST APIサーバー化) もあるが料金は比較的高額なので、料金を考慮し場合によっては自社サーバのデータベースにクラウドAIの結果を格納し、

REST APIを自前で作るほうがよい。

クラウドAIのWEBデプロイ機能について

https://azure.microsoft.com/ja-jp/pricing/details/machine-learning/ https://aws.amazon.com/jp/machine-learning/pricing/

7

Page 8: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

1.クラウドAI概要 クラウドAI 一覧

サービス名 サービス開始時期 概要

AzureML 2015年2月データ分析だけでなく画像、音声認識も追加

AmazonML 2015年4月Amazonの既存サービス

との連携可能

Google Prediction API 2010年Google Cloud Platform

との連携が可能

IBM Bluemix Watson 2014年6月Watsonの一般開発者向けのバージョン、日本語向け

の対応はこれから

8

Page 9: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. Azure Machine Learning

9

Page 10: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureMLマイクロソフトのクラウドAI Azure Machine Learning StudioというGUI操作で 機械学習を使った解析ができるのが特徴。

https://studio.azureml.net/10

Page 11: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML料金について

FREE STANDARDAuthentication Microsoft account Azure subscription

Max Number of Modules per Experiment 100 Unlimited

Max Experiment Duration 1 hour NoneMax Storage Space 10 GB Unlimited - BYO

Execution / Performance Single node Multiple nodesStaging Web API Yes (Throttled performance) Yes (Selectable performance)

Production Web API No YesSLA No Yes

Free版、Standard版(有料)があるが、 試すにはFree版で十分、機能制限はほぼない。

https://azure.microsoft.com/en-us/pricing/details/machine-learning/

11

Page 12: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML例1: 回帰分析 為替レートを元にした日経平均株価予想

https://www.youtube.com/watch?v=c1NLhIzAgp8

2002年から2015年9月16日までの日経平均株価と為替レートの2軸グラフ

12

Page 13: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

今回は米ドル/円為替レートが予めわかってる状態で、日経平均株価が不明なシチュエーションがあったと想定して

米ドル/円為替レートを元に日経平均株価を予想するデータ分析をAzure Machine Learningでやってみます。

!

回帰分析は、過去データを使用するため過去の日経平均株価と為替の情報をまずML Studioにアップロード

する必要があります。

13

Page 14: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

使用する過去データ(2012/1/12 - 2015/9/16)のCSVの形式日付 USD 日経平均

2012/1/12 76.92 8385.59

2012/1/13 96.81 8500.02

2012/1/16 76.84 8378.36

未来予測したい対象の日付のデータファイル(CSV)

日付 USD 日経平均

2015/9/17 120.539 0

2015/9/18 120.539 0

14

Page 15: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

ML Studio にファイルをアップロード

15

Page 16: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

16

Page 17: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

17

Page 18: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML予測結果

今回は為替ドルも予測して記入しているデータのため実際の値より 500円~600円高い数値になってしまった。精度を高めるには為替以外の

要因も考慮し、数値列をCSVに増やしていく必要がある。

18

Page 19: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML作成したモデルの精度を確認する方法

19

Page 20: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML機械学習モデルが予測した過去の値と実際の値の乖離を確認

20

Page 21: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML例2: 回帰分析 2015年度の千代田区の犯罪発生件数を未来予測する

平成 年度 犯罪発生件数 総人口 人口増加数17 2005 5442 42968 129218 2006 5246 43933 96519 2007 5068 43933 102120 2008 4475 45461 50721 2009 4277 46060 59922 2010 4156 47138 107823 2011 3813 47887 74924 2012 3612 48538 65125 2013 3735 52284 374626 2014 3593 54160 1876

http://www.city.chiyoda.lg.jp/koho/kuse/toke/kisotoke/h27-shiryo.html

21

Page 22: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML犯罪発生件数と人口増加推移の関係

青軸が犯罪発生件数 緑軸が人口増加推移数

22

Page 23: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureMLグラフからから読み取れるのは !

• 犯罪発生件数は人口の数とは関係なく年々下がっている • 犯罪発生件数は年々さがっているものの、その数は人口増加推移に左右されている

• 人口増加が多い年は犯罪発生件数は下がり幅が弱くなり、むしろ去年より大きくなったりしている

!

千代田区の人口増加推移と犯罪発生件数に関連性があると分かったところでAzureMLの回帰分析で未来予測をしてみます

23

Page 24: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureMLBlank Experimentを選択

24

Page 25: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

[Saved Datasets]->[My Datasets]->過去履歴のCSVをキャンバスに配置 [Data Transformation]->[Manipulation]->[Project Column]を配置

25

Page 26: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

[Project Column]のLaunch column selectorを押して CSVヘッダカラムから解析に使用するカラムを選択

26

Page 27: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML過去データを使って作成したモデルの精度を確認

27

Page 28: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML誤差がほぼ100以下

28

Page 29: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML比較グラフもほぼ垂直に

29

Page 30: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML実際に未来予測を行う

実際に未来予測として2015年度の犯罪発生件数を予測します。千代田区のHPに平成27年-2015年の人口増加データはすでにあるため犯罪発生件数は予測可能になります。

chiyodaku_future_crime_rate.csv平成 年度 犯罪発生件数 総人口 人口増加数27 2015 0 56873 2713

30

Page 31: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

Train Model と chiyodaku_future_crime_rate.csvを接続

31

Page 32: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

RUNボタンをクリックし、 緑のチェックがついたらScore Model を右クリックし

[Scored Dataset]->[Visualize]を選択

2015年度の千代田区の犯罪発生件数は3672人と予測されました。

32

Page 33: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML平成 年度 犯罪発生件数 総人口 人口増加数17 2005 5442 42968 129218 2006 5246 43933 96519 2007 5068 43933 102120 2008 4475 45461 50721 2009 4277 46060 59922 2010 4156 47138 107823 2011 3813 47887 74924 2012 3612 48538 65125 2013 3735 52284 374626 2014 3593 54160 187627 2015 3672 56873 2713

33

Page 34: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

今年度は人口増加が去年より多いので犯罪発生件数も少し多そうです。 納得の結果が解析できました。

34

Page 35: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureML

DEMO例2: 回帰分析 人口増加率から今年度の犯罪率を予想

https://www.youtube.com/watch?v=-7YTTOlbS8I

35

Page 36: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

2. AzureMLAzureMLを触ってみた感想

• データさえあればすぐに機械学習解析がブラウザでできるのが画期的。

!

• 操作はGUIで直感的だが、それでもエキスパートに講習を受けないと自由自在にモジュールを組み合わせるのは難しい。 !

• ML Studioでエラーが出るとログは閲覧できるがプログラムのエクセプションそのものでユーザーに解るようになっていない不親切な設計。

!

!

! 36

Page 37: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. Amazon Machine Learning

37

Page 38: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonMLAmazonのクラウドAI S3 RDS Redshift といった既存のAmazonプラットフォームから解析データを取り込めるのが特徴。

https://aws.amazon.com/jp/machine-learning/

38

Page 39: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

39

Page 40: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

40

Page 41: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

41

AzureMLと比較するため、千代田区の犯罪件数の予測を AmazonMLの回帰分析で行います。

Page 42: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

42

データソースにS3かRedshiftを選択

Page 43: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

43

カラムの型を選択

Page 44: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

44

予測対象のカラムを選択(今回は犯罪件数)

Page 45: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

45

モデルが作成され解析手法に「回帰分析」が自動的に選ばれる

Page 46: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

46

モデルを作成したら、「batch prediction」で予測を行う

平成 年度 犯罪発生件数 総人口 人口増加数27 2015 0 56873 2713

Page 47: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

47

処理結果を配置するS3パスを指定

Page 48: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

48

S3にデータが格納される

[usr1111]$ aws s3 ls testnoda/batch-prediction/result/ 2015-09-28 15:49:53 71 bp-W4x5H2hiRRG-chiyodaku_furure_crime_rate.csv.gz

[usr1111]$ cat bp-BpVBzaTmWka-chiyodaku_furure_crime_rate_z.csv trueLabel,score 0,2.952443E3

Page 49: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonMLAmazon MLまとめ2

• 解析手法(二項分類、多項分類、回帰分析)がファイル(CSVなど)のデータによって自動選定される。

!

• AmazonMLの特徴=メリットが既存のAWSとの連携という点 ということは、逆にいうとAWSに熟知していないエンジニアやデータ解析者はまず、AWSのお作法を覚える必要があり、本来

のデータ解析の時間をそれに費やされることになる。 !

解析アイディアをすぐ試せないのは致命的。

49

Page 50: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

3. AmazonML

50

Page 51: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

51

Page 52: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

52

AzureML AmazonML

予測分析 あり あり

音声画像認識 Project Oxford なし

Page 53: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

Microsoft Azure OxfordとはAzure MLの 画像音声認識APIサービス

https://dev.projectoxford.ai/

53

Page 54: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

54

Page 55: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

機能名 概要 用途

Face API 顔写真から年齢と性別を判定 写真を比較し同一人物かを判定

監視カメラ、防犯、 店内の顧客解析

Speech API 音声のテキスト化、テキストの音声化

コールセンター ロボット

デジタイルサイネージ

Computer Vision API

画像のサムネイル、文字の読み取りなど。顔判定もあり。

ニュースキュレーションサイトの画像サムネイル

LUIS テキスト分析 ソーシャルメディア分析

55

Page 56: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford各種APIにデモサイトが用意されている

56

Page 57: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

ポイント• REST APIでの呼び出し • 教師データを自前で用意するのではなくマイクロソフトが持っている判定アルゴリズムを使う。(年齢性別判定が誤っていても修正はできない)

• 画像解析に関してはマイクロソフトが力を入れているアダルト判定、児童ポルノ判定、犯罪対策系の分野が強い。

• 日本語対応はまちまち。 • 二次元のアニメ画像などには勿論対応していない。 • 顔判定は強いが逆に風景や食べ物などそれ以外は弱い。

57

Page 58: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project OxfordOCRの機能、日本語も可能

58

Page 59: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

Computer Vision API以後はComputer Vision APIに絞って利用例を説明します

59

Page 60: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

人間 VS AI を比較実験してみます。 次の画像に写っている女性の人数と年齢をできる

だけ正確に数えてください。 (2秒)

60

Page 61: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

61

Page 62: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

Project Oxfordを使えば精度は多少粗いが 1秒で画像に写った全ての

人物の年齢と性別の判定が行える。 残りの1秒で画像に情報を書き込み。

62

Page 63: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

63

Page 64: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

• 精度は完璧ではなく、7~8割の精度になります。 • たまに男性と女性を間違えたり、年齢が20歳以上ずれたり・・・。 • 粗い画像だったり、カメラのズーム機能でとった写真(荒くなる)などでは特に年齢性別が狂います。

• なので精度としてはPOSレジの精度と同レベル。

• POSレジでは性別を間違える事は通常ないはずだが、年齢の刻み幅がそこまで細かくはないので、精度としてはProjectOxfordと同レベルでしょう。

64

Page 65: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

65

Page 66: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

66

Computer Vision API の 性別年齢判定の活用事例として 秋葉原歩行者天国の性別と年齢の分布を調査しました

Page 67: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

調査対象日: シルバーウィーク 日曜日 9/20 調査対象:無作為選択 122人

男性数 75

女性数 47

男性平均年齢 33

女性平均年齢 24

全体平均年齢 30

67

Page 68: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

68

精度は荒いものの、納得のいく結果に

Page 69: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project Oxford

http://imgur.tokyo/a/

デモサイト:Computer Vision APIを呼び出し画像に 年齢性別を書き込む

69

Page 70: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

4. Project OxfordProject Oxfordまとめ

• 今まで人の手を介していた街頭の年齢調査の仕事やコンビニのPOSレジの年齢ボタン押下の手間を無くす素晴らしい利用方法があります。 !

• 画像認識システムや機械学習サーバーを構築せずとも一個人が年齢性別識別機能を使ってデータ調査ができるようになった点が画期的です。

!

70

Page 71: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5.まとめ

71

Page 72: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめAzureML vs AmazonML

AzureML AmazonML機械学習手法選択 マニュアル 自動

機械学習手法の種類 豊富 少ない

画像解析 あり なし

音声解析 あり なし

データ解析環境 ブラウザ ブラウザ

解析環境形式 GUI (ML Studio) 簡易ウィザード

WEBデプロイ機能 あり あり

解析元データ 格納場所

ブラウザアップロード HDInsight

SQL Data Warehouse

S3 RDS

Redshift

72

Page 73: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめ機械学習手法の比較

AzureML AmazonML

回帰分析 あり あり

二項分類 あり あり

多項分類 あり あり

クラスタリング あり なし

リコメンド あり なし(※)

※Amazonの見解では「既存のアルゴリズムでリコメンドも可能」

73

Page 74: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめ料金比較表

単位 AzureML AmazonML

ML使用基本料金 月額 ¥1,018 なし

バッチ予測 時間 ¥102 0.42USD

予測件数 なし 0.10 USD/1,000件

リアルタイム予測

時間 ¥204 なし

予測件数 ¥51/1000 0.1USD/1000

データサイズ なし0.001USD/

モデルデータ10MBごと

74

Page 75: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめ

75

AzureML AmazonML

メリット • 機能が豊富で操作も直感的 • AWSサービスとの連携

デメリット• AWSに比べてAzureユーザーが少ない

• 選択できる機械学習手法が少ない • データに日付型がない • 処理結果が何故かIEEE形式 • S3を経由しないと何もできない

Page 76: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめ クラウドAI 所感

• クラウドAIを利用すれば、解析アイディアがすぐに試せるのは革新的。

• 解析対象のデータとアイディアがあればインフラもプログラムも不要。

• 最低限の機械学習の知識は必要だがブラウザ操作で誰でも未来予測ができるのは世界が変わるきっかけになりうる。

!• 全データサイエンティスト時代に。 !

76

Page 77: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

5. まとめ 参考文献クラウドではじめる機械学習 Azure MLでらくらく体験 AzureML解説本の決定版、AzureMLそのものよりも機械学習アルゴリズムの説明が豊富。

日経コンピュータ 2015年8月20日号発売当時の最新のクラウドAI事情をまとめてる良本。クラウドAIを使う会社、自社で機械学習を作る会社、専門の会社と提携する会社など今後AIと向きあう3つの選択肢についても紹介。

77

Page 78: 最新!2015年 クラウドAI プラットフォーム比較 AzureML & AmazonML

ご静聴ありがとうございました

78