Upload
renom-user-group
View
124
Download
0
Embed Size (px)
Citation preview
元BIエバンジェリストが語る!脱獄matplot!
1
今日お話したいこと
2
アンチmatplotではありません
データと向き合う時間を増やしましょう
3
自己紹介
名前:梅津 彰能
経歴:情報分析分野のSales Enginerを16年間機械学習(SPSS Modeler)の経験もあり今年からAIの分野を担当
プログラミング経験はPerlとかShellを少々(得意なほうじゃない)
4
Pythonのグラフ線画ライブラリ
Python使う上では”超常識”
多彩なグラフ機能 見たいときにさっと見れる
5
登場回数の多いmatplot
データ確認 データ加工 学習モデル作成 推論結果確認
6
だが、元BIエバンジェリストはmatoplotでつまづく
というか、とりあえずめんどくさい
グラフの細かい修正もコードの再実行過去の実施内容を辿るのがこんなんー。。
7
なんでグラフ化なんかに頭を悩ませる?
そうだ、Tableau使おう
Tableauってこんなもの
8
BI・可視化ツールDesktopツール
Excel, Database, CSV, JSON等に対応
OutputをTableauへ
9
Python
Tableau Data Extract
(TDE)Tableau CSV
Database
今回の環境
10
• Python2.7
• Renom2.3
• Tableau Desktop(14日間無償)
• Tableau Data Extract API(無料)↑TDEに出力するときに必要
どうやるの?
11
• Matplotに読み込ませるデータをTDE/CSVに出力
• TDEファイルをTableauで読み込む
だけ
TDE出力コード
12
ほぼCSV出力といっしょ1 | from dataextract import * #API Import2 | #TDEファイルのオープン3 | extract = Extract(“sample.tde”) 4 | 5 | #TDEファイルのカラム定義6 | tableDef = TableDefinition()7 | tableDef.addColumn(‘id’, Type.INTEGER)8 |9 | #テーブル定義の追加
10 | table = extract.addTable(“Extract”, tableDef)11 |12 | #データの登録13 | row = Row(tableDef)14 | row.setInteger(0, 1)15 |16 | #抽出ファイルのクローズ17 | extract.close()
Tableauで可視化するメリット①
13
一度結果を出力してしまえばグラフの見栄えや切り口はTableau側で調整
無用な再実行がいらない
Tableauで可視化するメリット②
14
グラフ選択をして、データを新たに生成できる
ちょっとだけプログラムレス
Tableauで可視化するメリット③
15
Confusion Matrixの結果からデータの探索が簡単
もうちょっとだけプログラムレス
まとめ
16
• Prediction含めてデータをExportし計算はBIツール任せ
• 結果を見ながら思考する次の仮説を生み出す過程はBIツールで効率化
• 学習曲線とか見るだけグラフはmatplot