49
opyright Drecom Co., Ltd All Rights Reserved. 情情情情情情情情 情情 bigdata 情

情報処理とは何か あとbigdataとか

Embed Size (px)

DESCRIPTION

2012年夏に一橋大学の一年生向けの情報処理の講義において、講師をさせていただいたときの資料を再編したものです。

Citation preview

Page 1: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理とは何か あと bigdataとか

情報処理とは何か あと bigdataとか

Page 2: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

この資料の背景

一橋大学の一年生向けの講義で利用した資料を一般公開向けに修正したものです文系の学生に「情報処理とは何か」を教えるためのものです

情報処理の考え方を伝える資料です効率のいい情報処理のやり方(二分木とか)には一切触れません

Page 3: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

お前誰よ

@tokoroten株式会社ドリコム勤務ソーシャルゲーム事業部データ分析グループ

R&D&火消し &PM補佐& PO補佐高機能雑用最近、インフラ業務が外れた

社畜グッズとか作ってますhttp://please.shachiku.me/

Page 4: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata

Page 5: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理って何?

情報処理は世界の見方、思考方法

事象

モデル化操作

Page 6: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

大学でやる情報は何でツマラナイの?

モデルを操作するだけだから

事象

モデル操作

ここを教えてはくれない

Page 7: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?物理学事象を数式 (=モデル )にする学問

事象

数式化実験

Page 8: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?法学事象を法律(=モデル)にする学問

事象

法律裁判

Page 9: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?特許事象を特許(=モデル)にする手法

事象

特許裁判

Page 10: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?経済学 (マクロ経済学、ミクロ経済学 )事象を数式(=モデル)にする学問

事象

数式実証

Page 11: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?数学モデルを操作する学問事象は扱わない

事象

モデル化操作

Page 12: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理ってほかの学問と何が違うの?情報処理は他の学問と同一科学の基本は、モデルによる抽象化と操作本質的に違うのは、モデルを操作するプロセスを人間の介在無しに、コンピュータが自動で行うこと大学で教える情報処理モデルの操作しか教えてくれない

本当の情報処理は事象のモデリングを含む

Page 13: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理って何が出来るの?

モデルに対して、人間を超える速度で計算モデルを操作することで現実に影響を与える

情報処理は人間の力を増幅する一人の人間が出来ることが増大

情報処理は全自動で現実に影響を与える既存の学問は現実に影響を与えるのに、人間の力が必要だった

Page 14: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata

Page 15: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

情報処理の力

情報処理の力によって世界が変わった例自動車

F1戦車戦闘機潜水艦回転寿司将棋、チェス

Page 16: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

自動車

Engine Control Unit車の進化=アクセルの抽象化燃料バルブを開く機械的な制御

エンジンの回転数を上げる燃料噴射バルブ、スパークプラグのコントール

車の速度を上げるターボチャージャのコントロールギアのコントロール= AT車

ブレーキの抽象化昔:ディスクブレーキにブレーキパッドを押し付ける現在:ブレーキは速度を下げるのが目的= ABS

Page 17: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

F1

アクティブサスペンションバネではなく、コンピュータで揺れを制御道路の凹凸をモデル化、車体の揺れを最小化ルール改定で禁止に車の性能を向上させすぎる制御が失敗したときにクラッシュする

BOSEの試作アクティブサスペンション

http://www.youtube.com/watch?v=UOWGopZqwd8

Page 18: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

戦車

10式戦車国産第四世代 MBT

アクティブサスペンションを採用戦車砲の反動をリアルタイムにサスで相殺反動は射撃精度の悪化につながる従来は戦車の重量で反動を吸収結果として車体重量の低減

Page 19: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

戦闘機

開発費の六割以上がプログラミング費用Fly by Wire操縦桿とラダーがコンピュータを介して接続毎秒数万回の姿勢制御現在の戦闘機はコンピュータ制御なしには飛べない操縦桿から人間の意志を伝えて、コンピュータが解釈して実行する

コンピュータ制御により機動性が格段に向上肩翼を失っても飛べる

http://www.defense-aerospace.com/dae/articles/communiques/FighterCostFinalJuly06.pdfhttp://www.youtube.com/watch?v=FziBekShqeQ

Page 20: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

潜水艦ソナー、レーダー

ソナー複数のマイクに届く音の時差から相手の位置を推定マイクに届いた音の時差を双曲線グラフ化

双曲線:焦点からの距離の差が一定距離=時差 * 音速

マイク 2 個で線上にいることが分かるマイク 3 個で 2 点、 4 個で 1 点に推定可能

電波でも同様のことが出来るフェーズドアレイセンサー電波天文学、 VLBI法

Page 21: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

すしろー

回転寿司見込み生産の典型例注文があってから作るわけではない

機械学習による生産最適化客の年齢性別から何をどれくらい食べるか推定客層にあわせてロスが少なくなるように寿司を流す客がどれくらい食べたかを計測、あとどれくらい食べるかを推定して流量を決定廃棄率が 4%に (業界平均 6%)

Page 22: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

将棋、チェス

あから 2010清水女流王将に勝利169 台、 676コアの並列コンピュータ

チェス、 IBM Deep-Blue(1997)チェス専用 VLSIを 480基搭載したマシン *30 台

人間に勝つことを目標にしたベンチマーク人間はバイクには勝てないがマラソンをする

Page 23: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata夏休みの宿題

Page 24: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

クラウドって何?

仮想化されたコンピュータ?そんなものはメインフレームの時代からあった

並列化されたコンピュータ?そんなものはメインフレームの時代からあった

クラウドの本質は何?コンピュータ自体の抽象化資本の壁の突破一人の人間が出来ることを増大させる仕組み

Page 25: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

資本の壁

2000年代は、インフラの能力がサービスのスケーラビリティを決定していた

素人が面白いサービスを作っても、 10 台程度のサーバで設備投資が限界に来てしまうその間に大企業が資本にモノを言わせて、同様のクローンのサービスを投入中小企業は大企業に勝てない時代

後だしジャンケンで勝てる時代

Page 26: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

クラウドによる資本の壁の突破

クラウドにより 5 秒でサーバが調達可能にソフトウェアからサーバ追加が可能に

設備投資ゼロで 100 万人規模のサービスユーザ数 * ARPU > 運用コスト なら成り立つ

Dropboxや Instagramは 1000 万人以上のユーザがいるのに、設備は持ってないほとんどが Amazon AWS上で動いている

大企業が後だしジャンケンで勝てない時代

Page 27: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

一人の人間が出来ることを増大させる

コンピュータリソースが抽象化されるコンピュータリソースがコンピュータで制御可能ボタンひとつでコンピュータがいくらでも

クラウドは人間の力を増大させる装置管理コストが不要、資本の壁の突破

Page 28: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata

Page 29: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataって何?

バズワード言う人によって定義が異なる、セールストークここでは以下のように定義「テータ解析をビジネスに反映する仕組み」

例ツタヤ: T ポイントカード小松製作所: KOMTRAX

Page 30: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

T ポイントカードの仕組み

ユーザメリットT ポイントによる割引

店舗のメリットT ポイントによる消費の拡大T ポイント利用者の行動履歴の把握

カルチュア コンビニエンス クラブ・ ・T ポイントカードの解析セグメントをまたいだデータの分析

Page 31: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

T ポイントカードは POSシステムとは何が違うのか?

POSシステムは人の追跡が出来ないPOSは年齢性別セグメントと商品の対応主眼は同時に購買される商品 (と在庫管理)

Ex) カレーの材料は近くに置くとよく売れる

T ポイントは人の追跡をするレストランでドリアを食べた人は、ドラッグストアで何を買うか?初回にドリアを食べた人は、次もドリアを頼むか?頼まれやすいけど、二度と頼まれないメニューはあるか?

Page 32: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

小松製作所: KOMTRAX

小松製作所世界シェア 2 位の重機メーカーTOPIX Core30 企業

KOMTRAXコマツの重機を衛星通信で管理するシステム重機の稼働状況を集中管理

Page 33: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

KOMTRAXのビジネスモデル

数千万円の車体に、月額 5000 円の衛星電話費用対効果としては十分

http://www.komatsu-kenki.co.jp/service/product/komtrax/

Page 34: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

KOMTRAXのビジネスモデル

重機の異常を事前に把握稼働率やエンジンやオイルの状態を常時監視兆候が出たらメンテナンスを推奨重機が故障することによる機会損失の回避小松以外がメンテナンス出来ないため、利益率向上

重機の遠隔ロックGPS 管理で盗難防止、ローンを払わない顧客対策銀行が融資の条件として、コマツの重機を要求

重機の稼働率から住宅着工件数を把握リーマンショック前に北米住宅市場の崩壊を把握してた数少ない企業 → 重機の生産調整 世界の石炭産出量もコマツは知っている

Page 35: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata

Page 36: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataが出来る組織と出来ない組織

2 種類の bigdata

トップダウンの bigdataサービスの提供が目的T ポイントカード、 KOMTRAX

ボトムアップの bigdata自社の改善が目的ソーシャルゲーム屋

Page 37: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataはどこで生まれるのか?

データが生まれるのは運用の現場

研究部門がログデータを手に入れる必要研究部門から運用の現場は遠い

研究 開発 運用

ログデータ

Page 38: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataが出来ない大企業

持株会社

研究所 事業会社

運用会社

外注 外注

運用会社

外注 外注

事業会社

運用会社

外注 外注

運用会社

外注 外注

運用会社

外注 外注

ログ

Page 39: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataの PDCA

Bigdataの PDCAは従来の組織構造ではまわせない

Plan

Do

Check

Action 運用会社

研究所?

事業会社Research

研究所

×

Page 40: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

Bigdataは何を変える?

Bigdataは意思決定を迅速にする金鉱を探す早い段階から兆候を見出す意思決定とは戦略を変えること

現場で生まれたデータを意思決定に反映現場と距離が開いてしまった大企業は、意思決定の速度が大幅に遅れてしまった

Page 41: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

ソーシャルゲーム屋の組織構造

基本的に社員はすべてのデータが見れる組織が近いので、やり取りが迅速

分析者はアプリチームに入ってディレクターの真横で分析作業

ソーシャルゲーム事業部

陰陽師 ビックリマン

ドラゴン×ドライツェン

戦国フロンティア データ解析 インフラ

部ユーザサポート

アプリケーションごとの開発・運用ライン

Page 42: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

ソーシャルゲーム屋さんの PDCA

ログデータと開発が近い、 PDCAが回る

Plan

Do

Check

Action 開発ライン

データ解析

開発ラインResearch

基盤部

開発ライン

Page 43: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

本日のアジェンダ

情報処理って何?情報処理の力クラウドって何?Bigdataって何?Bigdataが出来る組織、出来ない組織ソーシャルゲームの bigdata

Page 44: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

ソーシャルゲームの bigdata

ユーザの属性情報年齢、性別

ユーザのゲーム内の属性レベル、お金、所持カード、行動力

ユーザの行動どこのページにアクセスしたかアクセス頻度アイテムの購買、使用履歴

Page 45: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

データ解析の流れ

仮説構築「スマホユーザはガラケーユーザよりも、お金をたくさん使うのではないか?」

仮説検証アクセスログからスマホとガラケーのユーザ抽出売り上げのログから、それぞれを集計母集団が異なるので、母集団で割って正規化課金率の算出平均課金額の算出

Page 46: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

ABテスト、対照実験

ABテスト:異なる情報を提示して観察広告とゲームメニューの位置関係文字の大きさ※特定のユーザが不利になることはしない

異なってしまったものを元に解析するユーザの利用端末ごとの分析年齢性別セグメントの分析初期にドロップしたレアの差から、その後を追跡

Page 47: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

生涯収益の計算

生涯収益の予測新規ユーザを獲得した場合、そのユーザが生涯においていくら支払ってくれるか広告出稿の基準にする

100 万円の広告で 1 万人が獲得できる獲得単価= 100 円

生涯収益 > 獲得単価広告費をかければかけただけ利益が上がる状態サーバを増やせばユーザ数はスケールする生涯収益を計算することで、獲得単価の高い広告を利用できる(テレビアニメ化など)

Page 48: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

データ分析者に必要なもの

仮説を構築できる直感、経験値仮説を数式に変換できる統計力ログの海から必要な情報を引き出すデータを可視化できる図からゲームの状態を読み取る生データを加工して、特性を探し出す現場に伝えるコミュニケーション能力分析結果を活かすための企画力

Page 49: 情報処理とは何か あとbigdataとか

Copyright Drecom Co., Ltd All Rights Reserved.

まとめ

情報処理は抽象化した世界を操作する情報処理は世界を全自動で高速に書き換えるクラウドはコンピュータの抽象化人間の限界を上昇させる

bigdataは意思決定の高速化、自動化bigdataは組織論ソーシャルゲーム屋のデータ分析はビジネスに直結データ分析は現場とのコミュニケーションデータ分析と運用の現場が近くないと意味がない