データ解析 - 東京工業大学watanabe- · 機械学習のモデルは、学習によってどんな関数になることも ... 数理統計学（金森先生） ... 最適化理論

データ解析

渡辺澄夫

第15回：実世界

推定と検定解析方法

観測データ

実世界との戦い

実世界

現代のデータ解析

4

ますます強大化する実世界

実世界は、超高次元、際限なく複雑、非定常・・・

簡単なデータ解析だけでは、もう戦えない・・・

実世界

5

機械学習の登場

りんご・・・みかん・・・ぶどう・・・

学習くん

6

人間の関数は

言葉で説明できない

人間

これは紅茶ですが、なぜ私が

紅茶だとわかるか説明できません

昔人間は計算機科学から最も遠かった

7

できるけど説明できない・・・

できるけど説明できないことはたくさんある

◎ 歩く走る泳ぐ自転車に乗る

◎ 文字を読む漫画を読む友達を見つける

◎ 言葉を聞き取る話しをする

説明できない → 教えられなかった

人間人工知能さん

教えられない！

8

１実世界はまったく

知りません

人工知能さん

２

人間

なぜ世界を認識できるかを言葉で語ることは難しい

例を頼りに学習します

人工知能さん

４

世界を学習できるように僕を作ってね

人工知能さん

実世界

３

学ぶ= まねる

りんご・・・みかん・・・ぶどう・・・

人工知能さん

人間学習

9

人間や生物が学習できる仕組み

人間は神経回路を持っている。

学習する＝神経回路が

変化する

10

「学習」の構造

神経回路網の答えと正しい答えの誤差は

(y-f(x,w))2

誤差が小さくなるようにw を変えていく

画像 x

結合荷重 w

神経回路の答 f(x,w)

正しい答 y 誤差

11

1 実世界は美しく多様じゃ

人間

沢山の練習問題

きっと世界を認識します

神経回路搭載！

４

テストをします

そろそろ試練の時じゃな

ほとんど人間と同じになった

人工知能になった

２りんご・・・

練習の鬼

練習：

1000個・・・・・・りんご

根性

差が学習誤差

３・・・

練習：

1000000個・・・・・・

12

知らないものでも予測できる

5 りんご！

テスト：

未知のものりんご!!

差が汎化誤差勝負じゃ

◎ たくさんの例を学習すると神経回路網は知らないものについても正しく答えられるようになってくる。

人間には負けないぞ。

学習曲線とは

データの個数 n

汎化誤差＝未知のものに対する誤差

G=G(n)

G

機械学習は何にでもなれる・・・。

機械学習のモデルは、学習によってどんな関数になることもできる。学習曲線を解明するには、現代数学が必要だ・・・。

学習学習学習学習

学習

顔から笑・怒・悲を読み取る

「顔から喜・怒・哀を読み取る人工知能」を作ってみよう。

x1 x22

喜・怒・哀

顔の情報

学習してみた

大学院では

確率論（三好先生）

関数解析（西畑先生）

数理統計学（金森先生）

情報理論（樺島先生）統計数理（金森先生）

確率微分方程式（中野先生）

微分幾何（梅原先生）

応用確率論（三好先生）

最適化理論（福田先生・山下先生）

学習理論機械学習

観測データ

新しい世界へ

実世界

深層学習

カーネルマシン

ベイズフィルタ

空間統計経験過程微分幾何

代数幾何

データ科学の未来

データ科学を切り拓くためには、これまでの理論では不十分。

⇒ 数学がどうしても必要だ！

⇒ 数学の才能が社会から強く求められている・・・。

⇒ 数学者にとって幸せかどうかはわからないが・・・。

（注）数学・数理科学の才能は、ますます社会から必要とされるようになっていくでしょう。⇒ あなたの人生において本当に大切なものが何かを問い直してみましょう。

20

人工知能と人間・社会

21

機械学習＋データ解析 ≒ 人工知能

いま、機械学習によるデータ解析は「人工知能」と呼ばれるようになっています。

以下では、「人工知能」について考えてみましょう。

22

説明できないけど学習できる→ 説明はできないままである

人工知能によって、人間の機能の中で「説明できないこと」を獲得できるようになった。しかし、相変わらず説明はできない。

「ギャグ漫画を読む→くすくす笑う」ができるようになった統計モデルに対して、「心から面白いから笑っているのか」と問うことができるかどうかはまだわかっていない。

実は人間に対しても、それはできない。人工知能の問題点と言及されることは、実は人間に対する理解の不足が原因である・・・。

23

未来に向かって今は

人工知能の新しい使い方が次々に発表されています。誰でも使えるプログラムも公開されています。マスメディアでセンセーショナルに宣伝されています。ちょっとおおげさ過ぎる報道もあるようですが・・・。

（まじめに取材して報道しているメディアを応援しましょう。）

いずれにせよ、まずは基礎から。ゼロからの出発です。

どんなことに使われているのかな

○音声画像の認識 ○自動翻訳

○流行歌・映画・絵画・小説の自動生成

○法律事務の自動化

○医療診断 ○自動製薬

○自動運転 ○囲碁・将棋

○経済金融 ○会社の経営 ○消費者解析

○農作業・工場・配達の自動化

25

人間の仕事が減るのかな

○でも、人間の仕事の中には人工知能でできるものも多いのではと言われています。

○ 「産業や社会がどのようであるのが望ましいか」を考え始める時期に来ています。過去に戻ることはできません。

○人工知能が広く使われるようになると、新しい仕事も生まれるかもしれないです。

○もしも人工知能によって人の仕事が減るのなら仕事をなくした人に政府が給与を払うべきという意見もあります。

○実際にどのくらい人工知能が働いてくれるかはまだわかりません。

わが社では社員を人工知能にしました。実は社長は以前から。

26

科学や技術が社会を変えることがある

蒸気機関 → 汽車・船ができる → 大規模工場ができる

→ 会社ができる → 「サラリーマン」ができる

→ ペリー来る → 明治維新

人工知能 → いままで当たり前だと思っていたことをもう一度考えなおすことが必要になる。

（例）何のために働くの？どうなれたら幸せなの？

もしも「生きるために働く」がなくなると・・・。

現在

生きるためにお金が必要。

お金のために労働が必要。

働くためにはますます高度な人間力が要求される。

お金のための労働はいらない。生きる意味として新しい価値が出現する。

週休3日・・・4日・・・5日・・・

要求される人間力アップ20% ・・・ 40% ・・・ 80%

人間はいつかどうなるのか。それまでにどのような社会を通過するのか

わずかに残る労働を巡って激烈な競争。人間力満々なヤリテな人が富を独占。

100年後(?)

28

何処へ

未来を決めるのは人間の

何だろう？

まとめ

データ解析を含む情報技術は少しずつであっても

確実に社会や産業を変えていきます。

過去に戻ることはありません。

未来を考え始めるときがきています。

30

みんなの未来へ

統計学と機械学習は科学あるいは技術なので、みんなの幸せに役立つかどうかは、使い方しだいです。

もう皆さんの時代です

今度こそ人類は科学あるいは技術を賢く正しく使って欲しいと思います。

（注）歴史的に見て、人類が科学あるいは技術を賢く正しく使えなかった例が多いことを私たちは理解する必要があります。

データ解析スライド番号 2スライド番号 3ますます強大化する実世界機械学習の登場人間の関数は�言葉で説明できないできるけど　説明できない・・・スライド番号 8スライド番号 9「学習」の構造スライド番号 11知らないものでも予測できる学習曲線とはスライド番号 14スライド番号 15スライド番号 16スライド番号 17スライド番号 18スライド番号 19人工知能と人間・社会機械学習＋データ解析　≒　人工知能　説明できないけど学習できる　�→　説明はできないままである未来に向かって　今はスライド番号 24人間の仕事が減るのかな科学や技術が社会を変えることがあるもしも「生きるために働く」がなくなると・・・。何処へまとめ　みんなの未来へ

Documents

データ解析 - 東京工業大学watanabe- · 機械学習のモデルは、学習によってどんな関数になることも ... 数理統計学（金森先生） ... 最適化理論