Download pdf - 人工知能は人間を超えるか - kansai.main.jpkansai.main.jp/swfu/d/bookcafe20160312.pdf · 2016/3/13 1 人工知能は人間を超えるか ――ディープラーニングの先にあるもの

2016/3/13

1

人工知能は人間を超えるか――ディープラーニングの先にあるもの

著者松尾豊

東京大学大学院工学系研究科技術経営戦略学専攻特任准教授

産業技術総合研究所人工知能研究センター企画チーム長（兼任）

人工知能、トップ棋士を撃破「アルファ碁」初戦で

３月９日の韓国棋士イセドルとの五番勝負の初戦は衝撃の結果となった。ついで１０日もアルファ碁は連勝した。

グーグルの自動運転車本書目次

• 序章広がる人工知能――人工知能は人類を滅ぼすか

• 第1章人工知能とは何か――専門家と世間の認識のズレ

• 第2章「推論」と「探索」の時代――第1次AIブーム

• 第3章「知識」を入れると賢くなる――第2次AIブーム

• 第4章「機械学習」の静かな広がり――第3次AIブーム(1)

• 第5章静寂を破る「ディープラーニング」――第3次AIブーム(2)

• 第6章人工知能は人間を超えるか――ディープラーニングの先にあるもの

• 終章変わりゆく世界――産業・社会への影響と戦略

2016/3/13

2

人工知能はいま３度めのブーム• 第１次AIブーム（19561960年代）：探索・推論の時代

ダートマスワークショップ（1956）

人工知能（Artificial Intelligence）という言葉が決まる

世界最初のコンピュータENIAC(1946)のわずか10年後

（...冬の時代）

• 第２次AIブーム（1980年代）：知識の時代

エキスパートシステム

第５世代コンピュータプロジェクト：通産省が570億円

（...冬の時代）

• 第３次AIブーム（2013年）：機械学習・表現学習の時代

ウェブとビッグデータの発展

計算機の能力の向上

第３次AIブーム

人工知能研究の流れ

人工知能とは何か

〈研究者の定義〉

中島秀之公立はこだて未来大学学長：人工的につくられた、知能を持つ実体。

知能自体を研究する分野

西田豊明京大教授：『知能を持つメカ』『心を持つメカ』

著者の森尾豊：人工的につくられた人間のような知能、それをつくる技術。

研究者は知能を「構成論的」に解明する研究をしている。脳科学者の場合は

分析論的なアプローチで知能を解明しようとしている。

〈一般的な見方〉

状況に応じた賢い振る舞い⇒入力応じて出力が変わる

2016/3/13

3

人工知能とは？

一般的には、見聞きしたものを認識すること、会話をすること、推論すること、複数

の事象から何らかのパターンを発見することなど、「人間ならではのさまざまな知的

能力」を、コンピュータをはじめ自動車や家電など、いろいろな機械の上で実現する

ための技術を指す。

人間の脳を真似ることから始まった人工知能研究は、溯ると５０年前から始まってい

るが、大きな社会的な関心とはならなかった。しかし、１９９０年代の脳の視覚野の

情報処理メカニズムの解明が１つのブレークスルーとなり、それを数学的なアルゴリ

ズムで表せるようになったことで、コンピュータに取り込み、画像認識が格段に進み、

それがディープランニングにつながった。

人工知能が社会に及ぼす影響、その恐れと期待が高まってきている。

モデルは神経細胞

ジグモイド関数は生物の神経細胞がもつ性質をモデル化したもの

ニューラルネットワーク人工知能の４段階

レベル１：単純な制御プログラム（家電などに組み込まれている）

レベル２：古典的な人工知能。多彩な振る舞い（探索、推論）のパターンを

もつ。例としてはお掃除ロボット、AI将棋、応答ロボットなど

レベル３：機械学習を取り入れた人工知能。機械学習とはサンプルとなる

データをもとに、ルールや知識を自らが学習する。

レベル４：ディープラーニングを取り入れた人工知能。機械学習の際のデータ

を表すために使われる変数（特徴量）自体を学習するもの（本書で

は「特徴表現学習」と呼ぶ）

2016/3/13

4

2016/3/13

5

技術進化の発展これまでの人工知能の壁≒表現の獲得の壁難しい問題１：機械学習における素性設計

素性（特徴量）をどう作るの？

データ自身から、重要な特徴量を生成できないから問題が起こる

難しい問題２：フレーム問題

どのように例外に対応しながら、コンピュータに判断させればよいか？

データから特徴量を取り出し、知識を記述していないから問題が起こる。

難しい問題３：シンボルグラウンディング問題

シマウマがシマのある馬だと、どう理解すればいいか？

データから特徴量を取り出し、概念を生成しても、それに名前がつけられないから

問題が起こる

結局のところ、いままでの人工知能は、現実世界の現象の「どこに注目」するかを人間が決めていた。あるいは、よい「特徴量」をコンピュータが発見することができなかった。それが、唯一にして最大の問題であった。

ソシュールのシニフィエ・シニフィアン

概念／シニフィエ（意味されるもの）



語／シニフィアン（意味するもの）

データ特徴量特徴量

特徴量を使って構成される概念

コンピュータがデータから特徴を取り出し、それを使った「概念/シニフィエ」を獲得した後に、そこに「名前/シニフィアン」を与えれば、シンボルグラウンディング問題は発生しない

2016/3/13

6

ディープラーニングとは何か

「ディープラーニング」とは、システムがデータの特徴を学習して、事象の認

識や分類を行う「機械学習」の手法である。

ディープラーニングは、データをもとに、コンピュータが自ら特徴量をつくり出

す。人間が特徴量を設計するのではなく、コンピュータが自ら高次の特徴量

を獲得し、それをもとに画像を分類できるようになる。ディープラーニングに

よって、これまで人間が介在しなければならなかった領域に、ついに人工知

能が一歩踏み込んだのだ。

AUTO-ENCODER(自己符号化器)

入力層

• Deep Learningの主要な構成要素

• 出力を入力と全く同じにした多層のニューラルネットワーク

– 手書き文字認識では、ひとつの画素の値を予測する。

– 普通に考えると意味ない。

• 入力情報をいったん圧縮し、更に復元するときにエラーを少なくすることで

高次の特徴量を取り出すことができる。

• 隠れ層のノードが「入力を圧縮したもの」になる。

正解

出力層

隠れ層

AUTO-ENCODERで得られる表現入力層、出力層が784次元の画像では、隠れ層は、例えば１００次元に圧縮されるということ。圧縮、復元を繰り返すことで効率的な復元を学習する。

多層化してディープにする

多階層のディープラーニングの仕組みは、真ん中の隠れ層を引っ張りだして、何層にも重ねるといったイメージである。これによって、高次の特徴量が生成される。

2016/3/13

7

Youtubeから取り出した画像を大量に見せてディープラーニングにかけ

るとコンピュータが特徴量を取り出し、自動的に「人間の顔」や「猫も顔」といった概念を獲得する。

ディープラーニング今後の研究• ①画像→画像特徴の抽象化

• 認識精度の向上

• ②観測したデータ（画像＋音声＋圧力センサー＋）

• →マルチモーダルな抽象化

• 環境認識、行動予測

• ③自分の行動に関するデータ＋観測したデータ

• →行為と帰結の抽象化

• プランニング、フレーム問題の解決

• ④行為を介しての抽象化 →名詞だけでなく動詞（その様態としての形容詞や副詞）

• 推論・オントロジー、高度な状況の認識

• ⑤ 高次特徴の言語によるバインディング→言語理解、自動翻訳

• シンボルグラウンディング、言語理解

• ⑥バインディングされた言語データの大量の入力 →さらなる抽象化、知識獲得、

高次社会予測

• 知識獲得のボトルネックの解決

2016/3/13

8