2016/3/13
1
人工知能は人間を超えるか――ディープラーニングの先にあるもの
著者 松尾 豊
東京大学大学院工学系研究科 技術経営戦略学専攻特任准教授
産業技術総合研究所 人工知能研究センター 企画チーム長(兼任)
人工知能、トップ棋士を撃破 「アルファ碁」初戦で
3月9日の韓国棋士イセドルとの五番勝負の初戦は衝撃の結果となった。ついで10日もアルファ碁は連勝した。
グーグルの自動運転車本書目次
• 序 章 広がる人工知能――人工知能は人類を滅ぼすか
• 第1章 人工知能とは何か――専門家と世間の認識のズレ
• 第2章 「推論」と「探索」の時代――第1次AIブーム
• 第3章 「知識」を入れると賢くなる――第2次AIブーム
• 第4章 「機械学習」の静かな広がり――第3次AIブーム(1)
• 第5章 静寂を破る「ディープラーニング」――第3次AIブーム(2)
• 第6章 人工知能は人間を超えるか――ディープラーニングの先にあるもの
• 終 章 変わりゆく世界――産業・社会への影響と戦略
2016/3/13
2
人工知能はいま3度めのブーム• 第1次AIブーム(19561960年代):探索・推論の時代
ダートマスワークショップ(1956)
人工知能(Artificial Intelligence)という言葉が決まる
世界最初のコンピュータENIAC(1946)のわずか10年後
(...冬の時代)
• 第2次AIブーム(1980年代):知識の時代
エキスパートシステム
第5世代コンピュータプロジェクト:通産省が570億円
(...冬の時代)
• 第3次AIブーム(2013年):機械学習・表現学習の時代
ウェブとビッグデータの発展
計算機の能力の向上
第3次AIブーム
人工知能研究の流れ
人工知能とは何か
〈研究者の定義〉
中島秀之公立はこだて未来大学学長:人工的につくられた、知能を持つ実体。
知能自体を研究する分野
西田豊明京大教授:『知能を持つメカ』『心を持つメカ』
著者の森尾豊:人工的につくられた人間のような知能、それをつくる技術。
研究者は知能を「構成論的」に解明する研究をしている。脳科学者の場合は
分析論的なアプローチで知能を解明しようとしている。
〈一般的な見方〉
状況に応じた賢い振る舞い⇒入力応じて出力が変わる
2016/3/13
3
人工知能とは?
一般的には、見聞きしたものを認識すること、会話をすること、推論すること、複数
の事象から何らかのパターンを発見することなど、「人間ならではのさまざまな知的
能力」を、コンピュータをはじめ自動車や家電など、いろいろな機械の上で実現する
ための技術を指す。
人間の脳を真似ることから始まった人工知能研究は、溯ると50年前から始まってい
るが、大きな社会的な関心とはならなかった。しかし、1990年代の脳の視覚野の
情報処理メカニズムの解明が1つのブレークスルーとなり、それを数学的なアルゴリ
ズムで表せるようになったことで、コンピュータに取り込み、画像認識が格段に進み、
それがディープランニングにつながった。
人工知能が社会に及ぼす影響、その恐れと期待が高まってきている。
モデルは神経細胞
ジグモイド関数は生物の神経細胞がもつ性質をモデル化したもの
ニューラルネットワーク 人工知能の4段階
レベル1:単純な制御プログラム(家電などに組み込まれている)
レベル2:古典的な人工知能。多彩な振る舞い(探索、推論)のパターンを
もつ。例としてはお掃除ロボット、AI将棋、応答ロボットなど
レベル3:機械学習を取り入れた人工知能。機械学習とはサンプルとなる
データをもとに、ルールや知識を自らが学習する。
レベル4:ディープラーニングを取り入れた人工知能。機械学習の際のデータ
を表すために使われる変数(特徴量)自体を学習するもの(本書で
は「特徴表現学習」と呼ぶ)
2016/3/13
4
2016/3/13
5
技術進化の発展 これまでの人工知能の壁≒表現の獲得の壁難しい問題1:機械学習における素性設計
素性(特徴量)をどう作るの?
データ自身から、重要な特徴量を生成できないから問題が起こる
難しい問題2:フレーム問題
どのように例外に対応しながら、コンピュータに判断させればよいか?
データから特徴量を取り出し、知識を記述していないから問題が起こる。
難しい問題3:シンボルグラウンディング問題
シマウマがシマのある馬だと、どう理解すればいいか?
データから特徴量を取り出し、概念を生成しても、それに名前がつけられないから
問題が起こる
結局のところ、いままでの人工知能は、 現実世界の現象の「どこに注目」するかを人間が決めていた。 あるいは、よい「特徴量」をコンピュータが発見することができなかった。 それが、唯一にして最大の問題であった。
ソシュールのシニフィエ・シニフィアン
概念/シニフィエ(意味されるもの)
概念/シニフィエ(意味されるもの)
概念/シニフィエ(意味されるもの)
語/シニフィアン(意味するもの)
データ特徴量 特徴量
特徴量を使って構成される概念
コンピュータがデータから特徴を取り出し、それを使った「概念/シニフィエ」を獲得した後に、そこに「名前/シニフィアン」を与えれば、シンボルグラウンディング問題は発生しない
2016/3/13
6
ディープラーニングとは何か
「ディープラーニング」とは、システムがデータの特徴を学習して、事象の認
識や分類を行う「機械学習」の手法 である。
ディープラーニングは、データをもとに、コンピュータが自ら特徴量をつくり出
す。人間が特徴量を設計するのではなく、コンピュータが自ら高次の特徴量
を獲得し、それをもとに画像を分類できるようになる。ディープラーニングに
よって、これまで人間が介在しなければならなかった領域に、ついに人工知
能が一歩踏み込んだのだ。
AUTO-ENCODER(自己符号化器)
入力層
• Deep Learningの主要な構成要素
• 出力を入力と全く同じにした多層のニューラルネットワーク
– 手書き文字認識では、ひとつの画素の値を予測する。
– 普通に考えると意味ない。
• 入力情報をいったん圧縮し、更に復元するときにエラーを少なくすることで
高次の特徴量を取り出すことができる。
• 隠れ層のノードが「入力を圧縮したもの」になる。
正解
出力層
隠れ層
AUTO-ENCODERで得られる表現入力層、出力層が784次元の画像では、隠れ層は、例えば100次元に圧縮されるということ。圧縮、復元を繰り返すことで効率的な復元を学習する。
多層化してディープにする
多階層のディープラーニングの仕組みは、真ん中の隠れ層を引っ張りだして、何層にも重ねるといったイメージである。これによって、高次の特徴量が生成される。
2016/3/13
7
Youtubeから取り出した画像を大量に見せてディープラーニングにかけ
るとコンピュータが特徴量を取り出し、自動的に「人間の顔」や「猫も顔」といった概念を獲得する。
ディープラーニング 今後の研究• ①画像→画像特徴の抽象化
• 認識精度の向上
• ②観測したデータ(画像+音声+圧力センサー+)
• →マルチモーダルな抽象化
• 環境認識、行動予測
• ③自分の行動に関するデータ +観測したデータ
• →行為と帰結の抽象化
• プランニング、フレーム問題の解決
• ④行為を介しての抽象化 →名詞だけでなく動詞 (その様態としての形容詞や副詞)
• 推論・オントロジー、高度な状況の認識
• ⑤ 高次特徴の言語によるバインディング→言語理解、自動翻訳
• シンボルグラウンディング、言語理解
• ⑥バインディングされた言語データの大量の入力 →さらなる抽象化、知識獲得、
高次社会予測
• 知識獲得のボトルネックの解決
2016/3/13
8