Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
NTT技術ジャーナル 2016.424
NTT R&Dフォーラム2016 ワークショップ
「人工知能」は古くて新しい
今,人工知能は非常にブームとなって多くの方に興味を持っていただいています.「人工知能」という言葉は,古くて,そして,ある意味とても新しい言葉といえます.実は,2016年は奇しくも人工知能という言葉が使われだしてから60年目にあたります.人工知能(AI: Artificial Intelligence)は1956年に行われた,ダートマス会議で初めて使われた言葉といわれています.その後,例えば日本でも1980年代にICOT(新世代コンピュータ開発機構)の設立や第 5 世代コンピュータという言葉や,ニューラルネットワークを使った家電が発売されるなど一時ブームとなりました.そして,最近ではApple社のiPhoneに搭載されている
「Siri」や,「ロボット」「機械学習」「DNN(Deep Neural Network)」 といった言葉とともに,今またAIが脚光を浴びているという,非常に長い歴史のある言葉です.
一方NTTでは,40年前には手書き
文 字 認 識 の 研 究,1980年 代 に はANSERという音声認識を使ったシステムやAI専用マシンの実用化などを行っています.最近では,NTTドコモの「しゃべってコンシェル」のように,スマートフォンに話しかけるとさまざまなことを調べてくれるようになるなど,数多くのAI技術に取り組んできました.
なぜ,今AIがここまでブームになっているのかと述べますと,計算機の能力が非常に進歩し大量のデータが処理できるようになったこと,そしてディープラーニングなどの非常に強力な技術が出現したことが挙げられます.以前は,人間がモデル ・ ルールの記述を積み上げてAIを実現していましたが,現在のAIは,世の中に存在する大量の実データを計算機に分析 ・学習させることにより実現するものへと変わりました.その結果,AIが実用に耐え得る領域が広くみえてきたことにより,話題として多く取り上げられるようになったと考えられます.
つまり,AIにおいて大事なことは,
実際のデータが非常に重要であるということです.そのためパートナーの皆様とコラボレーションして皆様がお持ちの実際のデータを利用しながら技術開発を進めることにより,AIを発展させることができると考えています.
AIとは何か
AIという言葉には多くの方がさまざまなイメージをお持ちです.一般の方はロボットのようなものをAIと考えているかと思います.企業の方ならIBM社の「Watson」というサービス,技術に詳しい方は「DNN」という技術を思い浮かべる人もいます.これらはすべて異なるものを指しています.AIという言葉が使われるときに指すものを分類すると図 1 のようになります.
はじめに,AIの目的があります.これには人間に似たような仕組みをコンピュータ上につくろうという考え方と,もう 1 つは人間が使う知識を上手に活用し,私たちの生活をより豊かにしていこうとする考え方の 2 つの方
人と協創するAI NTTの4つのAI コラボレーション
人と人,人とモノのコミュニケーションを 良くするNTTのAI技術
小お ざ わ
澤 英ひ で あ き
昭NTTメディアインテリジェンス研究所 所長
計算機能力の進歩により,今再びブームになっている人工知能(AI).本稿ではAIの潮流について解説するとともに,NTTグループが考える「コンピュータと人間が協創するAI」とその取り組みについて紹介します.
NTT技術ジャーナル 2016.4 25
特集
向性があります.また,仕組みという観点では,いく
つかのレイヤで分かれていきます.まず,「情報を分類する」「相関関係を計算で導き出す」「知識を大量に蓄積する」といったAIの処理技術のレイヤがあります.次に,これら処理技術を利用して,「顔の画像を認識する」「大量の情報を集め意思決定する」「音声を認識する」といったAIの要素技術のレイヤがあります.さらに要素技術を使い,「ロボット」「人工頭脳」「自動運転」「コンタクトセンタのオペレータ支援」「しゃべってコンシェルのような音声対話サービス」のレイヤに分けられます.このようにAIとは,これらのどこをやることが本当に世の中の役に立つのか,ターゲッティングをすることが非常に重要な技術です.
NTTがめざす「人と協創するAI」
NTTが考えるAIとは,コンピュータと人間がともにコミュニケーションを行い協創できるAIというものです
(図 ₂ ).例えば,コンタクトセンタでは,
AIが後ろについてオペレータの回答を支援することで,お客さまに必要なことを的確にお伝えし,お客さま満足度を向上させるものです.また,そこら中の乗り物や機械,個人がAIを備え,そのAIが安全を見守ってくれることで,交差点で事故を起こさせないようにする社会にできれば良いと考えています.SF映画では,世界中の情報を集めるセンタのようなAIが人間より賢くなり,最後は暴走する姿が描かれることがあります.しかし,私た
ちは必ずしもすべての情報を集める必要はないと考えます.大事にしたいことは,いつも自分のそばで見守ってくれるAI技術の実現です.
そばで見守ってくれるAIを実現するために,大きく分けて,人とAIの
間のコミュニケーション,もう 1 つは,AIどうしのコミュニケーションというものを考えています(図 ₃ ).
人とAIのコミュニケーションでは,常に私たちのことを見守り私たちの状況を「理解」する機能と,私たちにサ
図 1 AIの領域
AIサービス
AI要素技術
AI処理技術
目的
人工頭脳 ロボット 自動運転車 オペレータ支援 音声対話
知識を活用して,私たちの生活に役立つ機械やシステム
コンピュータに人間のような知性を持たせる
意思決定 検索・推論 ヒューマンインタフェース
画像認識 翻訳 対話理解 音声認識 自然言語処理
知識データベース機械学習DNN
図 2 NTT が考える AI
大事にしたいのは,いつもそばで見守れるAIの技術
さまざまな知識
コンピュータと人間が協創するAI
交差点のカメラ
室内センサ
お客さま 担当者
お客さまには快適に,オペレータにはストレスがない環境の実現
寝ているときも,見えないところも,そばで見守る安心・安全
会話をAIが聞いて担当者をサポート
NTT技術ジャーナル 2016.426
NTT R&Dフォーラム2016 ワークショップ
ジェストするための情報をどこからか見つけ生み出す「探索」機能,その結果を私たちに分かりやすく「デザイン」する機能が必要と考えています.また,AIどうしのコミュニケーションでは,さまざまなセンサや人に合わせてAIが遍在し,その 1 つひとつ置かれたAIどうしが連携して,新たな知識や
価値を生み出せる世界をつくっていく必要があると思います.これらを私たちは 4 つのAI(1)という言葉で整理しています(図 ₄ ).
1 番目は「Agent-AI」です.話している言葉や画像を理解しそこからユーザに対して価値の高い情報を提示していくものです. 2 番目は「Heart-
Touching-AI」です.必ずしも言葉ではなく,脳科学などを用い体の表面に現れるさまざまな変化から私たちの深層心理などを見抜くことによって,より付加価値を高めることをめざすものです.また,モノとモノ,モノと人との組み合わせを結びつける世界として,3 番目のAI「Ambient-AI」と呼ぶ,センサが賢くなるというイメージのものがあります.さらに 4 番目としてこれらのAIがネットワークとして組み合わされたとき,「 3 人集まれば文殊の知恵」のようなさまざまなAIが集まり知恵を生み出せるものをめざそうとしています.これを「Network-AI」と呼びます.
常に私たちのそばにいる,というAIですから,私たちが生まれてから年老いていくまで,常に見守ってくれるというAIになるのではないかと考えています.若年の人には,必要な専門知識を早く取得できるようにするAI,高齢になったときには,記憶力や体の障がいなど残念ながら欠けてしまった機能についてサポートしてくれるAIをつくっていき,その結果,老いも若きもともに輝ける社会を,NTTは皆様と一緒に日本だけでなく世界につくり上げていきたいと考えています.
AIへの取り組み例
前述した理解 ・ 探索 ・ デザインという 3 つの要素に対して,私たちの取り組み例を紹介します.■理 解
まず,人や環境の理解です.見守ってくれるAIの実現には非常に重要な
図 3 いつもそばで見守るAI に必要なこと
人とAI が,コミュニケーションする AI と他の AI がコミュニケーションする
理解 探索
デザイン
マイAI
カメラ
AIAI
AI
見守るべき人のことをいつも見ている,聞いている
AI は,センサや 1 人ひとりについて遍在する
見守るべき人に分かりやすいインタラクションをする
AIどうしも連携して,新たな知が生まれる
理解 探索
デザイン
AI
AI
見守るべき人のことをいつも見ている,
見守るべき人に分かりやすいインタラクションをする
AIどうしも連携して,新たな知が生まれる
理解
デザイン
マイAI
見守るべき人のことをいつも見ている,
見守るべき人に分かりやすい
デザイン
見守るべき人のことをいつも見ている,聞いている
見守るべき人に分かりやすい
カメラ
AI
AIどうしも連携して,新たな知が
AI は,センサや 1 人ひとりについて遍在する
図 4 人間をサポートする 4 つの AI
Agent-AI Heart-Touching-AI
Network-AI
Ambient-AI
環境の情報を読み解き予測・制御
複数のAIが有機的につながって価値を生む人間をAIがサポート
人の発する情報を読み解き,意図・感情を理解
意識されない人の心と身体を読み解き,
深層心理・知性・本能を理解
複数のAIが有機的につながり成長し, 社会システム全体を最適化
森羅万象(人,モノ,環境)を読み解き,瞬時に予測・制御
NTT技術ジャーナル 2016.4 27
特集
要素です.その中でも重要なものに音声があります.NTTでは,1998年に腕時計型PHSを実現した際に音声認識で電話をかけられるようにしました.その後,アナウンサーの音声の字幕化や,ある程度決まった答弁をする議会の議事録の作成支援,最近ではコンタクトセンタのオペレータやお客さまの会話の文字化,また,ロボットと声で会話ができるようになるなど音声認識を進歩させてきました.NTTはディープラーニングだけでなく,非常に多くの語彙の辞書を持てるWFST
(Weighted Finite State Trans ducer)技術も有しており,その結果現在ではコンタクトセンタで音声マイニング(2)
というAgent-AI技術を実現しています.
また,「目は口程にものを言う」といいますが,不快感や眠気を感じているかを目から測るという研究もしています(3).マイクロサッカードという微小な眼球の動きと,瞳孔反応を調べることにより,その人が見ている物や聞いている音の好みや,眠気などを推定することができます.このような研究を進めることによりHeart-Touching-AIの実現に近づけるのではと考えています.■探 索
探索とは,検索とは少し異なるものです.検索は,今ある情報から見つけ出すということですが,探索というのは未知の事柄を探し出すということです.検索の例として文書検索では検索ワードを与えると大量の整理されていない情報の中から,ただその検索ワードが含まれている文書を見つけてきま
す.一方,AIの領域では,量は少なく整理された正しい知識の中から答えを探し出すことが重要になります.しかし,問い合わせのされ方が幅広いものとなります.そのため,知識と問い合わせをつなぐところにAIがいます.
例としてFAQからの検索があります.マニュアルに質問(Q)と回答(A)の例はあります.ところが,お客さまは質問例にないさまざまな言い方で質問してくるために,それが質問例と同じことを言っているかをAIが判定し適切な回答例を提示しようとするも
のです.このAIを実現するために,私たち
は,インターネットにあるさまざまな情報を集めNTTの日本語解析技術で解析し,どの単語どうしの意味が近いのかを示すマップをつくりました.このマップを用いることで,例えば「国際電話」という言葉と「ニューヨークにかける」という言葉が近いことが分かるようになり,より適切な回答を示せるようになりました(4)(図 ₅ ).■デザイン
最後がデザインです.この典型的な
大規模意味辞書
Q. 050 plusで国際電話をかけることは可能ですか?
A.国際電話をかけることは可能です.ご利用いただく際には「国際電話を利用する」設定にしてください.
FAQ集
050 plusで海外に電話できますか
050 plusでシンガポールに電話できますか
050 plusでニューヨークにかけられますか
050 plusで国際電話かけられますか
図 5 言葉の意味のベクトル表現とFAQ検索
ウェブで時刻表調べて~
~をネットで調べてみて~
インターネットで検索すると~
ネットにつなぎましょう
インターネットで社会は~
大量の実テキスト (主にCGM文書)
ニューラルネットワークでベクトル化
日本語解析技術 ウェブ
ブラウザ
メール
ネットインターネット
単語の意味ベクトル
1:名詞2:具体 1000:抽象
389:場所362:組織
372:団体・党派373:団体
3:主体4:人
同じことを言っているかどうか?
050 plusでニューヨークに電話したい
050 plusで国際電話できますか
050 plusって外国にかけられますか
NTT技術ジャーナル 2016.428
NTT R&Dフォーラム2016 ワークショップ
例が「人流」です.NTTでは,遊園地など混雑する状況にあるお客さまが,少ない待ち時間でより快適に希望するところを回れる技術を開発しています(5).この問題の難しいところは,誘導する対象となるお客さまの集団や各遊具での混雑状況が前もって正確に見積もれないことです.遊園地には次々と新たな来場者が来たり,待ち行列の長さが変わるなど,状況は刻々変化するため事前の最適化は困難です.つまり,リアルタイムにお客さまにどのタイミングでどの行列に並んでもらうのが良いかを計算することがポイントになります.そこで,私たちは,人の流れや待ち時間の時空間予測技術と数理最適化アルゴリズムを組合せ,リアルタイムに集団を最適に誘導する技術の開発を行っています.
AIの課題と今後のNTTグループの取り組み
NTTはAIの取り組みを,これからも引き続き行っていきます.また,さまざまな技術を提供し,皆様がお持ち
のさまざまなデータと組み合わせることによって,新たな付加価値を生み出したいと考えています.
しかし,まだAIには得意ではないことが数多くあります(図 6 ).例えばレストランのウェイターが行う気配り,目配りのようなものはまだ難しいです.これは全体を俯瞰し,どこに重きを置くかを判断するといったことがまだ難しいためです.また,現在ではクラウドにデータを蓄え処理することが必要とされますが,何千キロも離れたクラウドで処理をさせようとすると,秒単位で遅れが生じてしまいます.交差点での車どうしの衝突を防ぐシステムを実現するには数ミリ秒で応答できる技術が必要です.これを可能にするためにNTTではエッジコンピューティング技術を開発しています.
今後もNTTグループ全体として,私たちとパートナーの皆様とが持っている知識や技術をコラボレーションさせ,脳科学の研究や,IoT(Internet of Things),エッジコンピューティングなど,さまざまな新しい技術の開発
を進め,真の意味で日本の皆様,世界の皆様のお役に立つAIという未来を切り拓ければと考えます.
■参考文献(1) 山田 ・ 高橋 ・ 納谷 ・ 池邉 ・ 古川:“NTTグルー
プにおけるAI研究の取り組みと方向性,”NTT技 術 ジ ャ ー ナ ル,Vol.28,No.2,pp.8-13,2016.
(2) 河村 ・ 町田 ・ 松井 ・ 坂本 ・ 石井:“コールセンタにおけるAIの活用,” NTT技術ジャーナル,Vol.28,No.2,pp.35-37,2016.
(3) 古川 ・ 米家 ・ LIAO ・ 柏野:“目から読み取る心の動き─Heart-Touching-AIのキー技術,” NTT技 術 ジ ャ ー ナ ル,Vol.28,No.2,pp.22-25,2016.
(4) 松尾 ・ 東中 ・ 浅野 ・ 牧野:“AIを支える自然言語処理技術,” NTT技術ジャーナル, Vol.28, No.2,pp.14-17,2016.
(5) http://www.ntt.co.jp/RD/active/201502/jp/ct/ct001.html
◆問い合わせ先 NTTサービスイノベーション総合研究所 広報担当 TEL 046-859-2032 FAX 046-855-1104 E-mail sv-forum lab.ntt.co.jp
図 6 まだまだ端緒についたばかりの AI
秒の単位の応答
・簡単そうなことが実は難しい ・物理的な距離は超えられない
まだまだ得意ではないことがたくさんある
気配り気配り
遠いクラウド
近くのエッジ⇒ 全体を俯瞰して対処するような「おもてなしの心」は,正解・不正解といったような学習に向いていない
⇒ AIが遍在し,瞬間瞬間に人間をサポートするには,遠くで処理していると間に合わない
数m秒程度の応答