畳み込みニューラルネットワークが...

畳み込みニューラルネットワークの逆変換による画像生成畳み込みニューラルネットワークが

なぜうまくいくのか？についての手がかり

古川アドレス

tomohiro.furukawa (アットマーク) nextremer.com

株式会社

論文

Inverting Convolutional Networks with Convolutional Networks

Alexey Dosovitskiy Thomas Brox Department of Computer Science University of Freiburg, Germany

Quote [1]

留意事項

=引用に関して著作権上の問題がある場合はご連絡ください

・内容の信憑性を　必ずしも保証していません

・If there is any issue about copyright about quotation, e-mail me, please.

e-mail tomohiro.furukawa (atmark) nextremer.com

論文概要畳み込みニューラルネット

＜課題＞なぜうまくいくのか？内部でどう学習している？不明点がある

画像情報入力

出力

注）結合は一部省略

Quote from [1]

物体認識などのタスクで従来手法に比べ高い精度を実現

[2, 3, 1, ……2, 3, 4]

[5, 6, 2, ……0, 1, 3]

……

論文概要

入力注）結合は一部省略各層に特徴量

[0, 2, 1, ……0, 4, 2]

[9, 3, 7, ……2, 1, 5]

目的：ネットワーク内部の状態を知りたい出力

[4, 2, 6, ……3, 0, 8]

逆変換された画像から各層の学習過程がわかる

解決法：画像に逆変換

（要するに各層の出力）

Quote from [1]

画像に逆変換する手法

本手法：元画像と逆変換画像を比較して逆変換を学習させる

入力逆変換

元画像逆変換画像

元特徴量誤差を最小にする

学習した重み従来：出力された特徴量ができるだけ近くなる画像入力を探す

Quote from [1]

ネットワーク構成畳み込み５層全結合層３層 maxプーリング活性化関数：Relu

畳み込みニューラルネット (refer[1]のAlexNet)

逆変換ニューラルネット（最終層逆変換の場合）全結合層３層逆畳み込み５層活性化関数：leaky Relu

入力

逆変換ネット

生成

逆変換ネットワーク逆畳み込み層とは…１と２を行う１．逆プーリング

２．畳み込み

p 00 0p q

q 00 0

r 00 0

s 00 0

p 00 0

q 00 0

r 00 0

s 00 0

h11 h13h12h21 h23h22h31 h33h32

✖チャネル数✖

フィルタ

残りを０で埋める

ネットワーク構成畳み込み５層全結合層３層 maxプーリング活性化関数：Relu

畳み込みニューラルネット (refer[1]のAlexNet)

逆変換ニューラルネット（最終層逆変換の場合）全結合層３層逆畳み込み５層活性化関数：leaky Relu

入力

逆変換ネット

生成

r(x)＝x （x≧0のとき）r(x)＝0.3・x （x<0のとき）

後は勾配降下法で学習

結果：逆変換画像元画像

本論文

[3] refer

FC８Conv1 深い層

・Conv5→FC6で不明瞭さが増している・従来手法[3]に比べて色・位置情報が改善

Quote from [1]

画像復元誤差

・Conv5→FC6で誤差が増している・Autoencoderが誤差が小さい

[1]より引用

正規化復元誤差

本論文Auto encoder

refer [3]

Autoencoder学習⒈　Alexnetで特徴量抽出

２．逆変換ネットワークで画像生成

本論文

[3] refer

Alexnetのパラメータを Autoencoderでさらに学習＜追加＞

Quote from [1]

色と位置情報の保存・色を変えて分類

・分類結果の　top5以外を　0に変えて逆変換

・top5以外の情報が　色・位置の　復元に重要

Quote from [1]

色と位置情報の保存

・位置に情報が大まかに保存されている・特にFC8では対称に情報が保存

(反転に強い可能性)

Quote from [1]

特徴量ロバスト性の確認

１．バイナリ化

２．５０％ドロップアウト

定数で置き換える[0, 2, 1, 0, 4, 2]（例）

[0, a, a, 0, a, a]

特徴量ベクトル

ネットワークの特徴量を操作したとき復元画像に変化があるのか？

（例）ランダムに選んだ半分の要素を０にする

[0, 2, 1, 0, 4, 2]

[0, 0, 1b, 0, 0, 2b]

ベクトルのノルムは変わらないように操作

バイナリドロップアウト

操作なし

Quote from [1]

・バイナリ化するより　ドロップアウトの方が誤差が大きい

正規化復元誤差バイナリ

ドロップアウト

操作なし

Quote from [1]

特徴量ベクトル合成

２つの特徴量ベクトルを合成すると FCレイヤから画像としても合成されている

Quote from [1]

ランダムベクトルからの復元

FCレイヤの画像は元画像らしくなっておりネットワークが学習できている根拠となる

各層の特徴量をヒストグラムにする →それを基本にランダム特徴量ベクトル生成

Quote from [1]

まとめ・最終層を含むネットワークの全てのレイヤの　特徴量は色・位置情報を保存していた・出力された特徴量は個々の正確な数値より　０でない値のパターンが重要・最終層ではtop5の分類情報より　top5以下の分類情報に　色・位置などの情報が保存されている

会社紹介

社員数　20名　設立　2012年10月

開発技術　自然言語処理・画像認識

＜PR用対話ロボット　A.I Samurai＞

事業内容　人工知能テクノロジーを取り入れた対話システムの開発

機械学習エンジニア募集

興味がある方はオフィスへ１度、遊びに来てください

wantedly 「nextremer」

で検索

2015年12月現在

畳み込みニューラルネットワークが...

Science

どうぶつかくれんぼ ⑤...どうぶつかくれんぼ ⑤ のあるばしょにいろをぬってみよう！だれがかくれていたかな？うらのどうぶつからみつけよう！い

罪からくる報酬と主の恵みパート＃１

Ruby本から読み解くRuby考古学 - Ruby Archaeology from the Ruby Book

よくわかる詳しくわかる HTLV-1平成22年度厚生労働科学研究費補助金研究事業よくわかる詳しくわかる HTLV-1 HTLV-1 キャリアのみなさまへ

コガタカデンリサイクルキャンペーン都市鉱山からつくる ...都市鉱山からつくる！みんなのメダルプロジェクトコガタカデンリサイクル

豊かで住みよい町づくり豊豊かで住みよい町づくりかで住 …...2013 議会だより 2013．2．1 発行48 VoL. 2 豊かで住みよい町づくり豊豊かで

しゃさいゃ車載ステレオカメラのしくみ動的にブレーキをかけてくれます。それはどんなしくみで、なぜぶつからないのか？最さいしんぎじゅつ

Ⅳ．工程表作成 1．とにかく作成してみよう！ - SANNET · 2009-11-02 · Ⅳ．工程表作成 1．とにかく作成してみよう！個々の説明に入る前に、とにかく工程表を作成してみて、工程表作成のイメージをつか

紙トンボを作って紙トンボを作ってかみつくしくまな紙トンボを作ってかみつくしくまな紙トンボを作ってかみつくしくまな

「ダーウィン」からなにを読み解くか「ダーウィン」からなにを読み解くか ―191 ― 民の様子を紹介する絵（【写真2】右側真ん中）が掲載されている。

ネットワークでかわる社会第２節　ネットワークのしくみ②

和紙研究と日韓の繭紙€¦ · 「蘇芳の机にまゆみのかみ、青紙・まつがみ・筆など積みて」『賀茂女集』「かきあつむれば、みちのくのまゆみのかみも、

Angularを使ってみる実例いくつか (2015/4/29 GDGKobe)

13出身地day みんなでつくる財団おかやま

音楽を形づくっている要素から生み出す創造的な「音楽づくり」 … · 音楽を形づくっている要素から生み出す創造的な「音楽づくり」「創作」

IchigoJam のくみたてかた（ビスケットボード）

あつみれいかすみか

楽譜は何故読みにくいのか・Gravity days

vol.3 ごみ分別辞典 - 伊勢崎市 · 2019. 9. 29. · ごみ分別辞典 ―伊勢崎市― ごみの出し方がよくわかる本ごみ分別辞典ごみの出し方がよくわかる本

AD設計の基礎から読み解くIaaS On AD