23
CNNによるスタイル変換と Web画像を用いた 画像の任意質感生成 松尾 真, 柳井 啓司 電気通信大学 大学院情報理工学研究科 総合情報学専攻

Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

CNNによるスタイル変換とWeb画像を用いた画像の任意質感生成

松尾真, 柳井啓司

電気通信大学 大学院情報理工学研究科総合情報学専攻

Page 2: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

はじめに

Neural Style

TransferDeep Neural Networkを用いた画像変換

写真と絵画を入力すると,写真が絵画調に

DNNによる画像合成分野が発足

generated image

content image style image

Page 3: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

目的

単語概念からの自動スタイル生成画像内物体の質感の任意変換への応用

質感別画像データの増量

デザイン,エンターテインメント

様々な分野への応用が期待できる

「金属製」

content

image

request generated image

「木製」

Page 4: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

関連研究

Neural Style Transfer

L. A. Gatys et al, “A neural

algorithm of artistic style,” in

arXiv:1508.06576, 2015.[Gatys et al.]

• ImageNet1000クラスの分類を学習済みのDNN

• 画像入力時に各Layer内でフィルタの活性値行列𝐹𝑙が発生する

input

fc6

fc7

fc8

conv3_2

conv1_2

conv2_2

conv4_4

conv5_4

(Max pool層等省略)

クラス分類

𝐹0

𝐹1𝐹2

𝐹3𝐹4

Page 5: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

関連研究

Neural Style Transfer[Gatys et al.]

生成画像と元画像の 𝐹𝑙のずれを最小化するように生成画像を最適化

元画像を復元!

input

fc6

fc7

fc8

conv3_1

conv1_1

conv2_1

conv4_1

conv5_1

(Max pool層等省略)

Classification

Page 6: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Neural Style Transfer[Gatys et al.]

conv1_1 conv2_1 conv4_1conv3_1 conv5_1

画像:[Gatys et al.]

コンテンツ表現:𝐹𝑙による画像の復元

Page 7: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Neural Style Transfer[Gatys et al.]

conv1_1 conv2_1 conv4_1conv3_1 conv5_1

スタイル表現:𝐺𝑙=𝐹𝑙𝐹𝑙𝑇による画像の復元

画像:[Gatys et al.]

Page 8: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Neural Style Transfer[Gatys et al.]

二種の画像表現から損失関数を形成

コンテンツ表現:深い層における𝐹𝑙

形状のみを保持

スタイル表現:様々な層における𝐺𝑙=𝐹𝑙𝐹𝑙𝑇

スタイルのみを保持

2枚の異なる画像の形状,スタイルを持った画像を復元

Page 9: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

𝐿𝑜𝑠𝑠 𝑥c, 𝑥s, 𝑥g

content image

𝑥𝑐

𝐿𝑜𝑠𝑠𝑐𝑜𝑛𝑡𝑒𝑛𝑡 𝑥c, 𝑥g

𝐿𝑜𝑠𝑠style 𝑥s, 𝑥g

コンテンツ画像𝑥𝑐

スタイル画像𝑥𝑠

生成画像のコンテンツをコンテンツ画像に,スタイルをスタイル画像に近づける

Pre-trained

input

conv3_1

conv1_1

conv2_1

conv4_1

conv5_1

𝐹 𝑥c

𝐺 𝑥s

𝐹 𝑥g

𝐺 𝑥g

生成画像𝑥𝑔

生成画像𝑥𝑔

Page 10: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

提案手法

CNNを用いた画像内物体の任意質感生成

質感単語からスタイル表現を自動生成

入力

質感単語「ふさふさ 」

コンテンツ画像

スタイル表現

Web画像

Neural Style Transfer

Page 11: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

単語による画像収集とクラスタリング

Web画像をスタイルの類似したもの同士のクラスタに分化

• DCNN特徴(VGG19

fc6の出力)とNeural

Style Vectorを使用

Patch Cluster 2Patch Cluster 1Patch Cluster 0

Image Cluster 2Image Cluster 1

Web images

Clustering

(DCNN feature)

Image Cluster 0

Reranking

(NSV)

Reranking

(NSV)

Reranking

(NSV)

Style 0 Style 1 Style 2

Page 12: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Neural Style VectorCNN-based style vector for style image

retrieval. [S. Matsuo, ACM ICMR 2016.]

スタイル変換アルゴリズムにおけるスタイル表現をベクトル化

絵画画像の検索・クラス分類に利用

conv1_2

conv2_2

conv3_4

conv4_4

conv5_4

input

Activation

𝐹𝑙

ImageCorrelation of

The activation

𝐺𝑙 = 𝐹𝑙(𝐹𝑙)𝑇

𝑁𝑙: the number of filters 𝑀𝑙 : the number of pixels

𝑁𝑙

𝑁𝑙

𝑁𝑙

𝑀𝑙

Filter activation 𝐹𝑙

Gram matrix 𝐺𝑙

Page 13: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Neural Style Vector𝐺𝑙の対象要素と対角要素で定義

𝑉𝑙 = [𝐺1,1𝑙 , 𝐺2,1

𝑙 , 𝐺2,2𝑙 , … , 𝐺𝑁𝑙,1

𝑙 , 𝐺𝑁𝑙,2𝑙 , …𝐺𝑁𝑙,𝑁𝑙

𝑙 ]

𝑉𝑙 = ℎ𝑢𝑟𝑓 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑠 + (𝑑𝑖𝑎𝑔𝑛𝑎𝑙 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑠) = 𝑁𝑙 ∗ (𝑁𝑙 + 1)/2

符号付平方根とL2正規化をして使用

𝑉𝑙𝑠𝑔𝑛𝑠𝑞𝑟𝑡=𝑠𝑔𝑛 𝑉𝑙 𝑉𝑙

𝑠𝑔𝑛 𝑉𝑙 𝑉𝑙

𝑁𝑙

𝑁𝑙

𝑉𝑙

Ex, at conv5_1𝑁𝑐𝑜𝑛𝑣5_1 = 512,

𝑉𝑐𝑜𝑛𝑣5_1 =131,328

Page 14: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

実験

実験データ

コンテンツ画像:3枚

質感単語:オノマトペ 23 単語

画像収集:Bing API

使用クラスタ数:3

評価方法

ユーザー評価

問題数はコンテンツ数 3単語数 23 語の 69 問

回答者数は 9 人

Page 15: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

ユーザー評価

赤枠が正解

Page 16: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

実験結果(総合)

0.556

0.296

0.148

0.2590.222

0.037

0.481

0.333

0.704

0.148

0.222

0.3330.296

0.037

0.2960.296

0.000

0.1850.148

0.333

0.148

0.2590.222

0.000

0.100

0.200

0.300

0.400

0.500

0.600

0.700

0.800

0.900

1.000ふさふさ

ふくふく

べとべと

ぶつぶつ

ぷくぷく

しゃきしゃき

ざらざら

つやつや

もふもふ

くたくた

ぱさぱさ

くるくる

さくさく

ぎしぎし

ねばねば

ゆらゆら

さらさら

ぼさぼさ

かちかち

ごてごて

ふにゅふにゅ

くしゅくしゅ

しゃりしゃり

accura

cy

Page 17: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

0.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.000

ふさふさ

ふくふく

べとべと

ぶつぶつ

ぷくぷく

しゃきしゃき

ざらざら

つやつや

もふもふ

くたくた

ぱさぱさ

くるくる

さくさく

ぎしぎし

ねばねば

ゆらゆら

さらさら

ぼさぼさ

かちかち

ごてごて

ふにゅふにゅ

くしゅくしゅ

しゃりしゃり

accura

cy

content0 content1 content2

実験結果(コンテンツ別)

Page 18: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

結果 「ふさふさ」,「ざらざら」,「もふもふ」の正解率が高くなった。

他の単語では正解率は低くなった。

1. Web画像が不適切

2. オノマトペから画像を連想しにくい

各単語の正解率はコンテンツによって大きく異なっていた。

スタイル変換のクオリティはコンテンツ画像とスタイルの相性に強く依存していると考えられる。

Page 19: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

「ふさふさ」クラスタ

Cluster 0

Cluster 1

Cluster 2

Vote: 2 Vote: 3 Vote: 5

Vote: 1 Vote: 0 Vote: 2

Vote: 0 Vote: 2 Vote: 0

Page 20: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

「ざらざら」クラスタ

Vote:3 Vote:6 Vote:4

Vote:0 Vote:0 Vote:0

Vote:0 Vote:0 Vote:0

Cluster 0

Cluster 1

Cluster 2

Page 21: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

Cluster 0

Cluster 1

Cluster 2

「もふもふ」クラスタ

Vote:0 Vote:0 Vote:0

Vote:1 Vote:1 Vote:1

Vote:4 Vote:4 Vote:7

Page 22: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

考察

Vote:3

Vote:6

Vote:4

Vote:5

Vote:4

Vote:7

ふさふさ cluster0

ざらざら cluster0

もふもふ cluster2

Style Conte

nt

Vote:2

Vote:3

Vote:4

コンテンツ画像とスタイルクラスタの相性

Page 23: Neural Style Transferを用いた 画像の任意質感生成img.cs.uec.ac.jp/pub/conf16/170217matsuo_0_ppt.pdfNeural Style Transfer [Gatys et al.] 二種の画像表現から損失関数を形成

今後の課題

質感単語とコンテンツの関連度と印象操作への影響

コンテンツの持つカラー傾向や局所的構造を考慮したスタイルクラスタの構築

コンテンツ画像をもとにしたスタイル画像のカラー変換

前景領域の利用