19
Building text features for object image classification 福福福福

Building text features for object image classification

Embed Size (px)

DESCRIPTION

Building text features for object image classification. 福田考晃. はじめに. Wang, Hoiem らによって提案 [CVPR,2009] なにをするものか? 未知画像の既知カテゴリへの分類 どのように? 画像から得られる特徴 テキストの特徴 ( flickr tag ). 組み合わせて利用. 手法の流れ. 入力:未知画像 処理:2つの識別器を構築 ビジュアル識別器 テキスト識別器 出力:カテゴリ. ビジュアル特徴. 5 つの特徴量を利用 SIFT Gist カラーヒストグラム - PowerPoint PPT Presentation

Citation preview

Page 1: Building text features for object image classification

Building text features for object image classification

福田考晃

Page 2: Building text features for object image classification

はじめに

• Wang, Hoiem らによって提案 [CVPR,2009]

• なにをするものか?– 未知画像の既知カテゴリへの分類

• どのように?– 画像から得られる特徴– テキストの特徴 ( flickr tag ) 組み合わせて利用

Page 3: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 4: Building text features for object image classification

ビジュアル特徴

• 5 つの特徴量を利用– SIFT– Gist– カラーヒストグラム– 勾配特徴– Unified 特徴 ( 上記4つをまとめたもの )

Page 5: Building text features for object image classification

Gist

• 画像全体から得られる特徴量1. 画像を小領域に分割2. 任意周波数,方向の Gabor フィルタの応答算出

小領域に分割

Gabor filter

周波数,方向強

Page 6: Building text features for object image classification

Unified 特徴の最適化

• 2枚を1組の画像対を利用• Unified 特徴

• 重みを変更し,以下の式を最小化

Si :画像対の関係を表すSi = 1 : 同じカテゴリの画像Si = 0 : 異なるカテゴリの画像

: i 番目の画像対のカイ2乗距離

Page 7: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 8: Building text features for object image classification

インターネットから取得したデータセット

• 画像テキスト間の関係• 1,000,000 枚のデータセット

– 700,000 枚• 58 カテゴリで flickr を検索

– PASCAL + Caltech 256 カテゴリ– 300,000 枚

• 以下からダウンロード

Page 9: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 10: Building text features for object image classification

テキスト特徴

• Flickr データセットから6000 個のタグとグループ名を抽出

• 手順1. 画像入力2. K – Nearest Neighbor で k

個の画像を Flickr データセットから取得

3. 取得した画像のタグとグループ名から特徴量算出

Page 11: Building text features for object image classification

手法の流れ

• 入力:未知画像• 処理:2つの識別器を構築

– ビジュアル識別器– テキスト識別器

• 出力:カテゴリ

Page 12: Building text features for object image classification

識別器の構築

• ビジュアル識別器• テキスト識別器• SVM の利用

– カイ二乗カーネル• 特徴量をカイ2乗距離へ射影

• 識別器の統合– ロジスティック回帰

• 検証用データセットを利用

K(x,y)= exp{-² (x,y)}

² (x,y) = i { (||xi-yi||) ² / ||xi+yi|| }

Page 13: Building text features for object image classification

実験

• 以下を確認1. 異なるビジュアル特徴量におけるテキスト特徴の影響2. テキスト特徴とビジュアル特徴の統合の影響3. 学習画像の影響4. 補助データセットの画像枚数の影響5. カテゴリ名の影響

Page 14: Building text features for object image classification

実験1

• 異なるビジュアル特徴におけるテキスト特徴の構築– KNN 精度に依存

• ビジュアル特徴に依存– 各特徴量の精度比較

• カラーヒストグラムが低• Unified が高

Page 15: Building text features for object image classification

実験2

• テキスト特徴とビジュアル特徴の統合の影響– 互いが相互に作用

Page 16: Building text features for object image classification

実験3

• 学習画像枚数の影響– 画像数少

• テキスト特徴の影響大– 画像数多

• テキスト特徴の影響小– 最も高い利得

• テキストとビジュアルが一致したとき

Page 17: Building text features for object image classification

実験4

• 補助データセットの画像枚数– 200,000 〜 600,000

• 精度上昇大– 600,000 〜 1,000,000

• 精度上昇小

• 精度上昇 ≠ 枚数

Page 18: Building text features for object image classification

実験5

• カテゴリ名の影響• 実験対象

– カテゴリ名に類似したタグが存在する  (W)– カテゴリ名に類似したタグが存在しない (WO)

• 類似カテゴリの存在に依存しない

Page 19: Building text features for object image classification

おわりに

• テキストの特徴– Flickr のタグ,グループ名を利用

• Unified 特徴量は有効に作用• テキスト識別器 + ビジュアル識別器 = 相互に作用• 学習画像数が少ない時テキスト特徴の影響大• 精度向上≠ 補助データセット枚数• カテゴリ名の影響はない