17
ユーザ主導による主観・客観を考慮した 情報蓄積と推薦に関する研究 複雑系工学講座 調和系工学研究室 修士2年 山下晃弘 User Initiated Information Accumulation and Recommendation Considering Objective-Subjective Distinction 平成19年度修士論文発表会

yamasita m

Embed Size (px)

Citation preview

ユーザ主導による主観・客観を考慮した

情報蓄積と推薦に関する研究

複雑系工学講座 調和系工学研究室

修士2年 山下晃弘

User Initiated Information Accumulation and Recommendation

Considering Objective-Subjective Distinction

平成19年度修士論文発表会

平成19年度修士論文発表会 2007/2/13 /17 2

研究背景

Amazon.com

Wikipedia

主観的情報

客観的情報 個人が発信する情報には が含まれている

客観的 主観的 客観的

札幌にある美味しいラーメン店

複雑系

主観と客観が混在した情報の利用価値は閲覧者が判断

例:

本当に美味しい?

個々の自律的振る舞いが全体を構成

個々は互いに影響を及ぼしあう

個人の自律的な閲覧・発信が全体を構成

ある情報発信が他者の行動に影響

Web

主観と客観が分離できれば様々な技術が適用可能

食べログ

Flickr

複雑性を持つ情報源から技術やアイディアで価値を生み出す実システム

ソーシャルブックマーク

Google ローカル

平成19年度修士論文発表会 2007/2/13 /17 3

研究目的

(A) 主観性,客観性を区別した情報収集・提供システムの構築

(B) 主観・客観情報の利点を生かした情報推アルゴリズムの提案

平成19年度修士論文発表会 2007/2/13 /17 4

提案システム

情報データベース

情報推薦

アルゴリズム

客観的属性テーブル

主観的属性テーブル

主観性と客観性を

区別した情報カードとして蓄積

札幌に来た

観光客

ラーメンに

詳しいユーザ

美味しいランチを捜す利用者

客観的情報:

住所:札幌市中央区・・・・

電話番号:011:1234:5678

メニュー:味噌・塩

価格:500~1000円

主観的情報:

おいしさ

雰囲気

情報提供

Webサービス

情報推薦

ブログなどでの

情報利用

ユーザによって情報が発信され

その情報をユーザが利用する

平成19年度修士論文発表会 2007/2/13 /17 5

情報収集

米Technorati調べ

2003年3月~2007年4月

ブログの特徴

[Aimeur, E. 2003]

ユーザ数が多い

誰でも利用可能

個人が編集主体であり主観を含む

頻繁な更新と時系列表示

アーカイブ形式

情報提供者にとって利益になる仕組みが必要

ブロガーにとっての利点

ブログ記事にカードを挿入・・・・・・・・・・記事の充実

カードにブログへのリンクを記載・・・・・ブログの宣伝効果

主観的情報を利用したカード推薦・・・・新たな情報の発見

ブログの記事投稿時にカードを作ったり編集してもらう

ブログに着目

平成19年度修士論文発表会 2007/2/13 /17 6

情報推薦

主観的属性の量

類似ユーザの数

全体の嗜好分布 に依存する

各データの

属性値が類似

主観が類似

結果 結果

好み 好み

推薦アルゴリズムの効果は

アイテム間の類似度を利用[Sarwar,01]

利点:新規ユーザにも推薦可

欠点:多様性に乏しい

個人の主観の類似度を利用[Resnick,94]

利点:多様性が期待できる

欠点:新規ユーザには推薦不可

主観を考慮する推薦 協調フィルタリングを利用

既存アルゴリズム

複雑系の分析手法であるマルチエージェントを用いて推薦の効果を検証

Collaborative Filtering (CF)

平成19年度修士論文発表会 2007/2/13 /17 7

ユーザ集合 },...,1|{ niiU

),...,( 1 Finii ppp

効用 ||)||exp(, jijis vp α

}5,4,3,2,1{)( ,, jiji sfr格付け

嗜好ベクトル

アイテム集合

特徴ベクトル

推薦効果の分析-シミュレーションモデル

},...,1|{ mjjC

),...,( 1 Fjnjj vvv

推薦システム

ランダム推薦

人気推薦

ユーザ間CF

アイテム間CF

ターゲットユーザ

平成19年度修士論文発表会 2007/2/13 /17 8

ユーザ集合 },...,1|{ niiU

),...,( 1 Finii ppp

効用 ||)||exp(, jijis vp α

}5,4,3,2,1{)( ,, jiji sfr格付け

嗜好ベクトル

アイテム集合

特徴ベクトル

推薦効果の分析-シミュレーションモデル

},...,1|{ mjjC

),...,( 1 Fjnjj vvv

推薦システム

ランダム推薦

人気推薦

ユーザ間CF

アイテム間CF

推薦システムによる

格付けの予測

予測値が最も高い

アイテムを推薦

平成19年度修士論文発表会 2007/2/13 /17 9

ユーザ集合 },...,1|{ niiU

),...,( 1 Finii ppp

効用 ||)||exp(, jijis vp α

}5,4,3,2,1{)( ,, jiji sfr格付け

嗜好ベクトル

アイテム集合

特徴ベクトル

推薦効果の分析-シミュレーションモデル

},...,1|{ mjjC

),...,( 1 Fjnjj vvv

推薦システム

ランダム推薦

人気推薦

ユーザ間CF

アイテム間CF

推薦システムによる

格付けの予測

予測値が最も高い

アイテムを推薦

効用・格付け

の計算

効用 80., jis

5, jir格付け

推薦システムに

格付けを入力

平成19年度修士論文発表会 2007/2/13 /17 10

推薦効果の分析-実験結果1

ユーザ数n 100,500,1000,2000

アイテム数m 500

嗜好ベクトル 一様乱数

特徴ベクトル 一様乱数

ベクトルの次元 5

ip

jv

実験設定

ユーザ数=500の結果

平成19年度修士論文発表会 2007/2/13 /17 11

推薦効果の分析-考察

各アイテムの格付け数(推薦された回数)を観察

アイテム毎の推薦回数に差が少ない

薄→推薦回数:多

濃→推薦回数:少

アイテム毎の推薦回数の差が大きい

アイテム間CFの方が人気推薦に近い

平成19年度修士論文発表会 2007/2/13 /17 12

推薦効果の分析-実験結果2

最初はアイテム間CFで推薦し,途中でユーザ間CFに切り替える

実運用では,途中で推薦アルゴリズムを切り替える方法が有効

誰も格付けを入力していない状態から開始 初期状態で他ユーザの格付けあり

平成19年度修士論文発表会 2007/2/13 /17 13

システムへの実装

拡張モジュール

表示サーバ(ユーザインタフェース)

HTTPサーバ

JavaVM

データサーバ(情報管理・提供)

XOOPS

カード情報提供Webサービス

DB

推薦アルゴリズム

カードデータ管理

カード情報表示モジュール

ブログモジュール

HTTPサーバ

PHP DB

Webサービス

構築コストを最小化 (オープンソースの技術を利用)

動作環境としての汎用性・拡張性・メンテナンスの容易性を考慮

平成19年度修士論文発表会 2007/2/13 /17 14

プロトタイプシステムの動作例

省略

システムは、入力された記事内容と

カード情報を基にブログ記事を構築する

入力インタフェース ブログ記事

カード情報

平成19年度修士論文発表会 2007/2/13 /17 15

プロトタイプシステムの動作例

ブログ記事

情報サイト

個人のブログ 一般に公開される情報サイト

平成19年度修士論文発表会 2007/2/13 /17 16

プロトタイプシステムの動作例

主観的情報

客観的情報

• 飲食店名

• 住所

• 電話番号

• 休業日

• 地図

• メニュー

• 価格

etc.

ブログ記事

カード詳細情報

個人のブログ 一般に公開される情報サイト

平成19年度修士論文発表会 2007/2/13 /17 17

結論

Lecture Notes in Computer Science 4881, Springer-Verlag Berlin Heidelberg,

pp.1112-1121 (2007).

学会発表 : 国際2回(査読あり2回),国内8回(査読あり1回) 受賞 : 情報処理学会北海道支部研究奨励賞

ユーザから発信される情報を主観・客観を区別して蓄積

それを情報源として他のユーザに適切に提供

研究業績

主観・客観を区別した情報収集・提供システムを構築

主観・客観情報の利点を生かした推薦手法の提案

アイテム間の類似性による推薦と,主観の類似性による推薦の違いを分析

システムの運用状況で,両者を切り替える手法が有効

Future Work

推薦アルゴリズムを切り替える有効性を実データで評価

システム全体の評価法の検討