Upload
konishi-masafumi
View
3.013
Download
1
Embed Size (px)
DESCRIPTION
erockrの運営についてと、そこで得られたデータを活用したグラビアアイドルを地図にしたところ、25歳を境に綺麗にクラスタリングできた話など。#gxeb の第一回のLTです
Citation preview
erockr の運用と得られたデータの活用
@koni
2010年11月26日 #gxeb
koni•大学3年生 (就職活動中)•趣味:ウェブサービスをつくること、テニス•Twitter: @koni•育ち:千葉県流山市 今:埼玉県所沢市•お願い•ライトニングトークどころか、こういった勉強会は初めてです。緊張しています。どうか暖かい気持ちで見守ってください。
今日は、僕の運営しているerockrというサイトの話をします。
erockr?•erockr = flickr + ero•Flickr APIからグラビアアイドル画像を専門に検索
•2010年3月開設•PC版、ガラケー版、iPhone版
Flickrを使うメリット•API完備•ダウンロードが早い (さすが米Yahoo!)•高画質•画像共有サイトなので、高画質なグラビア画像が多数共有されている
•→GoogleやYahoo!の画像検索と比べて、件数は少ないがクオリティの高い画像のみヒット!
では、各機能について、画面を見ながら説明します
erockr.com
検索キーワードから検索
検索結果
画像にオンマウス→評価ボタン出現
ランキングや
名前一覧からも検索できます
ただ検索するだけじゃつまらない•このようなAPIを叩くだけのサイト•オリジナルなコンテンツがない•ランキングなど、自分のところで得られるデータの活用が重要
•そこで...
•画像の表示順序を変更→検索結果のクオリティを向上
•クリック数(検索結果ページのクリックは全て記録!)
•ユーザによる評価
•エロ画像をさがしている人は、イイ!と思った画像をクリックすることが多くかなりよく機能している
ただ検索するだけじゃつまらないので 1/3
ただ検索するだけじゃつまらないので 2/3
•レコメンド機能•「上戸彩を見た人は新垣結衣も見ています」といった機能
•例:
•ユーザ別のレコメンド(ユーザの閲覧履歴から)
ただ検索するだけじゃつまらないので 3/3
•wikipediaからアイドルの定量的な情報をとってくる
•生年月日、血液型、身長、体重、スリーサイズ、カップ
正規表現などで無理やりとってくる
集めたデータ•ログ(アイドルごとの閲覧回数ランキング)•アイドル間の類似度(レコメンド機能用)•wikipediaからのアイドルの定量的情報(生年月日、血液型、身長、体重、スリーサイズ、カップ)
データの活用
①
類似度が高い↓
距離が近い!
地図を作ろう
多次元尺度構成法
類似度からアイドルを二次元に配置できる!
書いてみた!
erockrランキング上位50人の類似マップ
類似度が高い人ほどできるだけ近くに描かれています
erockrランキング上位50人の類似マップロリ巨乳クラスタ
清純派アイドルクラスタ(25歳以下)
歌ってるクラスタ
中堅アイドルクラスタ(25歳以上)
類似度データだけで、アイドルをある程度クラスタリングできる
②
アイドルの人気と胸の大きさは相関するのか?
分布図を書いてみた
0
2
4
6
8
10
12
0 200 400 600 800
カップ
erockr閲覧回数ランキング順位
カップ 0:A 1:B 2:C 3:D 4:E 5:F 6:F 7:G 8:H 9:I 10:J 11:K
erockrでの順位とカップ数の関係↑巨乳
↓貧乳
n=208
→不人気←人気
相関なし!
では一般女性と比べてみたら?
0
7.5
15
22.5
30
A B C D E F G H I J以上
グラビアアイドル一般女性
(%)
グラビアアイドルと一般女性のカップ数の分布の違い
0
7.5
15
22.5
30
A B C D E F G H I J以上
グラビアアイドル一般女性
(%)
グラビアアイドルと一般女性のカップ数の分布の違い
約3段階
一般女性よりグラビアアイドルの方がおよそ3段階大きい。
③
アイドルの人気とバスト/ウエスト比率は関係するのか?
エステビューティ 特集 2009年4月エステ特集「バスト・ウエスト・ヒップ 魅せるボディライン特集」よりhttp://www.esthetic.cc/esthe_html/special/sp_200904.html
理想のバスト/ウエスト比率は、1.4
バストウエスト比率と人気の関係
1.47
バストウエスト比率と人気の関係
1.47
有意な相関なし!人気グラビアアイドルの
バストウエスト比率は 1.47程度
まとめ•apiを利用しただけでオリジナルのコンテンツを持たないマッシュアップサイトでも、いろんなデータがとれたりして楽しい。
ありがとうございました