37
Malaki Datuak ( 仮 ) Malaki Datuak ( 仮 ) 仮仮 ( 仮仮仮仮 ) 仮仮仮 仮仮仮 仮仮仮 、、、、 仮仮 仮仮仮 仮仮 、、

Big Data (Open Data) 企画案 1

Embed Size (px)

DESCRIPTION

企画練習用

Citation preview

Page 1: Big Data (Open Data) 企画案 1

Malaki Datuak (仮 )

Malaki Datuak (仮 )

井上 ( リーダー ) 、岩本、大谷、尾城、小峰、沼田、吉村

Page 2: Big Data (Open Data) 企画案 1

コンセプト

•インターネット上の情報による文章群のカテゴライズ

Page 3: Big Data (Open Data) 企画案 1

現状

Page 4: Big Data (Open Data) 企画案 1

現状

Page 5: Big Data (Open Data) 企画案 1

現状

Page 6: Big Data (Open Data) 企画案 1

現状

Page 7: Big Data (Open Data) 企画案 1

現状

Page 8: Big Data (Open Data) 企画案 1

問題意識

Page 9: Big Data (Open Data) 企画案 1

問題意識

Page 10: Big Data (Open Data) 企画案 1

解決

Page 11: Big Data (Open Data) 企画案 1

解決

Page 12: Big Data (Open Data) 企画案 1

解決

Page 13: Big Data (Open Data) 企画案 1

解決

Page 14: Big Data (Open Data) 企画案 1

解決

Page 15: Big Data (Open Data) 企画案 1

解決

Page 16: Big Data (Open Data) 企画案 1

解決

Page 17: Big Data (Open Data) 企画案 1

解決方法

•Twitter、 News feeds (RSS) から採ったcorpusを分析し、検索語句に近い語句・テ

ーマを算出 (Big Data!)。

Page 18: Big Data (Open Data) 企画案 1

解決方法

•Twitter、 News feeds (RSS) から採ったcorpusを分析し、検索語句に近い語句・テ

ーマを算出 (Big Data!)。

Page 19: Big Data (Open Data) 企画案 1

解決方法

•Twitter、 News feeds (RSS) から採ったcorpusを分析し、検索語句に近い語句・テ

ーマを算出 (Big Data!)。

Page 20: Big Data (Open Data) 企画案 1

解決方法

Page 21: Big Data (Open Data) 企画案 1

解決方法

Page 22: Big Data (Open Data) 企画案 1

解決方法

•その結果を基に categorize

Page 23: Big Data (Open Data) 企画案 1

解決方法

•その結果を基に categorize

Page 24: Big Data (Open Data) 企画案 1

解決方法

•その結果を基に categorize

Page 25: Big Data (Open Data) 企画案 1

解決方法

Page 26: Big Data (Open Data) 企画案 1

解決方法

Page 27: Big Data (Open Data) 企画案 1

解決方法

Page 28: Big Data (Open Data) 企画案 1

解決方法

Page 29: Big Data (Open Data) 企画案 1

解決方法

•Google, Bingから検索結果を持ってくる

Page 30: Big Data (Open Data) 企画案 1

解決方法

•Google, Bingから検索結果を持ってくる

Page 31: Big Data (Open Data) 企画案 1

アクセス数見込み

• 日本のインターネット中のイノベータ = 約 150 万人•一月で 150 万 *2.5% = 4 万 / 月•一年で 150 万 *16% = 24 万 / 月

Page 32: Big Data (Open Data) 企画案 1

Appendix

Page 33: Big Data (Open Data) 企画案 1

Technology

•LibSVM || Mahout (on Hadoop) || R•Neo4j•AWS || VPS

Page 34: Big Data (Open Data) 企画案 1

corpus (コーパス )

•構造化済みの例文集•構造化・多層化された辞書•自然言語の処理に用いるため、自然言語の文章を構造化し大規模に集積したもの

Page 35: Big Data (Open Data) 企画案 1

SVM (Support vector machine)

•機械学習により、分類器を生成する

(Public Domain) Wikipedia

Page 36: Big Data (Open Data) 企画案 1

イノベータ (Innovators)

•イノベーター理論とは 1962 年に米・スタンフォード大学の社会学者、エベレット・M・ロジャース教授( Everett M. Rogers )が提唱したイノベーション普及に関する理論

で、商品購入の態度を新商品購入の早い順に五つに分類したものです。•イノベーター( Innovators :革新者):•冒険心にあふれ、新しいものを進んで採用する人。市場全体の 2.5 %。•アーリーアダプター( Early Adopters :初期採用者):•流行に敏感で、情報収集を自ら行い、判断する人。他の消費層への影響力が大きく、オピニオンリーダーとも呼ばれる。市場全体の 13.5 %。•アーリーマジョリティ( Early Majority :前期追随者):•比較的慎重派な人。平均より早くに新しいものを取り入れる。ブリッジピープルとも呼ばれる。市場全体の 34.0 %。•レイトマジョリティ( Late Majority :後期追随者):• 比較的懐疑的な人。周囲の大多数が試している場面を見てから同じ選択をする。フォロワーズとも呼ばれる。市場全体の 34.0 %。•ラガード( Laggards :遅滞者):•最も保守的な人。流行や世の中の動きに関心が薄い。イノベーションが伝統になるまで採用しない。伝統主義者とも訳される。市場全体の 16.0 %。

Page 37: Big Data (Open Data) 企画案 1

Malaki Datuakについて

lBig Data (英語 )lbig datuak ( → バスク語 有名な謎言語の一つ、スペインとフランスの国境付近のバスク地方の言語 )lmalaki data ( → フィリピン語 TrendMicroの解析センター TrendLabsの本部がフィリピン )