4
TOKYO METROPOLITAN UNIVERSITY ネットワーク分析 首都大学東京 都市環境学部 自然・文化ツーリズムコース [email protected] 倉田 陽平 観光地理情報学特論2014年度第82 さまざまなネットワーク 3 今日の授業の目的 交通網・インターネット・人間関係など、社会の あちこちで登場する「ネットワーク」について、 統一的に分析する手法の基礎を、実際に手を 動かしながら学ぶ! 4 自分のFacebookの友達ネットワーク を可視化してみよう https://apps.facebook.com/touchgraph/にアクセス • Facebookアカウントでログイン TouchGraphがあなたの代わりにFacebookに投 稿する許可を求めています」とでるが、スキップする 自動的に別のサイトにジャンプする 「このアプリケーションを実行しますか。Touch Graph Facebook…」と出るので実行を選択 5 表示の設定 Show All Friendsに☑ < をクリック Advancedの中にある Show self: ☑を □に User Label Shows:Full nameに変更 友達が多いときはZoomSpacingの値を下げる 「コミュニティ」が自動抽出されている 関係の近い人同士・コミュニティ同士が近くに配置されている 中心性の高い人ほど大きく表示される 中高同期 大学同学科 大学友人 ジオキャッシング 静岡IT 地理情報 観光情報 留学友人 留学同学科 ToursimToursim東大原研 7 なぜツーリズムは2グループに分かれたのか? なぜ先生方は中央付近に表示されているのか? この中にいるツーリズムでない人は何者か? 8 中心性とは? 各ノードがネットワーク中で どれだけ中心にあるかを示す量 いろいろな計算方法がある 次数中心性: リンクの数 ケーニッヒ指数: 最も遠くのノードまでの距離 シンベル指数: ほかの全ノードまでの距離和 近接中心性: (ノード数-1)÷シンベル指数 媒介中心性: ノード間の最短経路上となる度合 ページランク: Googleの基本アルゴリズム 9 中心性指標①:ケーニッヒ指数 各ノードから最遠ノードまでのグラフ距離 「値が小さいノードほど中心にある」とみなす 最小値を「グラフの半径」という 6 5 4 3 4 5 6 6 5 4 6 6 5

Facebookの友達ネットワーク 表示の設定 を可視化 …19 使用するツール:NodeXL •Excel上でネットワーク分析を行うための無料の アドイン(インストール必要)

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Facebookの友達ネットワーク 表示の設定 を可視化 …19 使用するツール:NodeXL •Excel上でネットワーク分析を行うための無料の アドイン(インストール必要)

TOKYO METROPOLITAN UNIVERSITY

ネットワーク分析

首都大学東京 都市環境学部 自然・文化ツーリズムコース

[email protected]倉田 陽平

観光地理情報学特論Ⅰ 2014年度第8回

2

さまざまなネットワーク

3

今日の授業の目的

交通網・インターネット・人間関係など、社会のあちこちで登場する「ネットワーク」について、統一的に分析する手法の基礎を、実際に手を動かしながら学ぶ!

4

自分のFacebookの友達ネットワークを可視化してみよう

• https://apps.facebook.com/touchgraph/にアクセス

• Facebookアカウントでログイン

• 「TouchGraphがあなたの代わりにFacebookに投稿する許可を求めています」とでるが、スキップする

• 自動的に別のサイトにジャンプする

• 「このアプリケーションを実行しますか。Touch Graph Facebook…」と出るので実行を選択

5

表示の設定

Show All Friendsに☑<をクリック

Advancedの中にあるShow self: ☑を□にUser Label Shows:をFull nameに変更

友達が多いときはZoom,Spacingの値を下げる

6

• 「コミュニティ」が自動抽出されている• 関係の近い人同士・コミュニティ同士が近くに配置されている• 中心性の高い人ほど大きく表示される

中高同期

大学同学科

大学友人

ジオキャッシング静岡IT

地理情報

観光情報

留学友人

留学同学科

Toursim①

Toursim②

東大原研

7

• なぜツーリズムは2グループに分かれたのか?• なぜ先生方は中央付近に表示されているのか?• この中にいるツーリズムでない人は何者か? 8

中心性とは?

• 各ノードがネットワーク中でどれだけ中心にあるかを示す量

• いろいろな計算方法がある– 次数中心性: リンクの数

– ケーニッヒ指数: 最も遠くのノードまでの距離

– シンベル指数: ほかの全ノードまでの距離和

– 近接中心性: (ノード数-1)÷シンベル指数

– 媒介中心性: ノード間の最短経路上となる度合

– ページランク: Googleの基本アルゴリズム9

中心性指標①:ケーニッヒ指数

• 各ノードから最遠ノードまでのグラフ距離

• 「値が小さいノードほど中心にある」とみなす

• 最小値を「グラフの半径」という

6 5 4 3 4 5 6

6

5 4 6

6

5

Page 2: Facebookの友達ネットワーク 表示の設定 を可視化 …19 使用するツール:NodeXL •Excel上でネットワーク分析を行うための無料の アドイン(インストール必要)

10

中心性指標②:シンベル指数

• 各ノードから他のノードまでのグラフ距離の和

• 値が小さいほど中心

3 2 1 0 1 2 3

3

2 1 3

3

2

47 36 29 27 32 43

47

3740 43

43

38

26

11

中心性指標③:近接中心性

• 近接中心性=(ノード数-1)÷シンベル指数

• 値が大きいほど中心

.26 .33 .41 .43 .38 .28

.26

.32.30 .28

.28

.24

.46

47 36 29 27 32 43

47

3740 43

43

38

26

12

中心性指標④:媒介中心性

各ノードが、他のノードの組み合わせを結ぶ最短経路上に存在する割合

0 .32 .53 .59 .45 0

0

00 0

0

0

.62

13

中心性指標⑤:ページランク

• Googleのかつてのアルゴリズム

• 有向ネットワークを前提

• リンクを「投票」と考える

• 重要度=投票される量(in)=各ノードが投票できる量(out)

• 「投票を集めること」あるいは「投票を集めるノードの数少ないリンク先になること」が重要度↑の秘訣

14

コミュニティとは

• 内部同士の結合が多く、外との結合が比較的少ない、ネットワークの部分集合(クラスター)

• 段階構成をとる

コミュニティ数15 コミュニティ数5 15

コミュニティ算出法:ギルバンーニューマン法

このリンクの媒介中心性が高い

二つの部分(=コミュニティ)

に分割

• 媒介中心性の高いリンクから順に切断

• 切断の結果、独立部分が生じたら、それを「コミュニティ」と考える

16

ギルバンーニューマン法の雰囲気を味わってみよう

Clustersの数を2から順に大きくしていって見る

17

ネットワーク分析の観光への応用例

• 交通網分析

–中心性→地域の交通網や観光資源ネットワークの要衝はどこか?

• 組織分析(まちづくり)

–中心性→中心人物は誰か?

–どのようなコミュニティが内在しているか?

18

例:多摩動物公園をネットワーク分析してみよう

Page 3: Facebookの友達ネットワーク 表示の設定 を可視化 …19 使用するツール:NodeXL •Excel上でネットワーク分析を行うための無料の アドイン(インストール必要)

19

使用するツール:NodeXL• Excel上でネットワーク分析を行うための無料のアドイン(インストール必要)

• 英語

• スタートメニューの中の「NodeXL Excel Template」もしくはNodeXLで作成したExcelファイルを直接、読み込むことで起動

http://nodexl.codeplex.com

20

多摩動物公園のデータを読む

• Zドライブの「14観光地理情報学特論Ⅱ」内にある「NodeXL-多摩動物園」だけをデスクトップにコピー

• 上のファイルをダブルクリックして開く

Vertices: ノードについてのデータEdges: リンクについてのデータ

21

統計量を算出する

• NodeXLリボンを選択

• Graph Metricesを選択

• Select All、Calculate Metricesを順に選択

22

統計量を計算する(結果)

Degree: 次数(リンクの数)Between Centrality: 媒介中心性Closeness Centrality: 近接中心性PageRank: ページランク

Overall Metricesタブ(ネットワーク全体の情報)

Verticesタブ(各ノードの情報)

Graph Type: 有向か無向かVertices: ノードの数Total Edges: リンクの数Max Geodesic Distance: 最大距離Graph Density: 結合度指標

23

コミュニティを計算する

• Groups→Group by Clusters• Girvan-Newmanを選択して,OK

24

コミュニティを計算する(結果)

Groupsタブ(コミュニティの情報)

Group Verticesタブ(各コミュニティの所属ノードの一覧)

コミュニティが6個できた!

25

ネットワークの図示

• ①Autofill Columns→②Verticesタブ→③Vertex sizeをPageRank, Betweeness Centrality(媒介中心性),Closeness Centrality(近接中心性)から選択→④Autofill→⑤Close

• ⑥Refresh Graphボタンを押す

④ ⑤

26

ネットワークの図示(結果)

Layoutをいろいろ変えてみよう(変えたらRefresh Graph)

27

Page 4: Facebookの友達ネットワーク 表示の設定 を可視化 …19 使用するツール:NodeXL •Excel上でネットワーク分析を行うための無料の アドイン(インストール必要)

28

ネットワーク分析に必要なデータ

• ノードのリスト

– ID–名称

– xy座標(オプション): 地理的データの場合

• リンクのリスト

–ノードIDとノードIDのペア

–ウェイト(オプション): 交通量、通信量など

29

課題:ディズニーランドをネットワーク分析してみよう

NodeXLを使って、次のネットワークのデータを自分で入力し、分析してみよう

シンデレラ城

アドベンチャーランド

トゥーンタウンファンタジーランド

ウエスタンランド

クリッタカントリー

ワールドバザール

トゥモローランド

ID: CC

ID: WL

ID: ALID: WB

ID: CJ

ID: FL ID: TT

ID: TL

30

補足:ネットワーク(グラフ)の種類

• 有向ネットワーク(directed network)↔無向ネットワーク(non-directed network)

• 重みつきネットワーク(weighted network)• 完全ネットワーク(complete network)• ツリー

31

道路網、鉄道網のようなネットワークは他のネットワークと何が違うのか?

V.S.

32

スモールワールドネットワーク

• 任意の2つのノードが、中間にわずかな数の

ノードを介するだけで接続されるというような性質のネットワーク

• 代表例:人脈

– 「6次の隔たり」

– 「友達の友達がアルカイダ」

• 道路網は?

• 航空網は?33

スケールフリーネットワーク

• ハブ(大量のノードと繋がっているようなノード)が存在するようなネットワーク

• 代表例:インターネット

– Google, Yahoo…

• 道路網は?

• 航空網は?

http://internet‐map.net/

34

今日のキーワード

• ネットワークとグラフ

• 中心性

• 近接性

• コミュニティ

• ソーシャルグラフ

• スケールフリーネットワーク

• スモールワールドネットワーク