11
1 VI. 空間解析 VI-4 連続分布(面データ)を分析する方法 VI. 空間解析 面データ(areal data, area data): 空間集計単位ごとにデータを集計して構成される 連続分布 例:町丁目ごとの人口密度,街区ごとの建蔽率など VI. 空間解析 VI-4.1 可視化 面データの可視化には,普通はコロプレス地図 (属性値を色分けによって表したもの)が用いられ る. VI. 空間解析 注意点 1) 属性の境界値の取り方によって見え方が異なる 2) 領域の取り方によって見え方が異なる

VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

1

VI. 空間解析

VI-4 連続分布(面データ)を分析する方法

VI. 空間解析

面データ(areal data, area data):

 空間集計単位ごとにデータを集計して構成される

連続分布

 例:町丁目ごとの人口密度,街区ごとの建蔽率など

VI. 空間解析

VI-4.1 可視化

 面データの可視化には,普通はコロプレス地図

(属性値を色分けによって表したもの)が用いられ

る.

VI. 空間解析

注意点

 1) 属性の境界値の取り方によって見え方が異なる 2) 領域の取り方によって見え方が異なる

Page 2: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

2

VI. 空間解析

 場合によっては,面データの元々の境界線ではなく

ラスター化したものを用いることもある.ラスターデー

タの場合,領域の大きさが同じであるため,視覚的

な錯覚を起こしにくいと言う利点がある(一般に,大

きな領域の値は強調されて見える).

VI. 空間解析

 その他,カーネル法による平滑化や,鳥瞰図による

表現が用いられることもある.

VI. 空間解析

VI-4.2 join統計量(空間的自己相関1)

 面データの分析における大きな関心

   ・・・空間的自己相関(spatial autocorrelation)

    「似たもの同士が集まっている」

    「似たもの同士が避け合っている」

空間的自己相関

正 負 なし

Page 3: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

3

VI. 空間解析

空間的自己相関とは,

 単一のオブジェクト分布における空間的近接性と

属性の類似性の関係を記述する概念

正の空間的自己相関・・・空間的に近いオブジェクト

同士ほど類似した属性を持つ(似たもの同士が

集まっている)状態

負の空間的自己相関・・・空間的に近いオブジェクト

同士ほど異なる属性を持つ(似たもの同士が避

け合っている)状態 空間的自己相関

正 負 なし

VI. 空間解析

 空間的自己相関を分析するには,オブジェクトの位

置と属性を同時に考えなければならない.従って,点

パターン分析などの方法では十分ではない.

VI. 空間解析

1) 正方形セルのラスターデータ

2) 2値属性(白と黒など)

 という場合にのみ適用可能である.

 join統計量は,空間的自己相関の中でも最も単純なものを扱う.即ち,

VI. 空間解析

 このようなデータについて,

1) 白は白同士,黒は黒同士集まっている(正の空間的自己相関)

2) 白と黒が混ざっている(負の空間的自己相関)

3) 特定の傾向を持たない(空間的自己相関がない)

のどれに当てはまるかを考える.空間的自己相関

正 負 なし

Page 4: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

4

VI. 空間解析

方法

 全ての隣接する(上下左右)セル対のうち,白黒の

対になっているものを数える(この数をNとする).

  Nが小・・・正の自己相関

  Nが大・・・負の自己相関

ランダム分布の場合:E[N]=75.40

N=45 N=104 N=80

VI. 空間解析

Nの大きさの相対的評価: 特定の傾向が存在しない場合,即ち,白と黒がラン

ダムに割り当てられている場合を考える.

 領域内の白と黒の数をそれぞれwとb,領域の縦横のセル数をそれぞれcとrとする.

VI. 空間解析

 白と黒がランダムに割り当てられている場合のNの期待値:

[ ] ( )( )1

22E−

−−=crcr

rccrbwN

 従って, Nがこの値よりも小さければ正の空間的自己相関,大きければ負の空間的自己相関というこ

とになる.

VI. 空間解析

統計的検定:セル数が比較的多い場合には可能

 白と黒がランダムに割り当てられている場合,Nは分散V[N]が

( )( )( )

( )( )( ) ( )2

010201

1232112

14

−−

−−−−+−++

− crcrbwS

crcrcrcrcrbwSSSbw

crcrbwS

の正規分布で近似される.但し,

( )( )4778822

1

0

+−−=−−=

rccrSrccrS

VI. 空間解析

 従って,統計量

[ ][ ]NNN

ZV

5.0E −−=

が十分大きな値を示せば,同じ色のセル同士が集ま

ると結論することができる(0.5は, Nが整数値しか取らないことを考慮した調整用の値).

Page 5: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

5

VI. 空間解析

 なお,join統計量は,隣接関係を上下左右の4方向ではなく,斜めを加えた8方向にしてもほぼ同様に用いることができる.

VI. 空間解析

join統計量の応用(多値属性を持つ場合) ・・・コンビニエンスストアの競合関係

VI. 空間解析

コンビニエンスストアの商圏

 ・・・ボロノイダイアグラムによってほぼ近似される

商圏の隣接している店舗同士

 ・・・競合関係

 ボロノイダイアグラムの双対グラフであるドローネ

三角網の各リンクの両端にある店舗を調べることで,

店舗間,さらにはチェーン間の競合の様子が分析で

きる.

VI. 空間解析

全店舗数:N

各チェーンの店舗数:N1, N2, …, Nm

ドローネ三角網のリンク数:L

両端がそれぞれチェーンi,jというリンクの数:nij

 nijの大きいチェーンi,jの組み合わせが,競合の多いコンビニエンスストアチェーンといえる.

VI. 空間解析

 一方,各点にチェーンをランダムに割り当てるとき,

nijの期待値E[nij]は

[ ] ( )( )( )

−−

≠−=

otherwise11

if1

2

EL

NNNN

jiLNN

NN

nii

ji

ij

である.従って,nijとE[nij]を比べ,前者が大きければ「競合」,反対であれば「回避」ということがわかる. 東京都練馬区におけるコンビニエンスストアの分布

ファミリーマート セブン・イレブン ローソン その他

Page 6: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

6

コンビニエンスストア間の競合関係

ファミリーマート セブン・イレブン ローソン その他

コンビニエンスストアチェーン間の競合関係

ファミリーマート

セブン・イレブン

ローソン

ファミリーマート 0.846

その他

1.200 1.0561.263

0.625 0.818 0.939

0.666 0.969

0.973

セブン・イレブン

ローソン

その他

VI. 空間解析

 なお,統計的検定はモンテカルロシミュレーション

によって行う.

VI. 空間解析

join統計量の問題点1) 属性が二値に限定される.2) セルが全て合同である.3) 2つのセルの隣接関係にのみ依存し,距離によらない.

VI. 空間解析

 join統計量の3つの問題点を解決する.

1) 連続量を属性として扱うことができる.2) セルの形や大きさに制約がない(オブジェクトは点や線でも良い)

3) 2つのオブジェクト間の関係を様々に定義することができる,

VI-4.3 Moran’s I統計量(空間的自己相関2)

VI. 空間解析

領域数:n

領域iの属性値:xi

領域iと領域jの間の距離:dij

( )( )( )∑

∑∑

∑∑ −

−−=

ii

i jji

ij

i j ij

xx

xxxxd

d

nI 2

2

2

1

1

Page 7: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

7

VI. 空間解析

Iが1に近い・・・

 正の空間的自己相関(距離の近い領域ほど属性

値が近い)

Iが-1に近い・・・

 負の空間的自己相関

11 ≤≤− I

Moran’s Iの変域

VI. 空間解析

 なお, Moran’s Iの計算に用いられる領域間距離dijは,どのような距離を用いてもかまわない.実際,

Moran’s Iの定義は

( )( )( )∑

∑∑∑∑ −

−−=

ii

i jjiij

i jij xx

xxxxA

AnI 2

とも書かれる(ここで,Aijは領域iと領域jの近接性を表す).

VI. 空間解析

近接性Aij及び領域間距離dijの例

重心間距離の逆数,その2乗の逆数最短距離

隣接していれば0,離れていれば1平均距離

ネットワーク距離

時間距離

VI. 空間解析

 Moran’s Iは,面データだけではなく点データや線データにも適用可能である.要は,オブジェクトの属

性とオブジェクト間の近接性が定義されている対象

であればよい.

ランダム分布の場合:E[I]=-0.071

I=0.910 I=-0.797 I=-0.052

56 7 6 6

56 5

53

3

23

41

53 7 1 6

36 4

57

3

26

56

43 7 6 1

36 5

32

5

76

56

VI. 空間解析

Moran’s Iの統計的検定

・・・各領域に属性値をランダムに割り当てる,という

状態を考える.このとき, Iの期待値は

[ ]1

1E−

−=n

I

である.

Page 8: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

8

VI. 空間解析

一方,Iの分散は

[ ]

( )( )

( )( ){ }

( )( )21

621333

V

20212

2

4

2021

2

−−

+−−

−−+−+−

=∑

nn

SnSSnnxx

xxSnSSnn

I ii

ii

( )2

2

21

0

21

∑ ∑∑

∑∑

∑∑

+=

+=

=

i jji

jij

i jjiij

i jij

AAS

AAS

AS但し,

VI. 空間解析

 そして, Moran’s Iは近似的に正規分布

[ ] [ ]( )IIN V,Eに従うので,統計的検定が可能である.

VI. 空間解析

Moran’s Iの注意点

 近接度を表す変数の設定が重要

 (自由度が大きい分,分析対象に適した変数を選

ぶのが難しいという面)

VI. 空間解析

VI-5 その他の分析方法

1) ネットワークデータの分析 2) 連続分布(サーフェスデータ)の分析

Page 9: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

9

nickel concentrations in north Vancouver Island

0.00.20.40.00.8

1.0

0.0 1.0 2.0

γ(x)

3) カルトグラム(cartogram)

Hypothetical cases of a disease

4) 線分布と点分布の関係

Spatial relationship between a point distributionand a line distribution

5) 連続分布と点分布の関係

6) 2つの連続分布間の関係 7) ネットワーク空間上での点分布

Page 10: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

10

8) 多数の点分布間の関係VI. 空間解析

VI-6 空間データマイニング

 大量の空間データの中から,有益な情報やパター

ンをコンピュータによって半自動的に見つける方法

 コンピュータ性能の向上に伴って,ここ数年急速

に研究が進んでいる.

VI. 空間解析

空間クラスタリング

分類

規則発見

Page 11: VI. 空間解析 VI. 空間解析 - 東京大学ua.t.u-tokyo.ac.jp/okabelab/sada/docs/pdf_class/u06_2.pdfVI. 空間解析 なお,join統計量は,隣接関係を上下左右の4方向

11