Upload
renom-user-group
View
138
Download
0
Embed Size (px)
Citation preview
CONFIDENTIAL
Point Cloudの作り方
2017/11/08
統計量や次元削減など様々な手法を用いることができる。
本日は、その中でPCAについて紹介する。
https://www.slideshare.net/AnalyticsWeek/tda-33562822
CONFIDENTIAL
例
2017/11/08
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
身長、体重をプロットしたもの。
これを1次元で表したい。
CONFIDENTIAL
例
2017/11/08
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
体重の軸に投影
身長の軸に投影
片方の軸に投影してしまうと、もう一方の情報が失われてしまう。
CONFIDENTIAL
例
2017/11/08
身長、体重の両方の情報を入れた軸が欲しい。
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
直感的にこのような軸が思い浮かぶ
CONFIDENTIAL
例
2017/11/08
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
なぜこれが良いと思うか?
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
特徴の異なる点が近くに来てしまう
CONFIDENTIAL
例
2017/11/08
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
データの広がりが大きい方向に軸を取ればデータを区別できる
CONFIDENTIAL
PCAの利点
2017/11/08
新しい軸(z)が元の変数で表すことができる。・ 身長 体重
次元削減後のデータが次元削減前の何%の情報量を持つか(寄与率)が計算できる。
55
60
65
70
75
80
85
90
155 160 165 170 175 180 185 190 195
例) z = 0.6 x 身長 + 0.4 x 体重