14
データ解析で割安賃貸物件を探せ! (山手線沿線編) 2014.10.21 @berobero11 第11回「データ解析のための統計モデリング入門」読書会

データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

Embed Size (px)

DESCRIPTION

2014.10.21 第11回「データ解析のための統計モデリング入門」読書会 LT

Citation preview

Page 1: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

データ解析で割安賃貸物件を探せ!(山手線沿線編)

2014.10.21

@berobero11

第11回「データ解析のための統計モデリング入門」読書会

Page 2: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

• 広さ・最寄駅・築年や各種設備の割にお得な

割安物件を探す

• 首都圏の賃貸物件を全て扱うのは大変

まずは山手線の各駅から徒歩15分以内の物件について解析(32945件)

目的

Page 3: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

データはスクレイピングで

Photo

Photo

Page 4: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

前処理の例

• 相関がとても高いものを消したりまとめたり– [間取り],[専有面積] [間取り]を消す

– [2沿線利用可],[2駅利用可] ORをとる

– [上階無し],[最上階] ORをとる

• 経験で数値に変換したり

– [駅からXメートルにスーパー有] 𝑒𝑥𝑝 −𝑋

400

–部屋階 1F:0, 2F:0.5, 3F-9F:0.7 10F~:1

Page 5: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

応答変数は?

• 費用.2年間

=(賃料+管理費)*24 + 礼金 + 敷金 + 仲介手数料 +

その他初期費用 - フリーレント.price

Page 6: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

説明変数は?

• 合計226個

• 最寄駅, 駅まで徒歩X分, 専有面積, 築年数, 部屋の向き, 建物のタイプ, 各種設備など

• 少し多いと感じるので、本来はこれらを階層化したりするべきだと思いますが今回はパス.

Page 7: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

散布図の例

Page 8: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

統計モデル

𝑙𝑜𝑔 費用. 2年間𝑛 = 𝛼 + 𝛽駅𝑛+ 𝛽向き𝑛

+ 𝛽 ∙ 𝑥𝑛

駅・向き 以外の 説明変数

𝛽駅.東京 ~ 𝑑𝑛𝑜𝑟𝑚𝛽駅.神田 + 𝛽駅.有楽町

2, 𝜏駅

駅 と向き は CAR model を使用

Page 9: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

BUGSコード

結局説明変数が多くてStanでしか収束しませんでした…

Page 10: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

結果 | 駅の影響

Page 11: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

結果 | 部屋の向きの影響

Page 12: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

結果 | 設備等の影響

Page 13: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

結果 | 割安物件Top3

費用.2年間

費用.2年間.価値

割引.差額

割引.off(%)

最寄駅徒歩(分)

賃料 管理費 礼金 敷金専有面積

築年部屋階

向き

235 439 -204 -46.4 秋葉原 9 9.8 0 0 0 66.84 24 4 南

156 283 -127 -44.9 目白 14 6 0 6 6 42 40 4 南東

71 128 -57 -44.7 巣鴨 8 2.7 0.25 0 0 16 49 2 南

金額の単位は (万円)

Page 14: データ解析で割安賃貸物件を探せ!(山手線沿線編) LT

まとめ

• WinBUGSで CAR model を使おう!

• 『ここ2年の割安ノートPC』 とか誰かやりませんか?