Upload
berobero11
View
3.617
Download
2
Embed Size (px)
DESCRIPTION
2014.10.21 第11回「データ解析のための統計モデリング入門」読書会 LT
Citation preview
データ解析で割安賃貸物件を探せ!(山手線沿線編)
2014.10.21
@berobero11
第11回「データ解析のための統計モデリング入門」読書会
• 広さ・最寄駅・築年や各種設備の割にお得な
割安物件を探す
• 首都圏の賃貸物件を全て扱うのは大変
まずは山手線の各駅から徒歩15分以内の物件について解析(32945件)
目的
データはスクレイピングで
Photo
Photo
前処理の例
• 相関がとても高いものを消したりまとめたり– [間取り],[専有面積] [間取り]を消す
– [2沿線利用可],[2駅利用可] ORをとる
– [上階無し],[最上階] ORをとる
• 経験で数値に変換したり
– [駅からXメートルにスーパー有] 𝑒𝑥𝑝 −𝑋
400
–部屋階 1F:0, 2F:0.5, 3F-9F:0.7 10F~:1
応答変数は?
• 費用.2年間
=(賃料+管理費)*24 + 礼金 + 敷金 + 仲介手数料 +
その他初期費用 - フリーレント.price
説明変数は?
• 合計226個
• 最寄駅, 駅まで徒歩X分, 専有面積, 築年数, 部屋の向き, 建物のタイプ, 各種設備など
• 少し多いと感じるので、本来はこれらを階層化したりするべきだと思いますが今回はパス.
散布図の例
統計モデル
𝑙𝑜𝑔 費用. 2年間𝑛 = 𝛼 + 𝛽駅𝑛+ 𝛽向き𝑛
+ 𝛽 ∙ 𝑥𝑛
駅・向き 以外の 説明変数
𝛽駅.東京 ~ 𝑑𝑛𝑜𝑟𝑚𝛽駅.神田 + 𝛽駅.有楽町
2, 𝜏駅
駅 と向き は CAR model を使用
BUGSコード
結局説明変数が多くてStanでしか収束しませんでした…
結果 | 駅の影響
結果 | 部屋の向きの影響
結果 | 設備等の影響
結果 | 割安物件Top3
費用.2年間
費用.2年間.価値
割引.差額
割引.off(%)
最寄駅徒歩(分)
賃料 管理費 礼金 敷金専有面積
築年部屋階
向き
235 439 -204 -46.4 秋葉原 9 9.8 0 0 0 66.84 24 4 南
156 283 -127 -44.9 目白 14 6 0 6 6 42 40 4 南東
71 128 -57 -44.7 巣鴨 8 2.7 0.25 0 0 16 49 2 南
金額の単位は (万円)
まとめ
• WinBUGSで CAR model を使おう!
• 『ここ2年の割安ノートPC』 とか誰かやりませんか?