狠狠撸

不動産価格査定における
ヘドニックアプローチから
ディープラーニングへの
進化の軌跡

自己紹介
? 濵田雄斗（はまだゆうと）
? 職歴
? イタンジインターン
? イタンジ就職
? 職業
? データサイエンティスト
? エンジニア
? 気になる
? AIチャット

ITANDIの目指す道
ITANDIとは
不動産の在り方を変えてく
不動産は“動かないモノ”であるがゆえに、取引コスト、情報の偏在、需給の不一致など
摩擦が生じやすい。我々は不動産（業）のデジタル化を推し進めることで、固定的で硬
直的な不動産のあり方を覆し、すべての人がすべての不動産に自由にアクセスできる
世界を実現する。
不動産取引をなめらかにする
我々はテクノロジーによって不動産業務の分業化、細分化、自動化を推し進め、不動産
取引を滑らかにする。不動産の価値は使用と交換によって生まれる。世界中の人々が
必用なときに、必用な単位で使用?交換できるようにすることで、不動産の使用価値と
資産価値は最大化する。
人間とテクノロジーの融合
我々は技術を創造し、活用し、世界へ価値を提供する事を生業としている。我々はテク
ノロジストであり、アントレプレナーであり、マーケッターである。最高の技術を身につけ、
最高の製品を創りあげ、最高の価値を提供しよう。

VALUE 価格算定機能を持ったAI
? 過去20年分25万件に及ぶ
区分所有マンションの成約
事例を解析
? 500名の個人投資家が利用
（2016年6月時点）
? 価格算出の精度は96％程
度
? 賃料算出と10年後の再販価
格も予測
? DCFとIRRによって投資価値
を判定

２つのアプローチ
ヘドニックアプローチ
DeepLearning

ヘドニック法は環境条件の違いが
どのように地価の違いに
反映されているかを観察し
それをもとに環境の価値の計測を
行う手法である。
国土交通政策研究所

「坪単価」 =
2155724 ＋ -18390.59 × 「駅徒歩」＋
-15901.88 × 「部屋数」＋ 72.31378 × 「管理費」＋
-32.82219 × 「修繕費」＋ -73772.4 × 「構造」＋
4556.246 × 「所在階」＋ 30122.13 × 「総階数」＋
-31798.67 × 「築年月」＋ 32975.37 × 「バルコニー」＋
0.3641633 × 「駅毎平均坪単価」＋ 80394.72 × 「土地権利」＋
323917.2 × 「シリーズ物」＋ -54608.89 × 「タワーマンション」
係数 ? 変数
※ダミー変数：数字でないデータを数字変換する。

データ
? 使用データ
? 約1ヶ月の募集データ（約1万5000件）
? クローリング
? 路線ごと、平米ごとで分割（120以上に分類）
? Ex)山手線の30㎡以下、山手線の30㎡以上50㎡以下
? 理由：精度を上げるため
? 物件の条件のみを使用し、経済指標は使用せず
? 目的変数
? 販売物件の募集坪単価
? 販売物件の予測月額賃料

データの整形
Ruby でごりごり。。。

モデルの作成
Rでまわす
（無理やりRailsで） rrx

予測
係数をmysqlに保存して、Rails内で計算

この時の課題
? 精度が低すぎる
? 少ないデータ数
? 100以上のモデルのメンテ工数
? 少ない変数

少ない変数
実業務?実購入の知見がない
→眼前のデータからしか変数を作れない
物件を購入する人は何を考えているのか？
→弊社代表伊藤の知見

解決策
? 精度が低すぎる
? 少ないデータ数
? 100以上のモデ
ルのメンテ工数
? 少ない変数
？
クローリング
プロの教え

新技術（2015年5月当時）
Deep Learning
chainerまだなかった

H2O
Java scala python可能
GUI完備
Sparkの分散処理で
高速化
まだGPUとかそこまで盛り上がっ
てなかった

データ -クローリングの結果-
? データ数は２５万件に増加
? モデルは４つまで減少
モデル数データ数
4月 6月
1
30
25倍

データ
? 使用データ
? 過去25年の成約データ（約２５万件）
? 平米ごとで分割（４つに分割）
? 物件の条件と、経済指標を使用
? 金利、空室率、病床数、etc
? 目的変数
? 販売物件の成約坪単価
? 販売物件の予測月額賃料

データのクリーニング
Rails内で自動化

モデルの作成（GUIでも可能）

モデルの作成（scalaでCUI化）

予測
Railsからコンパイルしたjavaバイナリを実行

Deep Leaningの課題
? モデルの作成時間
– スポットインスタンスの活用
? ブラックボックス
– ヘドニックのような
各変数に対しての説明が不可

まとめ -アルゴリズム-
ヘドニックアプローチ Deep Learning
メ
リ
ッ
ト
? 変数の影響力が明確
? DLほどデータ数が必要で
はない
? 精度が出る
? 変数選定の工数低
デ
メ
リ
ッ
ト
? 変数選定の工数高
? やりきれば精度出る
? 変数の影響力が不明
? 膨大なデータ数が必要

まとめ -データまわり-
データだけではわからない必要変数の存在
→実際に購入する、値段を付ける場合に人は何を
見ているか
R2が高い ≠ 精度が高い

ご清聴
ありがとうございました

狠狠撸

不动产価格査定におけるヘドニックアプローチからディープラーニングへの进化の轨跡

Recommended

More Related Content

What's hot (20)

Viewers also liked (18)

Similar to 不动产価格査定におけるヘドニックアプローチからディープラーニングへの进化の轨跡 (6)

Recently uploaded (11)

不动产価格査定におけるヘドニックアプローチからディープラーニングへの进化の轨跡

Editor's Notes