狠狠撸

狠狠撸Share a Scribd company logo
2020年度 建築計画第二
(第9回 2020.06.05)
建築?都市における
相関?因果関係の分析手法 1
東京工業大学 環境?社会理工学院 建築学系
沖 拓弥
12020年度 建築計画第二 第9回(沖 拓弥)
2020 9年度 建築計画第二 第 回(沖 拓弥) 2
適宜,質問時間を設けるようにしますが,
授業内容についての質問は,随時,チャット
に入力してください。
2020 9年度 建築計画第二 第 回(沖 拓弥) 3
? 2つの事柄の関連性を調べたい。
? 例1:人口と蔵書数の関係
? 例2:蔵書数と貸出冊数の関係
? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係
? 例4:建物階数と建物高さの関係
? 例5:高齢化率と空き家率の関係
? 例6:写真と実空間での印象評価の関係
? 例7:築年数と建替え割合の関係
? 相互に関連があることをどのように判断すれば良いか?
? 関係の強さをどのように表せば良いか?
以上の背景を念頭に置きながら
今回の講義を聞いてください
背景
4
第9回のテーマ
2020年度 建築計画第二 第9回(沖 拓弥)
相関分析 と 回帰分析
相関分析(Correlation analysis)
2種類の変数XY間の因果関係を考えずに,変数
間の関係の強さを測定する方法。
回帰分析(Regression analysis)
2種類の変数XY間の因果関係を仮定し,変数X
が変数Yに与える影響の測定や,予測に用いら
れる方法。
5
相関分析の例1
2020年度 建築計画第二 第9回(沖 拓弥)
身長と体重の関係
正の相関
http://www.toukei.metro.tokyo.jp/manabou/tyuu/sirou2/tokutyou2/ma1206t24b.htm
散布図を描くことで
視覚的に確認する
6
相関分析の例2
2020年度 建築計画第二 第9回(沖 拓弥)
年間の平均気温と積雪日数の関係
負の相関
https://bellcurve.jp/statistics/course/9589.html
7
相関分析の例3
2020年度 建築計画第二 第9回(沖 拓弥)
道路延長と下水道延長の関係
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
250mメッシュ毎の道路延長と下水道延長の比較
8
回帰分析の例1
2020年度 建築計画第二 第9回(沖 拓弥)
親の身長と子の身長の関係
背の高い親たちの子どもの
平均身長は親たちより低く,
背の低い親たちの子どもの
平均身長は親たちより高くな
る傾向がある。
子どもの平均身長は,全体
の子どもの身長に近づく(回
帰する)。
親(原因)の身長から子ども(結果)の身長を予測
?逆は意味をなさない。よって回帰分析。
9
回帰分析の例2
2020年度 建築計画第二 第9回(沖 拓弥)
建物棟数と下水道延長の関係
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
建物棟数が増えるほど
下水道延長も長くなる。
建物(原因)があることで,
下水道(結果)が整備される。
10
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
2種類の変数XY間の相関関係/因果関係の強さ
を表すために,相関係数(Correlation coefficient)と
いう指標を用いる。
11
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
250mメッシュ毎の道路延長と下水道延長の比較
左図は,計N個のメッシュにお
ける道路延長と下水道延長の
関係をプロットした散布図であ
るとする。
x:
y:
平均値
分散
(xi, yi)
( )
22
1
1 N
x i
i
x x
N
σ
=
= ?∑
1
1 N
i
i
x x
N =
= ∑
※yについても同様。
共分散 ( )( )
1
1 N
xy i i
i
x x y y
N
σ
=
= ? ?∑
12
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
250mメッシュ毎の道路延長と下水道延長の比較 このとき,(ピアソンの積率)
相関係数rxyは以下のように
定義される。
x:
y:
(xi, yi)
xy
xy
x y
r
σ
σ σ
= (σxとσy は標準偏差)
=分散の平方根
( )( )
( ) ( )
1
2 2
1 1
N
i i
i
N N
i i
i i
x x y y
x x y y
=
= =
? ?
=
? ?
∑
∑ ∑
(-1≦rxy≦1)
13
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
相関係数rと散布図上の点分布の関係
https://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95
%B0#/media/File:Correlation_examples2.svg
無相関
正の相関 負の相関
絶対値が1に近いほど変数xと変数yは直線的な
関係にあり,相関関係/因果関係が強いといえる。
14
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
相関係数rと散布図上の点分布の関係
https://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95
%B0#/media/File:Correlation_examples2.svg
15
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
2種類の変数XY間の相関関係/因果関係の強さ
を表すために,相関係数(Correlation coefficient)と
いう指標を用いる。
( )( )
( ) ( )
1
2 2
1 1
N
i i
xy i
xy N N
x y
i i
i i
x x y y
r
x x y y
σ
σ σ
=
= =
? ?
= =
? ?
∑
∑ ∑
(-1≦rxy≦1)
16
回帰分析の基本的考え方
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係 ① 2種類の変数のうち,原因に
あたる変数(説明変数)をx軸,
結果にあたる変数(目的変
数)をy軸として,散布図を作
成する。
② 線形回帰式 y = ax + b の未
知パラメータa(傾き),b(y切
片)を最小二乗法によって求
め,回帰直線を描く。
③ 決定係数R2を算出する(?相
関係数rxy)。
x:
y:
17
回帰分析の基本的考え方
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係 ① 2種類の変数のうち,原因に
あたる変数(説明変数)をx軸,
結果にあたる変数(目的変
数)をy軸として,散布図を作
成する。
② 線形回帰式 y = ax + b の未
知パラメータa(傾き),b(y切
片)を最小二乗法によって求
め,回帰直線を描く。
③ 決定係数R2を算出する(?相
関係数rxy)。
x:
y:
18
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
y = ax + b という回帰式のパラ
メータa,bを推定することを考える。
(xi, yi)
y = ax + b
i i iy ax b ε= + +
誤差項
変形すると,
( )i i iy ax bε = ? +
すべての点における誤差の2乗
の和(誤差自乗和)が最小にな
るときのa,bを採用する。
( ){ }
22
1 1
N N
i i i
i i
y ax b minimizeε
= =
= ? + →∑ ∑
εi
b
xi
axi
yi
最小二乗法
正のみ
19
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
aとbについてそれぞれ変形すると,
( ) ( ){ }
( ) ( ){ }
22 2
1
22
1
2
2
N
i i i i
i
N
i i i i
i
S x a x y b a y b
S b y ax b y ax
=
=
= ? ? + ?
= ? ? + ?
∑
∑
下に凸
下に凸
S
a
?a
Smin
0
S
a
?
=
?
傾き
つまり,誤差自乗和Sが最小(Smin)となるのは,
0
S
a
?
=
?
かつ 0
S
b
?
=
?
のとき
20
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
( ) ( ){ }22
1
2
N
i i i i
i
S b y ax b y ax
=
= ? ? + ?∑bについて,
( )
1
2 2 0
N
i i
i
S
bN y ax
b =
?
= ? ? =
?
∑
1 1
1 1N N
i i
i i
b y a x
N N= =
= ?∑ ∑
b y ax= ? ???①
21
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
( ) ( ){ }22 2
1
2
N
i i i i
i
S x a x y b a y b
=
= ? ? + ?∑aについて,
( )2
1 1
2 2 0
N N
i i i
i i
S
a x x y b
a= =
?
= ? ?=
?
∑ ∑
2
1 1 1
N N N
i i i i
i i i
a x x y b x
= = =
= ?∑ ∑ ∑
前のスライドの式①を代入すると,
( )2
1 1
2 2
1 1
N N
i i i
i i
N N
i i i
i i
a x x y y ax Nx
a x Nx x y Nxy
= =
= =
= ? ?
? ?
? = ?? ?
? ?
∑ ∑
∑ ∑
22
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2 2
1
1
1
N
i i
i
N
i
i
x y xy
N
a
x x
N
=
=
?
=
?
∑
∑
2 2 2 2 2
1 1 1
1 1 1
2 2
N N N
i i i
i i i
x x x x x x x
N N N= = =
? ?
= ? += ? +? ?
? ?
∑ ∑ ∑
( ) ( )
22 2 2 2
1 1 1 1
1 1 1
2 2
N N N N
i i i i i
i i i i
x x x Nx x xx x x x
N N N= = = =
? ?
= ? + = ? + = ?? ?
? ?
∑ ∑ ∑ ∑
(分母)
2
xσ=
xの分散
23
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2 2
1
1
1
N
i i
i
N
i
i
x y xy
N
a
x x
N
=
=
?
=
?
∑
∑
1 1 1 1
1 1 1 1
2
N N N N
i i i i i i
i i i i
x y xy xy x y y x x y xy
N N N N= = = =
= ? += ? ? +∑ ∑ ∑ ∑(分子)
( ) ( )( )
1 1
1 1N N
i i i i i i
i i
x y x y xy xy x x y y
N N=
= ? ? += ? ?∑ ∑ xyσ=
xとyの共分散
24
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2
2 2
1
1
1
N
i i
xyi
N
x
i
i
x y xy
N
a
x x
N
σ
σ
=
=
?
= =
?
∑
∑
???②
25
回帰式のパラメータ推定(まとめ)
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
(xi, yi)
y = ax + b
i i iy ax b ε= + + 誤差項
εi
b
xi
axi
yi
最小二乗法
( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
0
S
a
?
=
?
と 0
S
b
?
=
?
を連立させ解くと
2
? xy
x
a
σ
σ
= , ? ?b y ax= ?
このとき,観測値の各点に最も
あてはまりの良い回帰直線を
引くことができている。
26
回帰式のパラメータ推定(まとめ)
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
(xi, yi)
i i iy ax b ε= + + 誤差項
xi
axi
最小二乗法
( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
0
S
a
?
=
?
と 0
S
b
?
=
?
を連立させ解くと
2
? xy
x
a
σ
σ
= , ? ?b y ax= ?
このとき,観測値の各点に最も
あてはまりの良い回帰直線を
引くことができている。
残差?ie?iy
27
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
28
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
x:
y:
(xi, yi)
xi
axi
残差?ie?iy
yi
29
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
x:
y:
(xi, yi)
xi
axi
残差?ie?iy
yi
「全変動」
データそのものの分散の程度
(yの分散σyをN倍した値)
「残差変動」
残差の二乗和
回帰式のあてはまりが良いほど,
決定係数R2の値は1に近づく。
30
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
( )
( )
( ) ( )
( )
( )
( )
2 2 2 2
2 1 1 1 1
2 2 2
1 1 1
? ? ?
1
N N N N
i i i i i i
i i i i
N N N
i i i
i i i
y y y y y y y y
R
y y y y y y
= = =
= =
? ? ? ? ?
=? = =
? ? ?
∑ ∑ ∑ ∑
∑ ∑ ∑
「全変動」
「残差変動」 「回帰変動」
「全変動」
ここで,最小二乗法により求めた回帰式を用いる。
2 2
?? ? xy xy
i i i
x x
y ax b x y x
σ σ
σ σ
? ?
= + = + ?? ?
? ?
31
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
( )
( )
2
2
2 2
12 1
2
2
1
?
NN
xy xy
ii
i x xi
N
y
i
i
x y x yy y
R
N
y y
σ σ
σ σ
σ
==
=
? ?? ?? ?
+ ? ?? ?? ??
? ?? ?? ?= =
?
∑∑
∑
( )
( )
22
22
2
2 22
1
2 2 2 2
N xy
xy
x
i
xi xyx
y y x y
Nx x
N N
σσ σ
σ σσ
σ σ σ σ
=
? ?
?? ?
? ?= = =
∑
2
2xy
xy
x y
r
σ
σ σ
? ?
= =? ?? ?
? ?
相関係数の2乗に等しくなる!
32
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
( )
( )
2 2
2 21 1
2 2
1 1
? ?
1
N N
i i i i
i i
xyN N
i i
i i
y y y y
R r
y y y y
= =
= =
? ?
=? = =
? ?
∑ ∑
∑ ∑
33
相関分析/回帰分析での注意点
2020年度 建築計画第二 第9回(沖 拓弥)
? 相関関係と因果関係の混同に気をつける。
? 外れ値の影響に気をつける。
? 相関係数や決定係数は,外れ値の影響を受けやすい。
必ず散布図を描いて確認すること。
? 分割相関の問題
? 擬似相関の問題
2020 9年度 建築計画第二 第 回(沖 拓弥) 34
? 2つの事柄の関連性を調べたい。
? 例1:人口と蔵書数の関係
? 例2:蔵書数と貸出冊数の関係
? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係
? 例4:建物階数と建物高さの関係
? 例5:高齢化率と空き家率の関係
? 例6:写真と実空間での印象評価の関係
? 例7:築年数と建替え割合の関係
? 相互に関連があることをどのように判断すれば良いか?
? 関係の強さをどのように表せば良いか?
背景(再掲)
2020 9年度 建築計画第二 第 回(沖 拓弥) 35
? 2つの事柄の関連性を調べたい。
? 例1:人口と蔵書数の関係
? 例2:蔵書数と貸出冊数の関係
? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係
? 例4:建物階数と建物高さの関係
? 例5:高齢化率と空き家率の関係
? 例6:写真と実空間での印象評価の関係
? 例7:築年数と建替え割合の関係
? 相互に関連があることをどのように判断すれば良いか?
? 関係の強さをどのように表せば良いか?
背景(再掲)
最後に実際の例を
見てみましょう
2020 9年度 建築計画第二 第 回(沖 拓弥) 36
築年数と建替え割合の関係
37
第9回のテーマ
2020年度 建築計画第二 第9回(沖 拓弥)
相関分析 と 回帰分析
相関分析(Correlation analysis)
2種類の変数XY間の因果関係を考えずに,変数
間の関係の強さを測定する方法。
回帰分析(Regression analysis)
2種類の変数XY間の因果関係を仮定し,変数X
が変数Yに与える影響の測定や,予測に用いら
れる方法。

More Related Content

20200605 oki lecture3

  • 1. 2020年度 建築計画第二 (第9回 2020.06.05) 建築?都市における 相関?因果関係の分析手法 1 東京工業大学 環境?社会理工学院 建築学系 沖 拓弥 12020年度 建築計画第二 第9回(沖 拓弥)
  • 2. 2020 9年度 建築計画第二 第 回(沖 拓弥) 2 適宜,質問時間を設けるようにしますが, 授業内容についての質問は,随時,チャット に入力してください。
  • 3. 2020 9年度 建築計画第二 第 回(沖 拓弥) 3 ? 2つの事柄の関連性を調べたい。 ? 例1:人口と蔵書数の関係 ? 例2:蔵書数と貸出冊数の関係 ? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係 ? 例4:建物階数と建物高さの関係 ? 例5:高齢化率と空き家率の関係 ? 例6:写真と実空間での印象評価の関係 ? 例7:築年数と建替え割合の関係 ? 相互に関連があることをどのように判断すれば良いか? ? 関係の強さをどのように表せば良いか? 以上の背景を念頭に置きながら 今回の講義を聞いてください 背景
  • 4. 4 第9回のテーマ 2020年度 建築計画第二 第9回(沖 拓弥) 相関分析 と 回帰分析 相関分析(Correlation analysis) 2種類の変数XY間の因果関係を考えずに,変数 間の関係の強さを測定する方法。 回帰分析(Regression analysis) 2種類の変数XY間の因果関係を仮定し,変数X が変数Yに与える影響の測定や,予測に用いら れる方法。
  • 5. 5 相関分析の例1 2020年度 建築計画第二 第9回(沖 拓弥) 身長と体重の関係 正の相関 http://www.toukei.metro.tokyo.jp/manabou/tyuu/sirou2/tokutyou2/ma1206t24b.htm 散布図を描くことで 視覚的に確認する
  • 6. 6 相関分析の例2 2020年度 建築計画第二 第9回(沖 拓弥) 年間の平均気温と積雪日数の関係 負の相関 https://bellcurve.jp/statistics/course/9589.html
  • 7. 7 相関分析の例3 2020年度 建築計画第二 第9回(沖 拓弥) 道路延長と下水道延長の関係 中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管 路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377 250mメッシュ毎の道路延長と下水道延長の比較
  • 8. 8 回帰分析の例1 2020年度 建築計画第二 第9回(沖 拓弥) 親の身長と子の身長の関係 背の高い親たちの子どもの 平均身長は親たちより低く, 背の低い親たちの子どもの 平均身長は親たちより高くな る傾向がある。 子どもの平均身長は,全体 の子どもの身長に近づく(回 帰する)。 親(原因)の身長から子ども(結果)の身長を予測 ?逆は意味をなさない。よって回帰分析。
  • 9. 9 回帰分析の例2 2020年度 建築計画第二 第9回(沖 拓弥) 建物棟数と下水道延長の関係 中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管 路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377 建物棟数が増えるほど 下水道延長も長くなる。 建物(原因)があることで, 下水道(結果)が整備される。
  • 10. 10 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 2種類の変数XY間の相関関係/因果関係の強さ を表すために,相関係数(Correlation coefficient)と いう指標を用いる。
  • 11. 11 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管 路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377 250mメッシュ毎の道路延長と下水道延長の比較 左図は,計N個のメッシュにお ける道路延長と下水道延長の 関係をプロットした散布図であ るとする。 x: y: 平均値 分散 (xi, yi) ( ) 22 1 1 N x i i x x N σ = = ?∑ 1 1 N i i x x N = = ∑ ※yについても同様。 共分散 ( )( ) 1 1 N xy i i i x x y y N σ = = ? ?∑
  • 12. 12 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管 路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377 250mメッシュ毎の道路延長と下水道延長の比較 このとき,(ピアソンの積率) 相関係数rxyは以下のように 定義される。 x: y: (xi, yi) xy xy x y r σ σ σ = (σxとσy は標準偏差) =分散の平方根 ( )( ) ( ) ( ) 1 2 2 1 1 N i i i N N i i i i x x y y x x y y = = = ? ? = ? ? ∑ ∑ ∑ (-1≦rxy≦1)
  • 13. 13 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 相関係数rと散布図上の点分布の関係 https://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95 %B0#/media/File:Correlation_examples2.svg 無相関 正の相関 負の相関 絶対値が1に近いほど変数xと変数yは直線的な 関係にあり,相関関係/因果関係が強いといえる。
  • 14. 14 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 相関係数rと散布図上の点分布の関係 https://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95 %B0#/media/File:Correlation_examples2.svg
  • 15. 15 相関係数 2020年度 建築計画第二 第9回(沖 拓弥) 2種類の変数XY間の相関関係/因果関係の強さ を表すために,相関係数(Correlation coefficient)と いう指標を用いる。 ( )( ) ( ) ( ) 1 2 2 1 1 N i i xy i xy N N x y i i i i x x y y r x x y y σ σ σ = = = ? ? = = ? ? ∑ ∑ ∑ (-1≦rxy≦1)
  • 16. 16 回帰分析の基本的考え方 2020年度 建築計画第二 第9回(沖 拓弥) 大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難 率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号, p. 2561-2567 都内A?B地区内の町丁目における 木造建物密度と大地震時道路閉塞率 (推定値)の関係 ① 2種類の変数のうち,原因に あたる変数(説明変数)をx軸, 結果にあたる変数(目的変 数)をy軸として,散布図を作 成する。 ② 線形回帰式 y = ax + b の未 知パラメータa(傾き),b(y切 片)を最小二乗法によって求 め,回帰直線を描く。 ③ 決定係数R2を算出する(?相 関係数rxy)。 x: y:
  • 17. 17 回帰分析の基本的考え方 2020年度 建築計画第二 第9回(沖 拓弥) 大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難 率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号, p. 2561-2567 都内A?B地区内の町丁目における 木造建物密度と大地震時道路閉塞率 (推定値)の関係 ① 2種類の変数のうち,原因に あたる変数(説明変数)をx軸, 結果にあたる変数(目的変 数)をy軸として,散布図を作 成する。 ② 線形回帰式 y = ax + b の未 知パラメータa(傾き),b(y切 片)を最小二乗法によって求 め,回帰直線を描く。 ③ 決定係数R2を算出する(?相 関係数rxy)。 x: y:
  • 18. 18 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難 率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号, p. 2561-2567 都内A?B地区内の町丁目における 木造建物密度と大地震時道路閉塞率 (推定値)の関係 x: y: y = ax + b という回帰式のパラ メータa,bを推定することを考える。 (xi, yi) y = ax + b i i iy ax b ε= + + 誤差項 変形すると, ( )i i iy ax bε = ? + すべての点における誤差の2乗 の和(誤差自乗和)が最小にな るときのa,bを採用する。 ( ){ } 22 1 1 N N i i i i i y ax b minimizeε = = = ? + →∑ ∑ εi b xi axi yi 最小二乗法 正のみ
  • 19. 19 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ aとbについてそれぞれ変形すると, ( ) ( ){ } ( ) ( ){ } 22 2 1 22 1 2 2 N i i i i i N i i i i i S x a x y b a y b S b y ax b y ax = = = ? ? + ? = ? ? + ? ∑ ∑ 下に凸 下に凸 S a ?a Smin 0 S a ? = ? 傾き つまり,誤差自乗和Sが最小(Smin)となるのは, 0 S a ? = ? かつ 0 S b ? = ? のとき
  • 20. 20 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ ( ) ( ){ }22 1 2 N i i i i i S b y ax b y ax = = ? ? + ?∑bについて, ( ) 1 2 2 0 N i i i S bN y ax b = ? = ? ? = ? ∑ 1 1 1 1N N i i i i b y a x N N= = = ?∑ ∑ b y ax= ? ???①
  • 21. 21 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ ( ) ( ){ }22 2 1 2 N i i i i i S x a x y b a y b = = ? ? + ?∑aについて, ( )2 1 1 2 2 0 N N i i i i i S a x x y b a= = ? = ? ?= ? ∑ ∑ 2 1 1 1 N N N i i i i i i i a x x y b x = = = = ?∑ ∑ ∑ 前のスライドの式①を代入すると, ( )2 1 1 2 2 1 1 N N i i i i i N N i i i i i a x x y y ax Nx a x Nx x y Nxy = = = = = ? ? ? ? ? = ?? ? ? ? ∑ ∑ ∑ ∑
  • 22. 22 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ (つづき) 2 2 1 1 N N i i i i i a x Nx x y Nxy = = ? ? ? = ?? ? ? ? ∑ ∑ 1 2 2 1 1 1 N i i i N i i x y xy N a x x N = = ? = ? ∑ ∑ 2 2 2 2 2 1 1 1 1 1 1 2 2 N N N i i i i i i x x x x x x x N N N= = = ? ? = ? += ? +? ? ? ? ∑ ∑ ∑ ( ) ( ) 22 2 2 2 1 1 1 1 1 1 1 2 2 N N N N i i i i i i i i i x x x Nx x xx x x x N N N= = = = ? ? = ? + = ? + = ?? ? ? ? ∑ ∑ ∑ ∑ (分母) 2 xσ= xの分散
  • 23. 23 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ (つづき) 2 2 1 1 N N i i i i i a x Nx x y Nxy = = ? ? ? = ?? ? ? ? ∑ ∑ 1 2 2 1 1 1 N i i i N i i x y xy N a x x N = = ? = ? ∑ ∑ 1 1 1 1 1 1 1 1 2 N N N N i i i i i i i i i i x y xy xy x y y x x y xy N N N N= = = = = ? += ? ? +∑ ∑ ∑ ∑(分子) ( ) ( )( ) 1 1 1 1N N i i i i i i i i x y x y xy xy x x y y N N= = ? ? += ? ?∑ ∑ xyσ= xとyの共分散
  • 24. 24 回帰式のパラメータ推定 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ (つづき) 2 2 1 1 N N i i i i i a x Nx x y Nxy = = ? ? ? = ?? ? ? ? ∑ ∑ 1 2 2 2 1 1 1 N i i xyi N x i i x y xy N a x x N σ σ = = ? = = ? ∑ ∑ ???②
  • 25. 25 回帰式のパラメータ推定(まとめ) 2020年度 建築計画第二 第9回(沖 拓弥) 大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難 率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号, p. 2561-2567 都内A?B地区内の町丁目における 木造建物密度と大地震時道路閉塞率 (推定値)の関係 x: y: (xi, yi) y = ax + b i i iy ax b ε= + + 誤差項 εi b xi axi yi 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ 0 S a ? = ? と 0 S b ? = ? を連立させ解くと 2 ? xy x a σ σ = , ? ?b y ax= ? このとき,観測値の各点に最も あてはまりの良い回帰直線を 引くことができている。
  • 26. 26 回帰式のパラメータ推定(まとめ) 2020年度 建築計画第二 第9回(沖 拓弥) 大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難 率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号, p. 2561-2567 都内A?B地区内の町丁目における 木造建物密度と大地震時道路閉塞率 (推定値)の関係 x: y: (xi, yi) i i iy ax b ε= + + 誤差項 xi axi 最小二乗法 ( ){ } 22 1 1 N N i i i i i S y ax b minimizeε = = = = ? + →∑ ∑ 0 S a ? = ? と 0 S b ? = ? を連立させ解くと 2 ? xy x a σ σ = , ? ?b y ax= ? このとき,観測値の各点に最も あてはまりの良い回帰直線を 引くことができている。 残差?ie?iy
  • 27. 27 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法により求めた回帰式のあてはまりの 良さを評価するために,決定係数(Coefficient of Determination)という指標を用いる。 ( ) ( ) 2 2 1 2 1 ? 1 N i i i N i i y y R y y = = ? = ? ? ∑ ∑
  • 28. 28 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法により求めた回帰式のあてはまりの 良さを評価するために,決定係数(Coefficient of Determination)という指標を用いる。 ( ) ( ) 2 2 1 2 1 ? 1 N i i i N i i y y R y y = = ? = ? ? ∑ ∑ x: y: (xi, yi) xi axi 残差?ie?iy yi
  • 29. 29 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法により求めた回帰式のあてはまりの 良さを評価するために,決定係数(Coefficient of Determination)という指標を用いる。 ( ) ( ) 2 2 1 2 1 ? 1 N i i i N i i y y R y y = = ? = ? ? ∑ ∑ x: y: (xi, yi) xi axi 残差?ie?iy yi 「全変動」 データそのものの分散の程度 (yの分散σyをN倍した値) 「残差変動」 残差の二乗和 回帰式のあてはまりが良いほど, 決定係数R2の値は1に近づく。
  • 30. 30 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 1 1 1 1 2 2 2 1 1 1 ? ? ? 1 N N N N i i i i i i i i i i N N N i i i i i i y y y y y y y y R y y y y y y = = = = = ? ? ? ? ? =? = = ? ? ? ∑ ∑ ∑ ∑ ∑ ∑ ∑ 「全変動」 「残差変動」 「回帰変動」 「全変動」 ここで,最小二乗法により求めた回帰式を用いる。 2 2 ?? ? xy xy i i i x x y ax b x y x σ σ σ σ ? ? = + = + ?? ? ? ?
  • 31. 31 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) ( ) ( ) 2 2 2 2 12 1 2 2 1 ? NN xy xy ii i x xi N y i i x y x yy y R N y y σ σ σ σ σ == = ? ?? ?? ? + ? ?? ?? ?? ? ?? ?? ?= = ? ∑∑ ∑ ( ) ( ) 22 22 2 2 22 1 2 2 2 2 N xy xy x i xi xyx y y x y Nx x N N σσ σ σ σσ σ σ σ σ = ? ? ?? ? ? ?= = = ∑ 2 2xy xy x y r σ σ σ ? ? = =? ?? ? ? ? 相関係数の2乗に等しくなる!
  • 32. 32 回帰式のあてはまりの良さの評価 2020年度 建築計画第二 第9回(沖 拓弥) 最小二乗法により求めた回帰式のあてはまりの 良さを評価するために,決定係数(Coefficient of Determination)という指標を用いる。 ( ) ( ) ( ) ( ) 2 2 2 21 1 2 2 1 1 ? ? 1 N N i i i i i i xyN N i i i i y y y y R r y y y y = = = = ? ? =? = = ? ? ∑ ∑ ∑ ∑
  • 33. 33 相関分析/回帰分析での注意点 2020年度 建築計画第二 第9回(沖 拓弥) ? 相関関係と因果関係の混同に気をつける。 ? 外れ値の影響に気をつける。 ? 相関係数や決定係数は,外れ値の影響を受けやすい。 必ず散布図を描いて確認すること。 ? 分割相関の問題 ? 擬似相関の問題
  • 34. 2020 9年度 建築計画第二 第 回(沖 拓弥) 34 ? 2つの事柄の関連性を調べたい。 ? 例1:人口と蔵書数の関係 ? 例2:蔵書数と貸出冊数の関係 ? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係 ? 例4:建物階数と建物高さの関係 ? 例5:高齢化率と空き家率の関係 ? 例6:写真と実空間での印象評価の関係 ? 例7:築年数と建替え割合の関係 ? 相互に関連があることをどのように判断すれば良いか? ? 関係の強さをどのように表せば良いか? 背景(再掲)
  • 35. 2020 9年度 建築計画第二 第 回(沖 拓弥) 35 ? 2つの事柄の関連性を調べたい。 ? 例1:人口と蔵書数の関係 ? 例2:蔵書数と貸出冊数の関係 ? 例3:駅の乗降?乗り換え者数とトイレ利用者数の関係 ? 例4:建物階数と建物高さの関係 ? 例5:高齢化率と空き家率の関係 ? 例6:写真と実空間での印象評価の関係 ? 例7:築年数と建替え割合の関係 ? 相互に関連があることをどのように判断すれば良いか? ? 関係の強さをどのように表せば良いか? 背景(再掲) 最後に実際の例を 見てみましょう
  • 36. 2020 9年度 建築計画第二 第 回(沖 拓弥) 36 築年数と建替え割合の関係
  • 37. 37 第9回のテーマ 2020年度 建築計画第二 第9回(沖 拓弥) 相関分析 と 回帰分析 相関分析(Correlation analysis) 2種類の変数XY間の因果関係を考えずに,変数 間の関係の強さを測定する方法。 回帰分析(Regression analysis) 2種類の変数XY間の因果関係を仮定し,変数X が変数Yに与える影響の測定や,予測に用いら れる方法。