11. 11
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
250mメッシュ毎の道路延長と下水道延長の比較
左図は,計N個のメッシュにお
ける道路延長と下水道延長の
関係をプロットした散布図であ
るとする。
x:
y:
平均値
分散
(xi, yi)
( )
22
1
1 N
x i
i
x x
N
σ
=
= ?∑
1
1 N
i
i
x x
N =
= ∑
※yについても同様。
共分散 ( )( )
1
1 N
xy i i
i
x x y y
N
σ
=
= ? ?∑
12. 12
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
中澤 良太, 山崎 文雄, 被害想定のための道路網データに基づく下水道管
路の分布推定, 日本地震工学会論文集, 2015, 15 巻, 7 号, p. 7_368-7_377
250mメッシュ毎の道路延長と下水道延長の比較 このとき,(ピアソンの積率)
相関係数rxyは以下のように
定義される。
x:
y:
(xi, yi)
xy
xy
x y
r
σ
σ σ
= (σxとσy は標準偏差)
=分散の平方根
( )( )
( ) ( )
1
2 2
1 1
N
i i
i
N N
i i
i i
x x y y
x x y y
=
= =
? ?
=
? ?
∑
∑ ∑
(-1≦rxy≦1)
15. 15
相関係数
2020年度 建築計画第二 第9回(沖 拓弥)
2種類の変数XY間の相関関係/因果関係の強さ
を表すために,相関係数(Correlation coefficient)と
いう指標を用いる。
( )( )
( ) ( )
1
2 2
1 1
N
i i
xy i
xy N N
x y
i i
i i
x x y y
r
x x y y
σ
σ σ
=
= =
? ?
= =
? ?
∑
∑ ∑
(-1≦rxy≦1)
16. 16
回帰分析の基本的考え方
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係 ① 2種類の変数のうち,原因に
あたる変数(説明変数)をx軸,
結果にあたる変数(目的変
数)をy軸として,散布図を作
成する。
② 線形回帰式 y = ax + b の未
知パラメータa(傾き),b(y切
片)を最小二乗法によって求
め,回帰直線を描く。
③ 決定係数R2を算出する(?相
関係数rxy)。
x:
y:
17. 17
回帰分析の基本的考え方
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係 ① 2種類の変数のうち,原因に
あたる変数(説明変数)をx軸,
結果にあたる変数(目的変
数)をy軸として,散布図を作
成する。
② 線形回帰式 y = ax + b の未
知パラメータa(傾き),b(y切
片)を最小二乗法によって求
め,回帰直線を描く。
③ 決定係数R2を算出する(?相
関係数rxy)。
x:
y:
18. 18
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
y = ax + b という回帰式のパラ
メータa,bを推定することを考える。
(xi, yi)
y = ax + b
i i iy ax b ε= + +
誤差項
変形すると,
( )i i iy ax bε = ? +
すべての点における誤差の2乗
の和(誤差自乗和)が最小にな
るときのa,bを採用する。
( ){ }
22
1 1
N N
i i i
i i
y ax b minimizeε
= =
= ? + →∑ ∑
εi
b
xi
axi
yi
最小二乗法
正のみ
19. 19
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
aとbについてそれぞれ変形すると,
( ) ( ){ }
( ) ( ){ }
22 2
1
22
1
2
2
N
i i i i
i
N
i i i i
i
S x a x y b a y b
S b y ax b y ax
=
=
= ? ? + ?
= ? ? + ?
∑
∑
下に凸
下に凸
S
a
?a
Smin
0
S
a
?
=
?
傾き
つまり,誤差自乗和Sが最小(Smin)となるのは,
0
S
a
?
=
?
かつ 0
S
b
?
=
?
のとき
20. 20
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
( ) ( ){ }22
1
2
N
i i i i
i
S b y ax b y ax
=
= ? ? + ?∑bについて,
( )
1
2 2 0
N
i i
i
S
bN y ax
b =
?
= ? ? =
?
∑
1 1
1 1N N
i i
i i
b y a x
N N= =
= ?∑ ∑
b y ax= ? ???①
21. 21
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
( ) ( ){ }22 2
1
2
N
i i i i
i
S x a x y b a y b
=
= ? ? + ?∑aについて,
( )2
1 1
2 2 0
N N
i i i
i i
S
a x x y b
a= =
?
= ? ?=
?
∑ ∑
2
1 1 1
N N N
i i i i
i i i
a x x y b x
= = =
= ?∑ ∑ ∑
前のスライドの式①を代入すると,
( )2
1 1
2 2
1 1
N N
i i i
i i
N N
i i i
i i
a x x y y ax Nx
a x Nx x y Nxy
= =
= =
= ? ?
? ?
? = ?? ?
? ?
∑ ∑
∑ ∑
22. 22
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2 2
1
1
1
N
i i
i
N
i
i
x y xy
N
a
x x
N
=
=
?
=
?
∑
∑
2 2 2 2 2
1 1 1
1 1 1
2 2
N N N
i i i
i i i
x x x x x x x
N N N= = =
? ?
= ? += ? +? ?
? ?
∑ ∑ ∑
( ) ( )
22 2 2 2
1 1 1 1
1 1 1
2 2
N N N N
i i i i i
i i i i
x x x Nx x xx x x x
N N N= = = =
? ?
= ? + = ? + = ?? ?
? ?
∑ ∑ ∑ ∑
(分母)
2
xσ=
xの分散
23. 23
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2 2
1
1
1
N
i i
i
N
i
i
x y xy
N
a
x x
N
=
=
?
=
?
∑
∑
1 1 1 1
1 1 1 1
2
N N N N
i i i i i i
i i i i
x y xy xy x y y x x y xy
N N N N= = = =
= ? += ? ? +∑ ∑ ∑ ∑(分子)
( ) ( )( )
1 1
1 1N N
i i i i i i
i i
x y x y xy xy x x y y
N N=
= ? ? += ? ?∑ ∑ xyσ=
xとyの共分散
24. 24
回帰式のパラメータ推定
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法 ( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
(つづき)
2 2
1 1
N N
i i i
i i
a x Nx x y Nxy
= =
? ?
? = ?? ?
? ?
∑ ∑
1
2
2 2
1
1
1
N
i i
xyi
N
x
i
i
x y xy
N
a
x x
N
σ
σ
=
=
?
= =
?
∑
∑
???②
25. 25
回帰式のパラメータ推定(まとめ)
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
(xi, yi)
y = ax + b
i i iy ax b ε= + + 誤差項
εi
b
xi
axi
yi
最小二乗法
( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
0
S
a
?
=
?
と 0
S
b
?
=
?
を連立させ解くと
2
? xy
x
a
σ
σ
= , ? ?b y ax= ?
このとき,観測値の各点に最も
あてはまりの良い回帰直線を
引くことができている。
26. 26
回帰式のパラメータ推定(まとめ)
2020年度 建築計画第二 第9回(沖 拓弥)
大佛 俊泰, 沖 拓弥, 密集市街地における大地震時の避難困難
率について, 日本建築学会計画系論文集, 2012, 77 巻, 681 号,
p. 2561-2567
都内A?B地区内の町丁目における
木造建物密度と大地震時道路閉塞率
(推定値)の関係
x:
y:
(xi, yi)
i i iy ax b ε= + + 誤差項
xi
axi
最小二乗法
( ){ }
22
1 1
N N
i i i
i i
S y ax b minimizeε
= =
= = ? + →∑ ∑
0
S
a
?
=
?
と 0
S
b
?
=
?
を連立させ解くと
2
? xy
x
a
σ
σ
= , ? ?b y ax= ?
このとき,観測値の各点に最も
あてはまりの良い回帰直線を
引くことができている。
残差?ie?iy
27. 27
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
28. 28
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
x:
y:
(xi, yi)
xi
axi
残差?ie?iy
yi
29. 29
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
2
2 1
2
1
?
1
N
i i
i
N
i
i
y y
R
y y
=
=
?
= ?
?
∑
∑
x:
y:
(xi, yi)
xi
axi
残差?ie?iy
yi
「全変動」
データそのものの分散の程度
(yの分散σyをN倍した値)
「残差変動」
残差の二乗和
回帰式のあてはまりが良いほど,
決定係数R2の値は1に近づく。
30. 30
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
( )
( )
( ) ( )
( )
( )
( )
2 2 2 2
2 1 1 1 1
2 2 2
1 1 1
? ? ?
1
N N N N
i i i i i i
i i i i
N N N
i i i
i i i
y y y y y y y y
R
y y y y y y
= = =
= =
? ? ? ? ?
=? = =
? ? ?
∑ ∑ ∑ ∑
∑ ∑ ∑
「全変動」
「残差変動」 「回帰変動」
「全変動」
ここで,最小二乗法により求めた回帰式を用いる。
2 2
?? ? xy xy
i i i
x x
y ax b x y x
σ σ
σ σ
? ?
= + = + ?? ?
? ?
31. 31
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
( )
( )
2
2
2 2
12 1
2
2
1
?
NN
xy xy
ii
i x xi
N
y
i
i
x y x yy y
R
N
y y
σ σ
σ σ
σ
==
=
? ?? ?? ?
+ ? ?? ?? ??
? ?? ?? ?= =
?
∑∑
∑
( )
( )
22
22
2
2 22
1
2 2 2 2
N xy
xy
x
i
xi xyx
y y x y
Nx x
N N
σσ σ
σ σσ
σ σ σ σ
=
? ?
?? ?
? ?= = =
∑
2
2xy
xy
x y
r
σ
σ σ
? ?
= =? ?? ?
? ?
相関係数の2乗に等しくなる!
32. 32
回帰式のあてはまりの良さの評価
2020年度 建築計画第二 第9回(沖 拓弥)
最小二乗法により求めた回帰式のあてはまりの
良さを評価するために,決定係数(Coefficient of
Determination)という指標を用いる。
( )
( )
( )
( )
2 2
2 21 1
2 2
1 1
? ?
1
N N
i i i i
i i
xyN N
i i
i i
y y y y
R r
y y y y
= =
= =
? ?
=? = =
? ?
∑ ∑
∑ ∑