狠狠撸

狠狠撸Share a Scribd company logo
データ解析のための 
統計モデリング入門 
11章後半 
@yamakatu 
2014/10/21 
#みどりぼん 
11th
ざっくり前半の話 
? 場所差が独立に決まる(10章)のでなく、空間相関があ 
る場合のGLMMを考える 
? 空間相関:「近くは似てて、遠くは似てない」とか(今 
回は一次元) 
? 場所差を表すパラメータrj 
の階層事前分布(正規分布) 
のパラメータ平均μを、両隣のrj 
の平均値とすることで、 
相互作用を表現 
? このような自己回帰する事前分布をCARモデルと呼ぶ 
? 今回はその中でも色々制約ついたintrinsic 
gaussian 
CARモ 
デル 
? そんな感じの階層ベイズモデルをつくってみたら上手く 
いった
11.4 
空間統計モデルが作り出す 
確率場 
? 相互作用する確率変数で埋め尽くされた空間を確率場 
(random 
field)と呼ぶ 
? 本章前半で利用したrjも確率場の一種 
? rj 
の階層事前分布(正規分布)のパラメータ平均μjは 
μ j = 
rj?1 + rj+1 
2 
なので相互作用している 
? rj 
の階層事前分布は正規分布なので、確率場の中でもガ 
ウス確率場と呼ばれる
確率場{rj}に対するsの影響を見て 
みる 
? 11章前半で定義 
? ポアソン分布+対数リンク関数 
? λj 
= 
exp(β 
+ 
rj) 
? rjの階層事前分布は正規分布で 
? 平均 
? 標準偏差 
μ j = 
rj?1 + rj+1 
2 
? パラメータはβとsの二つ 
? パラメータβを固定(β 
= 
2.27)してみる 
? ここでsを{0.0316, 
0.224, 
10.0}と変えてみる 
s = 
s 
nj
sが小さい程、rjは 
両隣と似ている値 
になる 
s 
= 
0.0316 
s 
= 
0.224 
s 
= 
10.0 
sが大きい程、rjは 
両隣の値と関係な 
い値をとる
つまり 
? この確率場は少数の大域的パラメータ(今回はsのみ)に 
コントロールされていると言える。
11.5 
空間相関モデルと欠測のあ 
る観測データ 
? 空間相関を組み込んだ階層ベイズモデルの強み 
? パラメータの推定がより正確になる(前半の話) 
? 欠測のあるデータに対してより良い予測が得られることが 
ある(←イマココ)
欠測しちゃった 
? 上:前半で利用した観測 
値 
? 下:上の観測値から意図 
的にいくつかを欠測させ 
た(黒点が欠測値)
vs. 
欠測データ 
? このような欠測があるデータに対する、あてはまりの良 
さを、 
? 空間相関モデル 
? 空間相関を無視した階層ベイズモデル 
? で比較するお
結果 
? 左:空間相関を考慮しているモデル(空間相関モデル) 
? 右:空間相関を考慮していないモデル 
? 空間相関を考慮したモデルの方がより欠測データが正し 
く予測できている 
? 予測区間の狭さ 
? 局所密度のなめらかさ
空間相関モデルの場合 
? パラメータrjの階層事前分布(正規分布)で、隣同士のrj 
の値を利用している 
? 結果、欠測がない場合とかなり近い分布になった 
? 左:欠測データなし(P.250 
図11.4) 
? 右:欠測データあり
空間相関を考慮しないモデルの場 
合 
? (10章と同じく)パラメータrj 
の階層事前分布(正規分 
布)は平均0、標準偏差sの正規分布 
? ?手がかりがない 
? その結果、 
? yiに合わせようとするので、局所密度はギザギザになる 
? 予測区間の範囲が広くなってしまう 
さーせん。この表現は 
イマイチ良くわかんなかった
11.6 
まとめ 
? 前半 
? 空間構造のあるデータをモデル化する場合、空間相関を考 
慮する 
? 空間相関のある場所差を生成するには 
intrincsic 
gaussian 
CAR 
モデルを使う 
? 後半 
? 空間相関のある場所差は確率場を使って表現できる 
? 空間相関を考慮した階層ベイズモデルは、観測データの欠 
測部分を予測するような用途にも使える。

More Related Content

#みと?りほ?ん 11章「空間構造のある階層ベイズモデル」後半