1. NIPS2017読み会@PFN
論文紹介
A Unified Approach to Interpreting Model Predictions
Scott M. Lundberg
Su?In Lee
発表者:井口亮
資料中の数式及び図表は,以下のURLの内容から引用しています.
https://arxiv.org/abs/1705.07874
https://github.com/slundberg/shap
4. Additive feature attribution methods
g(z ) = ? + ? z
z ∈ {0, 1} .M は単純化された入力の特徴の数.? ∈ R.
既存の手法はこの形で統一的にみることができる
LIME (Ribeiro et al. 2016), DeepLIFT (Shrikumar et al. 2016), Layer?wise
relevance propagation (Bach et al. 2015)
Shapley regression values (Lipovetsky et al. 2001), Shapley sampling
values (?trumbelj et al. 2011), Quantitative input influence (Datta et al.
2016)
′
0
i=1
∑
M
i i
′
′ M
5. LIME
LIMEは,g(z ) = w ? z を使うので,加法的特徴配分手法と言える
x = h (x ) は,2値ベクトルを元の入力空間に写像
例えば,画像の場合,h は画像のスーパーピクセルとして扱う.x = 1 のと
きは元の入力値としてをとり,x = 0 のときは近接ピクセルの平均をとる
?を決めるべく、以下の目的関数を最小化する
′
g
′
x
′
x i
′
i
′
6. LIME
L = π (z)(f(z) ? g(z))
π (z) = exp(?D(x, z) /σ )
Ω(g) = ∞1[∥w ∥ > K]
https://arxiv.org/abs/1602.04938
∑z,z ∈Z′ x
2
x
2 2
g 0
11. SHAP value
SHAP value は,Shapley valueの式において,
f (z ) = f(h (z )) = E[f(z)∣z ] としたもの
Sは、z の非ゼロ成分のインデックス集合.
暗黙的に,h (z ) = z としている
モデルが非線形であったり,特徴間が独立でないときは、順序が問題となる
ため,すべての順序について,平均をとることで,?を求める
x
′
x
′
S
′
x
′
S