Estimating Mutual Information for Discrete\Continuous Mixtures x柊?BA詞栽の犹デ鸛燭陵洞Yuya Takashina
?
NIPS猟iみ氏@PFN
Gao, Weihao, et al. "Estimating mutual information for discrete-continuous mixtures." Advances in Neural Information Processing Systems. 2017.
https://arxiv.org/abs/1709.06212
2. 互肝愁除尖胎とは
デ`タ: x = (x1 , . . . xn )
モデル: {p(x, θ)}
容協: e : x ★ θ
容協楚を寔のパラメ`タ (θ? ) のまわりでテイラ`婢_:
e
e(x) = θ? + e (e(x) ? θ? ) + (e(x) ? θ? )2 + , , ,
2
.
互肝愁除尖胎とは
.
n 指裏蛍までの  ̄寄きさ  ̄をuしてそのuの和で恷mな
容協楚の來嵎を{べる尖 (Cram?rCRao など)
. e
2 / 17
3. 容協楚の來嵎
音陶來 [unbaisedness]: E[? ] = u
u
匯崑來 [consistency]: limN ★± u = u
? in probability
A(u) = {x ( S : u (x) = u}e で u と容協されるデ`タ畠悶
?
x の崩枠 η(u) が A(u) に根まれる ?? u consistent
? ?
u が鳳省に卆る栽でも揖:
?
? ?1
η(u) ( AN (u) = uN (u) (N ★ ±)
3 / 17
4. 匯崑容協楚の容協列餓
Qy泣: η = x (N ★ ± で寔のパラメ`タ η(u) にwぶ)
? ?
〔 d
x := N (? ? η(u)) ? N (0, gij ) (CLT)
? x
S の泣 η はどの A(u) かA(u) の嶄でどこにかでQまる:
η = w = (u, v)
η = (? , v ) は (u, 0) に除いのでク饂:
? u ?
〔 〔
u = N (? ? u), v = N v ,
? u ? ? w = (? , v )
? u ?
4 / 17
5. 匯崑容協楚の容協列餓
w = (u, 0) のまわりでテイラ`婢_:
( )
w
? η w2 η
? w3
? 1
η =w+η 〔 +
? + 〔 +O (4.27)
N 2! N 3! N N N2
容協の碧圭 (A(u)) で η の裏蛍の ̄寄きさ ̄が笋錣辰討る
5 / 17
6. 瀰僚貌尖胎
俊腎g Tη(u) は M の圭鬚 A(u) の圭鬚琳浦佑捻蹐擦:
{ } { }
? ?
Tη(u) = span a
span
?u ?v κ
( = Tη(u) M Tη(u) A(u))
楚も M 貧の楚佩双と A(u) 貧の楚佩双に蛍けて深える
┘屮蹈奪佩双:
[ ]
g g
gαβ = eα , eβ = ab aλ
gκb gκλ
? ?
(eα = , eκ = )
?u a ?v κ
6 / 17
7. 侘除貌
テイラ`婢_で侘のまでしか深えないと
w α = B αi xi
? ? (4.33)
{
X ゛ N (0, Σ) ? AX ゛ N (0, AΣA ),
〔 d
x := N (? ? η(u)) ? N (0, gij )
? x
より
w ゛ N (0, g αβ )
?
M に符唹した容協楚 u のu除蛍柊は
?
g ab = (gab ? gaλ g κλ gκb )?1
?
( [ ] [ ])
A B (A ? BC ?1 B )?1 ?
X= ? X ?1 =
B C ? ?
7 / 17
8. A − B ? B ?1 − A?1 より
g ab − g ab
?
吉催は gaλ = 0つまり楚佩双がブロック叔晒されているとき
? M と A(u) が岷住するときに泙衢洞楚のu除蛍柊恷弌
.
協x (嗤人洞楚)
.
u除議に蛍柊の和順を_撹するu除音陶容協楚を匯肝嗤人洞楚
という
.
8 / 17
9. ′4.4 まとめ
.
協尖 (4.3)
.
容協楚 u はその容協何蛍腎g A(u) が泣 η(u) を宥るときこの
?
ときに泙衵志対圓魍屬
.
.
協尖 (4.4)
.
匯崑容協楚 u のu除蛍柊 g ab は
? ?
g ab = (gab ? gaκ g κλ gλb )?1
?
で嚥えられこれは A(u) と M が岷住するときにこのrに泙
匯肝嗤燭任△襭
.
9 / 17
10. 恷喩容協楚の岷Q議┝減倫У庁尖盾
?
恷喩容協楚: θmle := arg max log p(x; θ)
θ
〈
q
KL divergence: D(p||q) := q log dx
p
?
P をデ`タから麻される泣 η P(u) をパラメ`タ u の蛍下とす
?
ると
? 1
D(P||P(u)) = ψ(?) ? log p(x1 , . . . , xN ; u)
η
N
恷喩容協楚はデ`タ P ? から KL divergence の吭龍で恷弌の鉦x
m-y仇にあるモデルのパラメ`タのことである
10 / 17
12. より互肝へ
2 肝のまで匯崑するようにa屎した恷喩容協楚:
1
u? = u +
? ? C (? )
u
2N
バイアスa屎容協楚の蛍柊は
1 ab 1
NE[(? ?a ? u a )(? ?b ? u b )] = g ab +
u u K + O( 2 )
2N N
ただし
(m) (e) (m)
K ab = (ΓM ) + 2(HM ) + (Hλ )
容協のラ採議な楚が及眉でこれより A(u) の m-爆楕が 0
になれば 1/N 2 のオ`ダ`で恷措の容協となるm-y仇は
徭失峠佩な m-峠鵡何蛍謹悶であったから恷喩容協楚は
1/N 2 までみて恷措の容協楚
12 / 17
14. 秤烏楚蛍盾協尖
y = f (?)
x
f が畠g符でないと Fisher 秤鸛燭椀,気なる:
gab (Y ) := E[?a log p(y; u)?b log p(y; u)]
{f ?1 (y)} で蛍護クラスgとクラス坪の蛍柊に蛍盾:
?
gab (X ) = gab (Y ) + E[Cov[?a l(?; u), ?b (?; u)|y]]
x x
及屈を秤鸛p払 ?gab という
14 / 17
15. 匯肝嗤人洞楚の秤鸛p払
x をもとに u を容協することは秤鸛p払^殻
? ?
.
協尖
.
匯肝嗤人洞楚 u の秤鸛p払は
?
( )
(e) 1 (m) 1
?gab = (HM )2 + (Hλ )2 + O
ab ab
. 2 N
N のQyの Fisher 秤鸛 Ngab に曳べて秤鸛p払は O(1)
払われた秤鸛燭呂匹海撲个辰燭里
15 / 17
16. 払われた秤鸛燭緑亰
容協 u はモデル M への亟颪任△襪らデ`タが S の嶄でどの
?
ような了崔にあったのかという秤鵑 ̄払われている ̄
.
協尖 (4.8)
.
±
‘
N ?p+1 (HM ,p )2ab
(e)
Ngab = gab (? ) +
u
p=1
デ`タの秤鸛燭聾澳里 e-爆楕圭鬚亮柘觀屬砲修隆諒に鬉犬
蛍盾できる
.
16 / 17
17. a廁y楚
v の爆楕圭鬚粒彪 rab を岑っていれば
? ?
.
協尖 (4.9)
. ( )
1
NE[(? ? u )(? ? u )] = g
ua a
u b b ab
+r
? ab
+O
N
〔
. rab は 1/ N オ`ダ`の秤鵑鰉襪┐討い
?
rab のように秤鵑鰕aうy楚をa廁y楚という
?
17 / 17