狠狠撸

狠狠撸Share a Scribd company logo
第3章 変分近似法
第 4 回「 統計的潜在意味解析」
読書会
@ksmzn
会場:株式会社 ALBERT 西新宿
July 30, 2015
@ksmzn 第 3 章 変分近似法 July 30, 2015 1 / 43
自己紹介
Koshi @ksmzn
某大学 M2 → 社会人一年目
法 研究
@ksmzn 第 3 章 変分近似法 July 30, 2015 2 / 43
@ksmzn 第 3 章 変分近似法 July 30, 2015 3 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 4 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 5 / 43
Dirichlet分布 期待値導出
log θ 期待値
θ ~ Dir (θ | α) , 関数 Ψ (x) = d log Γ(x)
dx 用
,
Ep
(
θ|α
)[log θk] = Ψ (αk) ? Ψ
?
??????
K∑
k=1
αk
?
??????
LDA 変分 、q (z) 導出 用
@ksmzn 第 3 章 変分近似法 July 30, 2015 6 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 7 / 43
LDA
引用: http:
//ni66ling.hatenadiary.jp/entry/2015/05/04/163958
@ksmzn 第 3 章 変分近似法 July 30, 2015 8 / 43
変分 法 要点
目的
? KL[q (z, θ, ?) || p (z, θ, ? | w, α, β)] 最小
q (z, θ, ?) 求 .
手法
? 対数周辺尤度 log p (w | α, β) 変分下限
F[q (z, θ, ?)] 求 、 最大 q (z, θ, ?)
変分法 求 .
? q (z, θ, ?) 対 因子分解仮定 , q (z), q (θ),
q (?) 順 繰 返 更新 .
@ksmzn 第 3 章 変分近似法 July 30, 2015 9 / 43
変分下限 導出
変分下限 導出
1. 周辺化 確率変数 z, θ, ? 結合分布 積
分形 表示
2. 変分事後分布 分子分母 形 導
入
3. 不等式 下限 求
@ksmzn 第 3 章 変分近似法 July 30, 2015 10 / 43
変分下限 導出
log p (w | α, β) = log
∫ ∑
z
p (w, z, θ, ? | α, β) d?dθ
= log
∫ ∑
z
q (z, θ, ?)
p (w, z, θ, ? | α, β)
q (z, θ, ?)
d?dθ
≥
∫ ∑
z
q (z, θ, ?) log
p (w, z, θ, ? | α, β)
q (z, θ, ?)
d?dθ
≡ F
[
q (z, θ, ?)
]
@ksmzn 第 3 章 変分近似法 July 30, 2015 11 / 43
因子分解仮定
q (z, θ, ?) 対 因子分解仮定 .
q (z, θ, ?) =
?
??????
M∏
d=1
nd∏
i=1
q
(
zd,i
)
?
??????
?
??????
M∏
d=1
q (θd)
?
??????
?
??????
K∏
k=1
q
(
?k
)
?
??????
、結合分布 展開 .
p (w, z, θ, ? | α, β) = p (w | z, ?) p (z | θ) p (? | β) p (θ | α)
=
?
??????
M∏
d=1
nd∏
i=1
p
(
wd,i | ?zd,i
)
p
(
zd,i | θd
)
?
??????
?
??????
K∏
k=1
p
(
?k | β
)
?
??????
?
??????
M∏
d=1
p (θd | α)
?
??????
@ksmzn 第 3 章 変分近似法 July 30, 2015 12 / 43
変分下限 導出
、変分下限 ,
F
[
q (z, θ, ?)
]
=
∫ ∑
z
q (z) q (θ) q (?) log p (w | z, θ) p (z | θ) d?dθ
?
∑
z
q (z) log q (z)
+
∫
q (θ) log
p (θ | α)
q (θ)
dθ
+
∫
q (?) log
p (? | β)
q (?)
d?
@ksmzn 第 3 章 変分近似法 July 30, 2015 13 / 43
変分下限 導出
(続 )
=
∫ M∑
d=1
nd∑
i=1
q
(
zd,i
)
q (θd) q (?) log p
(
wd,i | zd,i, ?
)
p
(
zd,i | θd
)
d?dθ
?
M∑
d=1
nd∑
i=1
K∑
k=1
q
(
zd,i = k
)
log q
(
zd,i = k
)
+
M∑
d=1
?
∫
q (θd) log
p (θd | α)
q (θd)
dθd
+
K∑
k=1
?
∫
q
(
?k
)
log
p
(
?k | β
)
q
(
?k
) d?k
@ksmzn 第 3 章 変分近似法 July 30, 2015 14 / 43
変分下限 最大
変分下限 F
[
q (z, θ, ?)
]
最大 .
→ q (z, θ, ?) 因子分解仮定 置 ,
F z, θ, ? 関 部分 抜 出 ,
最大 q
(
zd,i
)
, q (θd) , q
(
?k
)
求
.
@ksmzn 第 3 章 変分近似法 July 30, 2015 15 / 43
q (θd) 求
変分下限 F , q (θd) 関係 項 抜 出
?F
[
q (θd)
]
,
?F
[
q (θd)
]
=
∫
q (θd)
∑
z
q (z)
nd∑
i=1
log p
(
zd,i | θd
)
dθd
?
∫
q (θd) log
q (θd)
p (θd | α)
dθd
@ksmzn 第 3 章 変分近似法 July 30, 2015 16 / 43
q (θd) 求
最大化 , 変分法 ,
? f
(
θd,q
(
θd
))
?q
(
θd
) = 0
q (θd) 求
? f (θd, q (θd))
?q (θd)
=
∑
z
q (z)
nd∑
i=1
log p
(
zd,i | θd
)
? log
q (θd)
p (θd | α)
? 1
= 0
q (θd) 解 .
@ksmzn 第 3 章 変分近似法 July 30, 2015 17 / 43
q (θd) 求
q (θd) ∝ p (θd | α) exp
?
???????
∑
z
q (z)
nd∑
i=1
log p
(
zd,i | θd
)
?
???????
∝
K∏
k=1
θαk?1
d,k exp
?
???????
∑
z
q (z)
nd∑
i=1
K∑
k=1
δ
(
zd,i = k
)
log θd,k
?
???????
= exp
?
??????
K∑
k=1
(αk ? 1) log θd,k
?
?????? exp
?
??????
K∑
k=1
nd∑
i=1
q
(
zd,i = k
)
log θd,k
?
??????
= exp
?
??????
K∑
k=1
(αk ? 1) log θd,k
?
?????? exp
?
??????
K∑
k=1
Eq(zd)
[
nd,k
]
log θd,k
?
??????
= exp
?
??????
K∑
k=1
(
Eq(zd)
[
nd,k
]
+ αk ? 1
)
log θd,k
?
??????
=
K∏
k=1
θ
Eq(zd)[nd,k]+αk?1
d,k
@ksmzn 第 3 章 変分近似法 July 30, 2015 18 / 43
q (θd) 求
ξθ
d,k = Eq(zd)
[
nd,k
]
+ αk,
ξθ
d
=
(
ξθ
d,1, ξθ
d,2, · · · , ξθ
d,K
)
, q (θd) ξθ
d
Dirichlet 分布 q
(
θd | ξθ
d
)
, 正規化項 計算 ,
q
(
θd | ξθ
d
)
=
Γ
(∑K
k=1 ξθ
d,k
)
∏K
k=1 Γ
(
ξθ
d,k
)
K∏
k=1
θ
ξθ
d,k
?1
d,k
.
@ksmzn 第 3 章 変分近似法 July 30, 2015 19 / 43
q
(
?k
)
求
同様 ,
ξ?
k,v = Eq(z)
[
nk,v
]
+ βv,
ξ
?
k
=
(
ξ?
k,1, ξ?
k,2, · · · , ξ?
k,v
)
, q
(
?k
)
ξ
?
k
Dirichlet 分布 q
(
?k | ξ
?
k
)
, 正規化項 計算 ,
q
(
?k | ξ
?
k
)
=
Γ
(∑V
v=1 ξ?
k,v
)
∏V
v=1 Γ
(
ξ?
k,v
)
V∏
v=1
?
ξ
?
k,v
?1
k,v
.
@ksmzn 第 3 章 変分近似法 July 30, 2015 20 / 43
q
(
zd,i
)
求
最後 , q
(
zd,i
)
,
q
(
zd,i = k
)
∝
exp
[
Ψ
(
ξ?
k,wd,i
)]
exp
[
Ψ
(∑V
v′=1 ξ?
k,v′
)]
exp
[
Ψ
(
ξθ
d,k
)]
exp
[
Ψ
(∑K
k′=1 ξθ
d,k′
)]
.
@ksmzn 第 3 章 変分近似法 July 30, 2015 21 / 43
TIPS
1. 後, 全 k, d, i 評価 行
2. α, β 推定 関 , 3.6 節
参照
3. 因子分解仮定 誤差 大
( )
→周辺化変分 法!!
@ksmzn 第 3 章 変分近似法 July 30, 2015 22 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 23 / 43
共役性 利用 場合
? 近似事後分布 対 何 分布 条件 置
→多項分布 Dirichlet 分布 共役性
? 近似事後分布 形 仮定 , 推
定 方法
? LDA 共役性 用 ,
必要
@ksmzn 第 3 章 変分近似法 July 30, 2015 24 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 25 / 43
? 点推定
? 原論文 , ? 点推定 行
? 変分下限 ? 関 部分 抜 出 ,
q
(
?k,v
)
?k,v 微分 求 .
@ksmzn 第 3 章 変分近似法 July 30, 2015 26 / 43
目次
1 3.3.4 LDA 変分 法 (準備)
2 3.3.5 LDA 変分 法 (1)
3 3.3.6 LDA 変分 法 (2)
4 3.3.7 LDA 変分 法 (3)
5 3.3.8 LDA 周辺化変分 法
6 References
@ksmzn 第 3 章 変分近似法 July 30, 2015 27 / 43
周辺化変分 法 (CVB)
周辺化変分 法
Collapsed Variational Bayes (CVB)
周辺化 同様 , θd ?k 周
辺化(積分消去) , 近似事後分布 q (z) 求 .
q (z) 因子分解仮定 .
q (z) =
M∏
d=1
nd∏
i=1
q
(
zd,i
)
θ, ? z 依存関係 保持 学習
@ksmzn 第 3 章 変分近似法 July 30, 2015 28 / 43
CVB 変分下限 導出
基本的 変分 法 同様
1. 周辺化 確率変数 z 結合分布 積分形
表示
2. 変分事後分布 分子分母 形 導
入
3. 不等式 下限 求
log p (w | α, β) = log
∑
z
p (w, z | α, β) = log
∑
z
q (z)
p (w, z | α, β)
q (z)
≥
∑
z
q (z) log
p (w, z | α, β)
q (z)
≡ FCVB
[
q (z)
]
@ksmzn 第 3 章 変分近似法 July 30, 2015 29 / 43
VB 変分下限 CVB 変分下限
変分 法 (VB) 変分下限 CVB 変分下限 次
関係 成 立 .
F
[
q (z, θ, θ)
]
≤ FCVB
[
q (z)
]
CVB , VB 既 大 変分下限 最大化
, 効率的 .
→学習 必要 反復回数 少 済 !
@ksmzn 第 3 章 変分近似法 July 30, 2015 30 / 43
変分下限 最大化
周辺化変分 法 , 以下 最適化問題 解
q?
(z) = argmax
q(z)
FCVB
[
q (z)
]
@ksmzn 第 3 章 変分近似法 July 30, 2015 31 / 43
変分下限 最大化
VB 同様 ,
FCVB
[
q (z)
]
=
∑
z
q (z) log
p (w, z | α, β)
q (z)
=
∑
z
q
(
zd,i
)
q
(
zd,i
)
log
p
(
wd,i, zd,i | wd,i
, zd,i
, α, β
)
p
(
wd,i
, zd,i
| α, β
)
q
(
zd,i
)
q
(
zd,i
)
, q
(
zd,i
)
関係 項 抜 出
?FCVB
[
q
(
zd,i
)]
=
∑
z
q
(
zd,i
)
q
(
zd,i
)
log
p
(
wd,i, zd,i | wd,i
, zd,i
, α, β
)
q
(
zd,i
)
@ksmzn 第 3 章 変分近似法 July 30, 2015 32 / 43
CVB 用 統計量
(P55)
nd,k
nd,k =
∑nd
i=1 δ
(
zd,i = k
)
文書 d k 現 回数
nk,v
nk,v =
∑M
d=1
∑nd
i=1 δ
(
wd,i = v, zd,i = k
)
全文書 , k 単語 v 対 推定
回数
@ksmzn 第 3 章 変分近似法 July 30, 2015 33 / 43
CVB 用 統計量
p
(
wd,i = v, zd,i = k | wd,i
, zd,i
, α, β
)
= p
(
wd,i = v | zd,i = k, wd,i
, zd,i
, β
)
p
(
zd,i = k | zd,i
, α
)
=
nd,i
k,v + βv
nd,i
k,. + β.
×
nd,i
d,k + αk
nd,i
d,. + α.
(Dirichlet 分布 期待値計算 , 式 (2.10)
参照)
@ksmzn 第 3 章 変分近似法 July 30, 2015 34 / 43
q
(
zd,i = k
)
求
変分下限 ?FCVB
[
q
(
zd,i
)]
, q
(
zd,i = k
)
微分 0
, q
(
zd,i = k
)
解 ,
q
(
zd,i = k
)
∝ exp
?
???????
∑
z
q
(
zd,i
)
log p
(
wd,i, zd,i | wd,i
, zd,i
, α, β
)
?
???????
= exp Eq(zd,i
)
[
log p
(
wd,i, zd,i | wd,i
, zd,i
, α, β
)]
∝ exp Eq(zd,i
)
?
???????log
nd,i
k,v + βv
nd,i
k,. + β.
(
nd,i
d,k + αk
)
?
???????
=
exp Eq(zd,i
)
[
log nd,i
k,v + βv
]
exp Eq(zd,i
)
[∑V
v′=1 log nd,i
k,v′ + β′
v
]exp Eq(zd,i
)
[
log
(
nd,i
d,k + αk
)]
@ksmzn 第 3 章 変分近似法 July 30, 2015 35 / 43
展開 近似
前 式 期待値部分 解析的 計算 ,
展開 近似 行 .
展開
対数関数 a 周 2 次 展開 ,
log x ≈ log a +
1
a
(x ? a) ?
1
2a2
(x ? a)2
@ksmzn 第 3 章 変分近似法 July 30, 2015 36 / 43
展開 近似
a = E [x] ,
E
[
log x
]
≈ log E [x] +
V [x]
2E [x]2
, nd,i
d,k + αk 周 展開 近似
,
E
[
log
(
nd,i
d,k + αk
)]
≈ log
(
E
[
nd,i
d,k
]
+ αk
)
?
V
[
nd,i
d,k
]
2
(
E
[
nd,i
d,k
]
+ αk
)2
@ksmzn 第 3 章 変分近似法 July 30, 2015 37 / 43
展開 近似
,
E
[
nd,i
d,k
]
=
∑
i′ i
q
(
zd,i′ = k
)
V
[
nd,i
d,k
]
=
∑
i′ i
q
(
zd,i′ = k
) (
1 ? q
(
zd,i′ = k
))
E
[
nd,i
k,v
]
=
M∑
d=1
∑
i′
q
(
zd,i′ = k
)
I
(
wd,i′ = k
)
E
[
nd,i
k,.
]
=
V∑
v=1
E
[
nd,i
k,v
]
V
[
nd,i
k,v
]
=
M∑
d=1
∑
i′
q
(
zd,i′ = k
) (
1 ? q
(
zd,i′ = k
))
I
(
wd,i′ = k
)2
V
[
nd,i
k,.
]
=
V∑
v=1
V
[
nd,i
k,v
]
用 ,
@ksmzn 第 3 章 変分近似法 July 30, 2015 38 / 43
展開 近似
近似 ,
q
(
zd,i = k
)
∝
E
[
nd,i
k,v
]
+ βv
∑V
v′=1 E
[
nd,i
k,v′
]
+ β′
v
E
[
nd,i
d,k
]
+ αk
× exp
?
?????????
?
V
[
nd,i
k,v
]
2
(
E
[
nd,i
k,v
]
+ βv
)2
?
V
[
nd,i
d,k
]
2
(
E
[
nd,i
d,k
]
+ αk
)2
?
?????????
× exp
?
?????????
V
[
nd,i
k,.
]
2
(∑V
v=1 E
[
nd,i
k,v′
]
+ βv′
)2
?
?????????
@ksmzn 第 3 章 変分近似法 July 30, 2015 39 / 43
CVB0
? LDA , 2 次近似 ,
0 次近似 方 予測性能 良 知
(CVB0).
q
(
zd,i = k
)
∝
E
[
nd,i
k,v
]
+ βv
∑V
v′=1 E
[
nd,i
k,v′
]
+ β′
v
E
[
nd,i
d,k
]
+ αk
? 以外 (計算 等) 同等 , LDA 2
次近似 使 理由 ( ?)
? 詳細 , 著者 佐藤先生 論文 .
@ksmzn 第 3 章 変分近似法 July 30, 2015 40 / 43
1. LDA 変分 法 適用
2. LDA 周辺化変分 法 適用
3. 0 次近似 (CVB0) 方 2 次近似 汎化能力
高
@ksmzn 第 3 章 変分近似法 July 30, 2015 41 / 43
References
[1] 佐藤一誠 (2015) 『 統計的潜
在意味解析』 (自然言語処理 ) 社
[2] 岩田具治 (2015) 『 』(機械学習
),
[3] CVB0 ! - Bag of ML Words
http://dr-kayai.hatenablog.com/entry/
2013/12/22/003011
@ksmzn 第 3 章 変分近似法 July 30, 2015 42 / 43
清聴 .
@ksmzn 第 3 章 変分近似法 July 30, 2015 43 / 43

More Related Content

第3章 変分近似法 LDAにおける変分ベイズ法?周辺化変分ベイズ法

  • 1. 第3章 変分近似法 第 4 回「 統計的潜在意味解析」 読書会 @ksmzn 会場:株式会社 ALBERT 西新宿 July 30, 2015 @ksmzn 第 3 章 変分近似法 July 30, 2015 1 / 43
  • 2. 自己紹介 Koshi @ksmzn 某大学 M2 → 社会人一年目 法 研究 @ksmzn 第 3 章 変分近似法 July 30, 2015 2 / 43
  • 3. @ksmzn 第 3 章 変分近似法 July 30, 2015 3 / 43
  • 4. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 4 / 43
  • 5. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 5 / 43
  • 6. Dirichlet分布 期待値導出 log θ 期待値 θ ~ Dir (θ | α) , 関数 Ψ (x) = d log Γ(x) dx 用 , Ep ( θ|α )[log θk] = Ψ (αk) ? Ψ ? ?????? K∑ k=1 αk ? ?????? LDA 変分 、q (z) 導出 用 @ksmzn 第 3 章 変分近似法 July 30, 2015 6 / 43
  • 7. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 7 / 43
  • 9. 変分 法 要点 目的 ? KL[q (z, θ, ?) || p (z, θ, ? | w, α, β)] 最小 q (z, θ, ?) 求 . 手法 ? 対数周辺尤度 log p (w | α, β) 変分下限 F[q (z, θ, ?)] 求 、 最大 q (z, θ, ?) 変分法 求 . ? q (z, θ, ?) 対 因子分解仮定 , q (z), q (θ), q (?) 順 繰 返 更新 . @ksmzn 第 3 章 変分近似法 July 30, 2015 9 / 43
  • 10. 変分下限 導出 変分下限 導出 1. 周辺化 確率変数 z, θ, ? 結合分布 積 分形 表示 2. 変分事後分布 分子分母 形 導 入 3. 不等式 下限 求 @ksmzn 第 3 章 変分近似法 July 30, 2015 10 / 43
  • 11. 変分下限 導出 log p (w | α, β) = log ∫ ∑ z p (w, z, θ, ? | α, β) d?dθ = log ∫ ∑ z q (z, θ, ?) p (w, z, θ, ? | α, β) q (z, θ, ?) d?dθ ≥ ∫ ∑ z q (z, θ, ?) log p (w, z, θ, ? | α, β) q (z, θ, ?) d?dθ ≡ F [ q (z, θ, ?) ] @ksmzn 第 3 章 変分近似法 July 30, 2015 11 / 43
  • 12. 因子分解仮定 q (z, θ, ?) 対 因子分解仮定 . q (z, θ, ?) = ? ?????? M∏ d=1 nd∏ i=1 q ( zd,i ) ? ?????? ? ?????? M∏ d=1 q (θd) ? ?????? ? ?????? K∏ k=1 q ( ?k ) ? ?????? 、結合分布 展開 . p (w, z, θ, ? | α, β) = p (w | z, ?) p (z | θ) p (? | β) p (θ | α) = ? ?????? M∏ d=1 nd∏ i=1 p ( wd,i | ?zd,i ) p ( zd,i | θd ) ? ?????? ? ?????? K∏ k=1 p ( ?k | β ) ? ?????? ? ?????? M∏ d=1 p (θd | α) ? ?????? @ksmzn 第 3 章 変分近似法 July 30, 2015 12 / 43
  • 13. 変分下限 導出 、変分下限 , F [ q (z, θ, ?) ] = ∫ ∑ z q (z) q (θ) q (?) log p (w | z, θ) p (z | θ) d?dθ ? ∑ z q (z) log q (z) + ∫ q (θ) log p (θ | α) q (θ) dθ + ∫ q (?) log p (? | β) q (?) d? @ksmzn 第 3 章 変分近似法 July 30, 2015 13 / 43
  • 14. 変分下限 導出 (続 ) = ∫ M∑ d=1 nd∑ i=1 q ( zd,i ) q (θd) q (?) log p ( wd,i | zd,i, ? ) p ( zd,i | θd ) d?dθ ? M∑ d=1 nd∑ i=1 K∑ k=1 q ( zd,i = k ) log q ( zd,i = k ) + M∑ d=1 ? ∫ q (θd) log p (θd | α) q (θd) dθd + K∑ k=1 ? ∫ q ( ?k ) log p ( ?k | β ) q ( ?k ) d?k @ksmzn 第 3 章 変分近似法 July 30, 2015 14 / 43
  • 15. 変分下限 最大 変分下限 F [ q (z, θ, ?) ] 最大 . → q (z, θ, ?) 因子分解仮定 置 , F z, θ, ? 関 部分 抜 出 , 最大 q ( zd,i ) , q (θd) , q ( ?k ) 求 . @ksmzn 第 3 章 変分近似法 July 30, 2015 15 / 43
  • 16. q (θd) 求 変分下限 F , q (θd) 関係 項 抜 出 ?F [ q (θd) ] , ?F [ q (θd) ] = ∫ q (θd) ∑ z q (z) nd∑ i=1 log p ( zd,i | θd ) dθd ? ∫ q (θd) log q (θd) p (θd | α) dθd @ksmzn 第 3 章 変分近似法 July 30, 2015 16 / 43
  • 17. q (θd) 求 最大化 , 変分法 , ? f ( θd,q ( θd )) ?q ( θd ) = 0 q (θd) 求 ? f (θd, q (θd)) ?q (θd) = ∑ z q (z) nd∑ i=1 log p ( zd,i | θd ) ? log q (θd) p (θd | α) ? 1 = 0 q (θd) 解 . @ksmzn 第 3 章 変分近似法 July 30, 2015 17 / 43
  • 18. q (θd) 求 q (θd) ∝ p (θd | α) exp ? ??????? ∑ z q (z) nd∑ i=1 log p ( zd,i | θd ) ? ??????? ∝ K∏ k=1 θαk?1 d,k exp ? ??????? ∑ z q (z) nd∑ i=1 K∑ k=1 δ ( zd,i = k ) log θd,k ? ??????? = exp ? ?????? K∑ k=1 (αk ? 1) log θd,k ? ?????? exp ? ?????? K∑ k=1 nd∑ i=1 q ( zd,i = k ) log θd,k ? ?????? = exp ? ?????? K∑ k=1 (αk ? 1) log θd,k ? ?????? exp ? ?????? K∑ k=1 Eq(zd) [ nd,k ] log θd,k ? ?????? = exp ? ?????? K∑ k=1 ( Eq(zd) [ nd,k ] + αk ? 1 ) log θd,k ? ?????? = K∏ k=1 θ Eq(zd)[nd,k]+αk?1 d,k @ksmzn 第 3 章 変分近似法 July 30, 2015 18 / 43
  • 19. q (θd) 求 ξθ d,k = Eq(zd) [ nd,k ] + αk, ξθ d = ( ξθ d,1, ξθ d,2, · · · , ξθ d,K ) , q (θd) ξθ d Dirichlet 分布 q ( θd | ξθ d ) , 正規化項 計算 , q ( θd | ξθ d ) = Γ (∑K k=1 ξθ d,k ) ∏K k=1 Γ ( ξθ d,k ) K∏ k=1 θ ξθ d,k ?1 d,k . @ksmzn 第 3 章 変分近似法 July 30, 2015 19 / 43
  • 20. q ( ?k ) 求 同様 , ξ? k,v = Eq(z) [ nk,v ] + βv, ξ ? k = ( ξ? k,1, ξ? k,2, · · · , ξ? k,v ) , q ( ?k ) ξ ? k Dirichlet 分布 q ( ?k | ξ ? k ) , 正規化項 計算 , q ( ?k | ξ ? k ) = Γ (∑V v=1 ξ? k,v ) ∏V v=1 Γ ( ξ? k,v ) V∏ v=1 ? ξ ? k,v ?1 k,v . @ksmzn 第 3 章 変分近似法 July 30, 2015 20 / 43
  • 21. q ( zd,i ) 求 最後 , q ( zd,i ) , q ( zd,i = k ) ∝ exp [ Ψ ( ξ? k,wd,i )] exp [ Ψ (∑V v′=1 ξ? k,v′ )] exp [ Ψ ( ξθ d,k )] exp [ Ψ (∑K k′=1 ξθ d,k′ )] . @ksmzn 第 3 章 変分近似法 July 30, 2015 21 / 43
  • 22. TIPS 1. 後, 全 k, d, i 評価 行 2. α, β 推定 関 , 3.6 節 参照 3. 因子分解仮定 誤差 大 ( ) →周辺化変分 法!! @ksmzn 第 3 章 変分近似法 July 30, 2015 22 / 43
  • 23. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 23 / 43
  • 24. 共役性 利用 場合 ? 近似事後分布 対 何 分布 条件 置 →多項分布 Dirichlet 分布 共役性 ? 近似事後分布 形 仮定 , 推 定 方法 ? LDA 共役性 用 , 必要 @ksmzn 第 3 章 変分近似法 July 30, 2015 24 / 43
  • 25. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 25 / 43
  • 26. ? 点推定 ? 原論文 , ? 点推定 行 ? 変分下限 ? 関 部分 抜 出 , q ( ?k,v ) ?k,v 微分 求 . @ksmzn 第 3 章 変分近似法 July 30, 2015 26 / 43
  • 27. 目次 1 3.3.4 LDA 変分 法 (準備) 2 3.3.5 LDA 変分 法 (1) 3 3.3.6 LDA 変分 法 (2) 4 3.3.7 LDA 変分 法 (3) 5 3.3.8 LDA 周辺化変分 法 6 References @ksmzn 第 3 章 変分近似法 July 30, 2015 27 / 43
  • 28. 周辺化変分 法 (CVB) 周辺化変分 法 Collapsed Variational Bayes (CVB) 周辺化 同様 , θd ?k 周 辺化(積分消去) , 近似事後分布 q (z) 求 . q (z) 因子分解仮定 . q (z) = M∏ d=1 nd∏ i=1 q ( zd,i ) θ, ? z 依存関係 保持 学習 @ksmzn 第 3 章 変分近似法 July 30, 2015 28 / 43
  • 29. CVB 変分下限 導出 基本的 変分 法 同様 1. 周辺化 確率変数 z 結合分布 積分形 表示 2. 変分事後分布 分子分母 形 導 入 3. 不等式 下限 求 log p (w | α, β) = log ∑ z p (w, z | α, β) = log ∑ z q (z) p (w, z | α, β) q (z) ≥ ∑ z q (z) log p (w, z | α, β) q (z) ≡ FCVB [ q (z) ] @ksmzn 第 3 章 変分近似法 July 30, 2015 29 / 43
  • 30. VB 変分下限 CVB 変分下限 変分 法 (VB) 変分下限 CVB 変分下限 次 関係 成 立 . F [ q (z, θ, θ) ] ≤ FCVB [ q (z) ] CVB , VB 既 大 変分下限 最大化 , 効率的 . →学習 必要 反復回数 少 済 ! @ksmzn 第 3 章 変分近似法 July 30, 2015 30 / 43
  • 31. 変分下限 最大化 周辺化変分 法 , 以下 最適化問題 解 q? (z) = argmax q(z) FCVB [ q (z) ] @ksmzn 第 3 章 変分近似法 July 30, 2015 31 / 43
  • 32. 変分下限 最大化 VB 同様 , FCVB [ q (z) ] = ∑ z q (z) log p (w, z | α, β) q (z) = ∑ z q ( zd,i ) q ( zd,i ) log p ( wd,i, zd,i | wd,i , zd,i , α, β ) p ( wd,i , zd,i | α, β ) q ( zd,i ) q ( zd,i ) , q ( zd,i ) 関係 項 抜 出 ?FCVB [ q ( zd,i )] = ∑ z q ( zd,i ) q ( zd,i ) log p ( wd,i, zd,i | wd,i , zd,i , α, β ) q ( zd,i ) @ksmzn 第 3 章 変分近似法 July 30, 2015 32 / 43
  • 33. CVB 用 統計量 (P55) nd,k nd,k = ∑nd i=1 δ ( zd,i = k ) 文書 d k 現 回数 nk,v nk,v = ∑M d=1 ∑nd i=1 δ ( wd,i = v, zd,i = k ) 全文書 , k 単語 v 対 推定 回数 @ksmzn 第 3 章 変分近似法 July 30, 2015 33 / 43
  • 34. CVB 用 統計量 p ( wd,i = v, zd,i = k | wd,i , zd,i , α, β ) = p ( wd,i = v | zd,i = k, wd,i , zd,i , β ) p ( zd,i = k | zd,i , α ) = nd,i k,v + βv nd,i k,. + β. × nd,i d,k + αk nd,i d,. + α. (Dirichlet 分布 期待値計算 , 式 (2.10) 参照) @ksmzn 第 3 章 変分近似法 July 30, 2015 34 / 43
  • 35. q ( zd,i = k ) 求 変分下限 ?FCVB [ q ( zd,i )] , q ( zd,i = k ) 微分 0 , q ( zd,i = k ) 解 , q ( zd,i = k ) ∝ exp ? ??????? ∑ z q ( zd,i ) log p ( wd,i, zd,i | wd,i , zd,i , α, β ) ? ??????? = exp Eq(zd,i ) [ log p ( wd,i, zd,i | wd,i , zd,i , α, β )] ∝ exp Eq(zd,i ) ? ???????log nd,i k,v + βv nd,i k,. + β. ( nd,i d,k + αk ) ? ??????? = exp Eq(zd,i ) [ log nd,i k,v + βv ] exp Eq(zd,i ) [∑V v′=1 log nd,i k,v′ + β′ v ]exp Eq(zd,i ) [ log ( nd,i d,k + αk )] @ksmzn 第 3 章 変分近似法 July 30, 2015 35 / 43
  • 36. 展開 近似 前 式 期待値部分 解析的 計算 , 展開 近似 行 . 展開 対数関数 a 周 2 次 展開 , log x ≈ log a + 1 a (x ? a) ? 1 2a2 (x ? a)2 @ksmzn 第 3 章 変分近似法 July 30, 2015 36 / 43
  • 37. 展開 近似 a = E [x] , E [ log x ] ≈ log E [x] + V [x] 2E [x]2 , nd,i d,k + αk 周 展開 近似 , E [ log ( nd,i d,k + αk )] ≈ log ( E [ nd,i d,k ] + αk ) ? V [ nd,i d,k ] 2 ( E [ nd,i d,k ] + αk )2 @ksmzn 第 3 章 変分近似法 July 30, 2015 37 / 43
  • 38. 展開 近似 , E [ nd,i d,k ] = ∑ i′ i q ( zd,i′ = k ) V [ nd,i d,k ] = ∑ i′ i q ( zd,i′ = k ) ( 1 ? q ( zd,i′ = k )) E [ nd,i k,v ] = M∑ d=1 ∑ i′ q ( zd,i′ = k ) I ( wd,i′ = k ) E [ nd,i k,. ] = V∑ v=1 E [ nd,i k,v ] V [ nd,i k,v ] = M∑ d=1 ∑ i′ q ( zd,i′ = k ) ( 1 ? q ( zd,i′ = k )) I ( wd,i′ = k )2 V [ nd,i k,. ] = V∑ v=1 V [ nd,i k,v ] 用 , @ksmzn 第 3 章 変分近似法 July 30, 2015 38 / 43
  • 39. 展開 近似 近似 , q ( zd,i = k ) ∝ E [ nd,i k,v ] + βv ∑V v′=1 E [ nd,i k,v′ ] + β′ v E [ nd,i d,k ] + αk × exp ? ????????? ? V [ nd,i k,v ] 2 ( E [ nd,i k,v ] + βv )2 ? V [ nd,i d,k ] 2 ( E [ nd,i d,k ] + αk )2 ? ????????? × exp ? ????????? V [ nd,i k,. ] 2 (∑V v=1 E [ nd,i k,v′ ] + βv′ )2 ? ????????? @ksmzn 第 3 章 変分近似法 July 30, 2015 39 / 43
  • 40. CVB0 ? LDA , 2 次近似 , 0 次近似 方 予測性能 良 知 (CVB0). q ( zd,i = k ) ∝ E [ nd,i k,v ] + βv ∑V v′=1 E [ nd,i k,v′ ] + β′ v E [ nd,i d,k ] + αk ? 以外 (計算 等) 同等 , LDA 2 次近似 使 理由 ( ?) ? 詳細 , 著者 佐藤先生 論文 . @ksmzn 第 3 章 変分近似法 July 30, 2015 40 / 43
  • 41. 1. LDA 変分 法 適用 2. LDA 周辺化変分 法 適用 3. 0 次近似 (CVB0) 方 2 次近似 汎化能力 高 @ksmzn 第 3 章 変分近似法 July 30, 2015 41 / 43
  • 42. References [1] 佐藤一誠 (2015) 『 統計的潜 在意味解析』 (自然言語処理 ) 社 [2] 岩田具治 (2015) 『 』(機械学習 ), [3] CVB0 ! - Bag of ML Words http://dr-kayai.hatenablog.com/entry/ 2013/12/22/003011 @ksmzn 第 3 章 変分近似法 July 30, 2015 42 / 43
  • 43. 清聴 . @ksmzn 第 3 章 変分近似法 July 30, 2015 43 / 43