狠狠撸

狠狠撸Share a Scribd company logo
Variational Inference
swear013@gmail.com
norman3.github.io
Information
? ????? ????.
? ??? ??(distribution)? ? ? ??? ??? ??? ???
?? ?.
? ?? ?? ??? ???? ??? ?? ??? ??.
? ?? ???? ???? ?? ? ???? ???? ??.
? Variational ?? ?? ???? ?? ???? ??? ????
???.
Basic Theory
Probability
? “???? ? ?? ?? ??? 1/6 ??”
? ??? ????? ??
? “??? ???? 10?? ??? ?? ? ?? ?? ??? ?? 1/6 ?? ?? ???
XX?.”
? ??? ????? ??
? “?? ??? ??? ??? 0.000000000000000001 ??”
? ??? ???? ?? ??? ?? ?? ??
? “???? ??? ??? ??? ??? ??? ??? ?? ??? ??? ??? ??.”
? ??? ?? ??
?(?)
Probability (Cont’d)
? ?? ??? ?? ??? ???? ?????
? ????? ?? ?? ?? ?? ??? ??? ?? ??? ??? ? ??
? ??.
? ??? ???. <= ? ??? ???? ??.
? ?? ??? ???? ?? ?? ?? ??.
? ?? ??? ??? ??? “??” ? ?? ??
? ?? ?? ?? ?? (??? ???)
? http://cs229.stanford.edu/section/cs229-prob.pdf
?(?)
Probability (Cont’d)
? ?? ?? (Probability function ??)
? ?? ??? ???? ?? ?? ?? ??.
? ?? ?? ??? ?? ??.
? ?? 1??? (PMF) ??? 1 (PDF).
? ?? ?? ?? 0?? ?? ??.
? ?? ? ???? ??? ??? ?? ??? ???
?.
? PMF? PDF? ??? ?? ??? ??.
? ?? ≥ 0 ?
?
? ?? =1
R.V
PMF
? ?? ≥ 0
?∞
∞
? ?? = 1
PDF
?? ??? (2?? ?? ?? ??)
? ?,? ?, ? ? ?,? ?, ? = ? ?(?)? ?(?)
? R.V. ? ??? ??
? ?,? ? | ?
???? x? y ? ?? ???? ??
y ? ????? ? ??? ? ??.
? ?|? =
? ? ? ?(?)
?(?)
? ? = 3|? ? ? = 3|? = 0
? ? = 3|? = 1?? ?|? = 1
??? ?? ??
? ?|?
? ?|? = 1.1
? ? = 1|? = 1.1
Probability Distribution with Parameter
? ??(distribution)? ?? ?? ?? ??? ?? ???? ??
?? ??.
? ?? ???? ????? ?? ?? ??? ????? ?????
??.
? ????(parameter)? ?? ?? ???? ?? ????? ?? ?
?? ??,
?? ?? ??? ??? ?? ?? ? ??. (???? ????)
? Ex) ????, ?????, ????, ????, ????, ?????? ??
?(?; ?)
?? ????
????? ????
?? ????
????
MLE (Maximum Likelihood Estimation)
? = ? ?; ?
[??]
?? ???? ?? ????? ????.
????? ?? ??? ??
?? ??? likelihood ?? ??? ???.
? ?; ?
? ?? ?; ? ??
?? ?? p(x)??? ??? ??????,
? ??? ???? ??? L ??? ????.
??
? ?; ? = ?????? ? ?(?; ?)
??? ???? ? ??
? Frequentist
? ?? : ??? ???? ??
? ????? ?? ???? ??? ?
?
? (unknown but fixed)
? ?? ??? ?? ?? ??? ??
? ??.
? Bayesian
? ?? : ??? ??
? ????? ?? ??? ? ? ??.
? ??? ???? ?? ??? ???
??.
? ? = ?????? ? ?(?; ?) ? ? = ?????? ? ?(?|?)
?? ??
Expectation
? ?? ?? ?? ???(??)?? ???? ??? ??. (? ?
[?])
? ??? ?? ??? ?? ??? ?? ???.
? ?? ????? ???? ??? ????? ????? ??.
? ?? ??? ???? ?????
? ? [?] = ?? ? ?? , ? ? [?] = ? ? ? ? ??
Expectation (Cont’d)
Information
? Shannon ??? ??? ????.
? ???? ????? ?? “??”? ??? ???.
? ?? ???? ???? ??? ?? ??? ?? ???? ????. ?? ?? ?? ?? ?..
? ?? ??? ?? ?? ??? ???? ????? ?.
? ??? ?? ???? ?? ???? ???? ??? ???.
? ??? ??? ???? ??? ??? ? ?? ?? ??? ??.
? ?? ?? ??? ???? ?? ??? ??? ??? ???? ???, ??? ??? ?? ???? ?? ?? ?
? ??? ??.
? ??? ??? ?? ? ? ??? ?? ??? ??? ?? ?? ???? ??.
? ? = ? log ?(?)
Information (Cont’d)
? ?? 1?? ?? ??? (?? 6?)
? ?? 5?? ?? ??? (?? 3?)
? ??? ??? 1? ?? ??? ?? ???
? ? = ? log2
1
8,145,060
? 23
? ? = ? log2
1
45
? 5.5
? ? = ? log2
1
6
? 2.6
Entropy
? Entropy??
? ??? ?(system)? ??? ?? ???.
? ??? ????? ? ?? ??. ????? ? ?? ?? ???…
? ???? ?? ?? ???? “? vs ?” ??? ??? ?? ? ??.
? ??? ??? ?? ?? ??? ??? ??.
? Entropy ? ? ???? ??? 2? ??? ???? ??,
? ??? ???? ???? ?? ??? bit ? ??? ??? ???? ? ??.
? ??? ?? ???? ??. ?? ??? ?? ?.
? ? = ?
?
? ? log2 ?(?)
E ? = ? ? ? ? ??
E ? = ? ? ?(?)
Entropy (Cont’d)
KL-divergence
? ???? ??? ??? ???? ?? ??? ??. (?? ????
? ??)
? ??
? P ?? ?? ??? ?? ??? ????,
? Q ?? ?? ???? ???? ???? ??
? ?? ?? ???? ?? ???? KL-divergence ??? ??… ?? ??
?.
? (????)
KL-divergence (Cont’d)
KL-divergence (Cont’d)
? ? ?? ?? ??? ?? ?? ????? ???? ?? 0?? ?
? ???
? ?? ??? ??? ?? ??? ??? ??? ??
???? ??? ??? ?? ?? ?? ?? ???.
? ?? ??? ?? ?? ??? ?? ???? ???
? ??? ????? ?? ??? (?? ??) ???
? ?? ??.
KL-divergence (Cont’d)
Asymmetric
KL-divergence (Cont’d)
? ?? ??? ???
? ??? ??? ?? P ? ??? ???? ??? P ??? ??? ?????,
? ?? Q?? ?? ??? ???? ?? ?? P ?? ? ??? ??.
? ?? ?? ???? ?? ???? ???? KL ?? ???? ?? ??? ???.
? ?? ?? Q1, Q2 ? ???? ?? KL? P? ?? ???? Q1? ? ??.
? ??? Q1 ? Q2 ?? P? ? ??? ????? ??? ? ??.
? ??? ?? ?????
? ?? ???. ? ?? ??? ??? ??? ????? ???? ??? ??.
? ??? ??? ? ? ??? ????? ?????.
? P ?? ???? ?? ??? ??? ??? ? ???? KL ?? ????.
EM (Expectation-
Maximization)
?????? ?? EM ????? ???? ??.
Mixture Distribution
? ???? ?? ??? ???? ?? ?? ???? ???? ??? ??
? ????.
? ?? ?? ???? ??(distribution)?? ?? ????.
? ????, ????, ??? ??, ????-t ??, ?? ??, ?? ?? ??
? ???? ????? ??? ???? ???? ??? ????? ??
??.
? ??? ???? ?? ?? ??? ??? ???? ?? ??? ????.
? ? ? ?? ??? ??? GMM (Gaussian Mixture Model) ? ????.
? ?? ?? (latent variable)? ???? ??? ??? ???? ??.
K-means ????
? EM ? K-means ????? ?? ??? ??.
? ??? ???? K ?? ???? ??????? ????.
? ?? ??? ??? ???? ?? ??? ????? ???? ???? ?.
? ?? ?? K ?? ???(central point)? ????,
? ?? ???? ??? ?? ??? ???? ???? ????.
? ?? ?? ?? ??? ??? ??.
? =
?=1
?
?=1
?
??? ? ? ? ? ?
2 ??? = 1, ?? ? = ?????? ? ? ? ? ? ?
2
0, ?????????
Binary indicator variables
K-means ????
? MLE? ????.
??? = 1, ?? ? = ?????? ? ? ? ? ? ?
2
0, ?????????
? ? ?? ????? ?? ???? ??.
? ???? ??? ??.
? ?? ????? ???? ??? ??
? ????? ?????? ??
? GD? ????.
K-means ? ??? ?? EM
? r? u ? ??? ??? ?? 2 ???
??
? ?? u? ??? ??? ???
? u? ??? ???? J? ????? r?
??.
? r? ??? ???? u? ??
? ??? ??? ??? ? 2??? ??
? ?? ??? K=2 ? ?? ?? ??
? ?? ?? ??? r? ??? ???.
GMM (Gaussian Mixture Model)
? ??? K-means ? ? ? ?? ???? ??? ??? ?????.
? ?? ?? p(x)? ??? ??? ??? ???? ???? ????
? ?? ?? ?? ???? ??? ?? ???? ???? ????.
? K-means? ??? ?? ??? ???? ??? ???? ??? ?? ??? ??? ??? ?.
? ?; ? =
?=1
?
? ? ?(?|? ?, Σ ?)
GMM (Gaussian Mixture Model)
(Cont’d)
GMM with latent variable
? ?? ?? z ? ???? GMM ? ????.
Responsibility
MLE for GMM
? ??? ??? ??? ???? ?? ?? ????.
GMM ? EM ????.
? ??? ?? : ? ???? ??? ??, ???? pi ?? ???? ??? ??.
? E ?? : ??? ???? ?? ???? r ? ???.
? M ?? : ??? r ?? ???? ??? ????? ???.
? ?? ????.
EM ? ?? ? ?? ???.
? ?? ???? ??? ???? ??? ??.
? ?? ?? ?? z ? ???? ???? ??? ?? ? ??.
? z ? ?? ?? ??? ?? ??. ?? ???? ??? ??? ??
??.
? ?? ??? EM ? ???? ??.
? SGD ? ?? ?? z ? ???? ?? ?? ??? ????? ?.
? ???? ?? ??? ??? ? ???? ?? ???? ????.
? ??? ??? ? ?? ??? ? ????.
Expectation of log likelihood.
? ????? ? ??? ??? MLE ??? ??? ? ??.
? ?? ??? ??? ?? ????? ???? MLE? ??.
? ??? ??? ?? ?? ??? ???? “????”? “Z”? ???.
(?????)
General EM Algorithm
EM ? ??? ? ?? ????
? ??? ?????? EM ??? ??.
? ?? ?? ?? z ? ??? ? ?? ????? ??.
? ?? ?? z ?? ??? ?? ??? ???? ???,
? z ? ???? ?? ?? ??? ??? ???? ??? ? ??.
? ?, ?? ??? ??? ? Z ? ???? ?? ??? ? ?? ??? ??? ?
???? ???? ??? ???? ??. (GMM??)
EM ???? ??.
? ??? EM ????? ?? ??? ??? ????? ??.
? MLE ??? ? ???? ??? ? ???? ?? EM ???? ??
? ? ??.
? ??? ??? ?? ?? ?? ?? ?? ???!!! ??? ??
??.
? ?? z ? ???? ??? ? ? ?? ??? ??.
? ??? ??? z ? ? ??? ??.
? ??? ??? z? ???? ??? ?? ???? ??? ?????
EM ???? ??. (Cont’d)
? EM ? ???? Z? ?? ???? MLE? ??? ??.
? p(x) ? ???? ?? ??? ???? ?? ??? ???. (incomplete-data)
? p(x, z) ? MLE? ?? ?? ? ?? ??. (complete-data)
? Z ? ?? ????(?, PMF)? ?? ??? ??.
? ?? ?? ?? (PDF)? ???? ?? ???? ??? ??? ???? ???.
? ?? ?? p(z|x) ? ??? ?? ??? ???.
? ??? ??? ??? ????? ???? ??? ??. (E-Step??)
? ??? ?? ??????? -> VI
General EM Algorithm
q(z)? ??
? ?? VI ?? ???? ?? ???? q(z)? ????.
? ??? ?? ?? ???? ?? ??? z ? ??? ?? ?? ?? ?? q() ?.
? ?? z? ??? ?? ?? ?? q(z)? ????? ? ? ?? ?? ??? ?? ?? ?
???.
Variational Inference
log ? ?; ?
? ? ≡ ?(?|?)?(?, ?)
??(?||?)
EM for VI
? L? ?????. (??? q ? ?
??)
? ??? ? ? ???? ?? ??.
? KL ? ?? ?????.
? ? ?? ? ?? ???? ?? ?
??.
? ??? ??? ? ? ??? ?? ?
?.
??
? ??? ???? ??? ?? ????? ????.
? Jensen’s Inequality (?? ???) – ?? f ? convex ? ?? ???
??.
? Gibb’s Inequality (?? ???) – p ? q ? ?? ?? ??? ???
?.
?? (Cont’d)
Decomposition of ?(?)
? ? = ? ? ?? ??(?||?) = 0 ? ??.
? ? ? ? ??? ?? ?? ??.
??(?||?)? ????? ?? ? ? ? ? ? ???
?? ??? ??? ??.
E-Step
? ???? ? ? ???? ???? ?? ? ? ???
? ??(?||?) = 0 ??? ???? ????.
? ??? ? ? ???? Bound ?? ? ? ???.
M-Step
? ?? ? ? ??? ???? ???? ? ? ???
? ?? MLE ? ???? ??? ? ? ?? ??.
? ?? ??? ? ? ?? Bound ?? ? ? ???.
Overview for EM
? ? ??? EM? ?? ?? ???? ????.
? ?? ??? ???? ? ??? ??? EM ????? ???
? ?? ???? ?? ??? ??? ??? ??? ? ??? ??? ??.
? ? ? ? ??? ? ??? ? ?? concave ????? ?? ?? ??? ??. (??
?)
? ? ??? E-Step?? ?????.
? ??? ? ??? ????? ??? ???? ?? ???? ??.
? ?? ????? ? ??? ??.
? ?? ???? ??? ? ??? ??. (???)
? ? ??? M-Step ????.
? ?? ??? ??? ??? ???? ??.
VI (Variational Inference)
?? ?? ?????.
??? (Variational Method)
? ???? ???? ?????? ?? ???? ??
? ?? ??? ??? ???? ??? ???? ???,
? ??? ???? ?? ??? ??? ? ??. : ?? ?? ???(functional).
? ???? ??? ???? ??.
? ???? ???? ??? ?? ?? ? ??? ???? ???? ??.
? ??? ??? ?? ??? ???.
? ??? VI ??? ?? ??? ??? ??? ???? ??? ??? ????? ?.
? ???? ?? ????
? ????(quadratic) or ?? ??? ??? ?? ?? or ?? ??
VI ??? ??
? VI ? ??? ?? ?? ????? ?? ??? ???? ??.
? ?, Full Bayesian ??? ??.
? ??? ??? ?? ????? ?? Z ? ????.
? ??? ???? ?? ???? ?? latent variable ? ????.
? ?? ?? latent variable ? ??? ??(continuous random variable)? ?
???.
? ?? ?? ???? ??? ???? ???? ??? ???? ???? ??.
? ??
? ?? ?(?) ? ?? ?? ?(?|?) ? ?? ??? ?? ??? ?? ?.
???? ???? ??.
? ? ?? ?? ???? ?????? ?? ?? ??? ?????.
? ?? ??? ?? ?? ????? ?? ??? ???? Full ???? ??
? ??
? ???? ?? ??? ??? ??
? ??? ?? ??? ?? ???? ???? ???? ??.
???? ???? ??. (Cont’d)
? ?? Z ? ?? ???? ??(family) ? ??? ??.
? KL? ????? ?? ???? ?? ??
? ?? ?? ???
? ????? ???? ?? ?? : ?(?; ?)
? ?? ?? ??.
? Factorized distributions
Factorized distributions
? [??] ??? ? ? ??? ??? ? ??? ???? ? ??.
? ?, ??? ? ? ?? ?????? ??? ? ? ??.
? ?? ?? ??? ?(?) ? ????? ? ? ???.
? ??? ??? ??? ?? (mean-field theory) ??? ??.
??? ??
? ??? ??????? ??? ?? ?????? ?? ?? ?? ? ??.
? (self-consistent field theory)??? ?. (? ???)
? ??? ????? ?? ???(many-body) ???
??? ??? ????(one-body)? ?? ??? ???? ??
? ??? ??? ?? ????? ???? ???? ????, ?? ?? ???
? ???? ?
Factorized distributions (Cont’d)
Ad

Recommended

Chapter 19 Variational Inference
Chapter 19 Variational Inference
KyeongUkJang
?
Variational Autoencoder? ?? ?? ???? ???? (Understanding Variational Autoencod...
Variational Autoencoder? ?? ?? ???? ???? (Understanding Variational Autoencod...
Haezoom Inc.
?
PRML Chapter 8
PRML Chapter 8
Sunwoo Kim
?
Chapter11.2
Chapter11.2
Takuya Minagawa
?
笔搁惭尝学习者から入る深层生成モデル入门
笔搁惭尝学习者から入る深层生成モデル入门
tmtm otm
?
笔搁惭尝轮読#1
笔搁惭尝轮読#1
matsuolab
?
自动微分変分ベイズ法の绍介
自动微分変分ベイズ法の绍介
Taku Yoshioka
?
2 3.GLMの基礎
2 3.GLMの基礎
logics-of-blue
?
PRML 4.4-4.5.2 ラプラス近似
PRML 4.4-4.5.2 ラプラス近似
KokiTakamiya
?
笔搁惭尝第9章「混合モデルと贰惭」
笔搁惭尝第9章「混合モデルと贰惭」
Keisuke Sugawara
?
笔搁惭尝轮読#10
笔搁惭尝轮読#10
matsuolab
?
数式を使わずイメージで理解する贰惭アルゴリズム
数式を使わずイメージで理解する贰惭アルゴリズム
裕樹 奥田
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
Wasserstein GAN ?? ???? I
Wasserstein GAN ?? ???? I
Sungbin Lim
?
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
Takashi J OZAKI
?
阶层モデルの分散パラメータの事前分布について
阶层モデルの分散パラメータの事前分布について
hoxo_m
?
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
Deep Learning JP
?
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
Akihiro Nitta
?
Flow based generative models
Flow based generative models
?? ?
?
笔搁惭尝轮読#2
笔搁惭尝轮読#2
matsuolab
?
PRML Chapter 10
PRML Chapter 10
Sunwoo Kim
?
深層学習 勉強会第5回 ボルツマンマシン
深層学習 勉強会第5回 ボルツマンマシン
Yuta Sugii
?
A Brief Survey of Schr?dinger Bridge (Part I)
A Brief Survey of Schr?dinger Bridge (Part I)
Morpho, Inc.
?
ロジスティック回帰分析の入门 -予测モデル构筑-
ロジスティック回帰分析の入门 -予测モデル构筑-
Koichiro Gibo
?
3分でわかる多项分布とディリクレ分布
3分でわかる多项分布とディリクレ分布
Junya Saito
?
[DL輪読会]Control as Inferenceと発展
[DL輪読会]Control as Inferenceと発展
Deep Learning JP
?
Crash Course on Graphical models
Crash Course on Graphical models
Jong Wook Kim
?
3 sat with randomization
3 sat with randomization
Changki Yun
?

More Related Content

What's hot (20)

2 3.GLMの基礎
2 3.GLMの基礎
logics-of-blue
?
PRML 4.4-4.5.2 ラプラス近似
PRML 4.4-4.5.2 ラプラス近似
KokiTakamiya
?
笔搁惭尝第9章「混合モデルと贰惭」
笔搁惭尝第9章「混合モデルと贰惭」
Keisuke Sugawara
?
笔搁惭尝轮読#10
笔搁惭尝轮読#10
matsuolab
?
数式を使わずイメージで理解する贰惭アルゴリズム
数式を使わずイメージで理解する贰惭アルゴリズム
裕樹 奥田
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
Wasserstein GAN ?? ???? I
Wasserstein GAN ?? ???? I
Sungbin Lim
?
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
Takashi J OZAKI
?
阶层モデルの分散パラメータの事前分布について
阶层モデルの分散パラメータの事前分布について
hoxo_m
?
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
Deep Learning JP
?
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
Akihiro Nitta
?
Flow based generative models
Flow based generative models
?? ?
?
笔搁惭尝轮読#2
笔搁惭尝轮読#2
matsuolab
?
PRML Chapter 10
PRML Chapter 10
Sunwoo Kim
?
深層学習 勉強会第5回 ボルツマンマシン
深層学習 勉強会第5回 ボルツマンマシン
Yuta Sugii
?
A Brief Survey of Schr?dinger Bridge (Part I)
A Brief Survey of Schr?dinger Bridge (Part I)
Morpho, Inc.
?
ロジスティック回帰分析の入门 -予测モデル构筑-
ロジスティック回帰分析の入门 -予测モデル构筑-
Koichiro Gibo
?
3分でわかる多项分布とディリクレ分布
3分でわかる多项分布とディリクレ分布
Junya Saito
?
[DL輪読会]Control as Inferenceと発展
[DL輪読会]Control as Inferenceと発展
Deep Learning JP
?
PRML 4.4-4.5.2 ラプラス近似
PRML 4.4-4.5.2 ラプラス近似
KokiTakamiya
?
笔搁惭尝第9章「混合モデルと贰惭」
笔搁惭尝第9章「混合モデルと贰惭」
Keisuke Sugawara
?
笔搁惭尝轮読#10
笔搁惭尝轮読#10
matsuolab
?
数式を使わずイメージで理解する贰惭アルゴリズム
数式を使わずイメージで理解する贰惭アルゴリズム
裕樹 奥田
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
Wasserstein GAN ?? ???? I
Wasserstein GAN ?? ???? I
Sungbin Lim
?
Granger因果による 時系列データの因果推定(因果フェス2015)
Granger因果による 時系列データの因果推定(因果フェス2015)
Takashi J OZAKI
?
阶层モデルの分散パラメータの事前分布について
阶层モデルの分散パラメータの事前分布について
hoxo_m
?
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
摆顿尝轮読会闭近年のエネルギーベースモデルの进展
Deep Learning JP
?
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
PRML 12-12.1.4 主成分分析 (PCA) / Principal Component Analysis (PCA)
Akihiro Nitta
?
Flow based generative models
Flow based generative models
?? ?
?
笔搁惭尝轮読#2
笔搁惭尝轮読#2
matsuolab
?
深層学習 勉強会第5回 ボルツマンマシン
深層学習 勉強会第5回 ボルツマンマシン
Yuta Sugii
?
A Brief Survey of Schr?dinger Bridge (Part I)
A Brief Survey of Schr?dinger Bridge (Part I)
Morpho, Inc.
?
ロジスティック回帰分析の入门 -予测モデル构筑-
ロジスティック回帰分析の入门 -予测モデル构筑-
Koichiro Gibo
?
3分でわかる多项分布とディリクレ分布
3分でわかる多项分布とディリクレ分布
Junya Saito
?
[DL輪読会]Control as Inferenceと発展
[DL輪読会]Control as Inferenceと発展
Deep Learning JP
?

Similar to Variational inference intro. (korean ver.) (20)

Crash Course on Graphical models
Crash Course on Graphical models
Jong Wook Kim
?
3 sat with randomization
3 sat with randomization
Changki Yun
?
Coursera Machine Learning (by Andrew Ng)_????
Coursera Machine Learning (by Andrew Ng)_????
SANG WON PARK
?
Deep Learning from scratch 5? : backpropagation
Deep Learning from scratch 5? : backpropagation
JinSooKim80
?
??? ???? ???? ????
??? ???? ???? ????
?? ?
?
[?????? ????] 7. ??? ??? 2
[?????? ????] 7. ??? ??? 2
jdo
?
The fastalgorithmfordeepbeliefnets
The fastalgorithmfordeepbeliefnets
Lee Gyeong Hoon
?
Probability with MLE, MAP
Probability with MLE, MAP
Junho Lee
?
Control as Inference.pptx
Control as Inference.pptx
ssuserbd1647
?
???? Variational autoencoder
???? Variational autoencoder
?? ?
?
ESM Mid term Review
ESM Mid term Review
Mario Cho
?
Data Visualization and t-SNE
Data Visualization and t-SNE
Hyeongmin Lee
?
??'s ????, Mixture model and EM algorithm
??'s ????, Mixture model and EM algorithm
Jungkyu Lee
?
Lecture 2: Supervised Learning
Lecture 2: Supervised Learning
Sang Jun Lee
?
???? ??
???? ??
deepseaswjh
?
Gaussian Mixture Model
Gaussian Mixture Model
KyeongUkJang
?
[??] Tutorial: Sparse variational dropout
[??] Tutorial: Sparse variational dropout
Wuhyun Rico Shin
?
03. linear regression
03. linear regression
Jeonghun Yoon
?
Deep Learning from scratch 4? : neural network learning
Deep Learning from scratch 4? : neural network learning
JinSooKim80
?
Vector Optimization
Vector Optimization
SEMINARGROOT
?
Crash Course on Graphical models
Crash Course on Graphical models
Jong Wook Kim
?
3 sat with randomization
3 sat with randomization
Changki Yun
?
Coursera Machine Learning (by Andrew Ng)_????
Coursera Machine Learning (by Andrew Ng)_????
SANG WON PARK
?
Deep Learning from scratch 5? : backpropagation
Deep Learning from scratch 5? : backpropagation
JinSooKim80
?
??? ???? ???? ????
??? ???? ???? ????
?? ?
?
[?????? ????] 7. ??? ??? 2
[?????? ????] 7. ??? ??? 2
jdo
?
The fastalgorithmfordeepbeliefnets
The fastalgorithmfordeepbeliefnets
Lee Gyeong Hoon
?
Probability with MLE, MAP
Probability with MLE, MAP
Junho Lee
?
Control as Inference.pptx
Control as Inference.pptx
ssuserbd1647
?
???? Variational autoencoder
???? Variational autoencoder
?? ?
?
ESM Mid term Review
ESM Mid term Review
Mario Cho
?
Data Visualization and t-SNE
Data Visualization and t-SNE
Hyeongmin Lee
?
??'s ????, Mixture model and EM algorithm
??'s ????, Mixture model and EM algorithm
Jungkyu Lee
?
Lecture 2: Supervised Learning
Lecture 2: Supervised Learning
Sang Jun Lee
?
Gaussian Mixture Model
Gaussian Mixture Model
KyeongUkJang
?
[??] Tutorial: Sparse variational dropout
[??] Tutorial: Sparse variational dropout
Wuhyun Rico Shin
?
Deep Learning from scratch 4? : neural network learning
Deep Learning from scratch 4? : neural network learning
JinSooKim80
?
Ad

Variational inference intro. (korean ver.)

  • 2. Information ? ????? ????. ? ??? ??(distribution)? ? ? ??? ??? ??? ??? ?? ?. ? ?? ?? ??? ???? ??? ?? ??? ??. ? ?? ???? ???? ?? ? ???? ???? ??. ? Variational ?? ?? ???? ?? ???? ??? ???? ???.
  • 4. Probability ? “???? ? ?? ?? ??? 1/6 ??” ? ??? ????? ?? ? “??? ???? 10?? ??? ?? ? ?? ?? ??? ?? 1/6 ?? ?? ??? XX?.” ? ??? ????? ?? ? “?? ??? ??? ??? 0.000000000000000001 ??” ? ??? ???? ?? ??? ?? ?? ?? ? “???? ??? ??? ??? ??? ??? ??? ?? ??? ??? ??? ??.” ? ??? ?? ?? ?(?)
  • 5. Probability (Cont’d) ? ?? ??? ?? ??? ???? ????? ? ????? ?? ?? ?? ?? ??? ??? ?? ??? ??? ? ?? ? ??. ? ??? ???. <= ? ??? ???? ??. ? ?? ??? ???? ?? ?? ?? ??. ? ?? ??? ??? ??? “??” ? ?? ?? ? ?? ?? ?? ?? (??? ???) ? http://cs229.stanford.edu/section/cs229-prob.pdf ?(?)
  • 6. Probability (Cont’d) ? ?? ?? (Probability function ??) ? ?? ??? ???? ?? ?? ?? ??. ? ?? ?? ??? ?? ??. ? ?? 1??? (PMF) ??? 1 (PDF). ? ?? ?? ?? 0?? ?? ??. ? ?? ? ???? ??? ??? ?? ??? ??? ?. ? PMF? PDF? ??? ?? ??? ??. ? ?? ≥ 0 ? ? ? ?? =1 R.V PMF ? ?? ≥ 0 ?∞ ∞ ? ?? = 1 PDF
  • 7. ?? ??? (2?? ?? ?? ??) ? ?,? ?, ? ? ?,? ?, ? = ? ?(?)? ?(?) ? R.V. ? ??? ?? ? ?,? ? | ? ???? x? y ? ?? ???? ?? y ? ????? ? ??? ? ??. ? ?|? = ? ? ? ?(?) ?(?) ? ? = 3|? ? ? = 3|? = 0 ? ? = 3|? = 1?? ?|? = 1
  • 8. ??? ?? ?? ? ?|? ? ?|? = 1.1 ? ? = 1|? = 1.1
  • 9. Probability Distribution with Parameter ? ??(distribution)? ?? ?? ?? ??? ?? ???? ?? ?? ??. ? ?? ???? ????? ?? ?? ??? ????? ????? ??. ? ????(parameter)? ?? ?? ???? ?? ????? ?? ? ?? ??, ?? ?? ??? ??? ?? ?? ? ??. (???? ????) ? Ex) ????, ?????, ????, ????, ????, ?????? ?? ?(?; ?)
  • 11. MLE (Maximum Likelihood Estimation) ? = ? ?; ? [??] ?? ???? ?? ????? ????. ????? ?? ??? ?? ?? ??? likelihood ?? ??? ???. ? ?; ? ? ?? ?; ? ?? ?? ?? p(x)??? ??? ??????, ? ??? ???? ??? L ??? ????. ?? ? ?; ? = ?????? ? ?(?; ?)
  • 12. ??? ???? ? ?? ? Frequentist ? ?? : ??? ???? ?? ? ????? ?? ???? ??? ? ? ? (unknown but fixed) ? ?? ??? ?? ?? ??? ?? ? ??. ? Bayesian ? ?? : ??? ?? ? ????? ?? ??? ? ? ??. ? ??? ???? ?? ??? ??? ??. ? ? = ?????? ? ?(?; ?) ? ? = ?????? ? ?(?|?) ?? ??
  • 13. Expectation ? ?? ?? ?? ???(??)?? ???? ??? ??. (? ? [?]) ? ??? ?? ??? ?? ??? ?? ???. ? ?? ????? ???? ??? ????? ????? ??. ? ?? ??? ???? ????? ? ? [?] = ?? ? ?? , ? ? [?] = ? ? ? ? ??
  • 15. Information ? Shannon ??? ??? ????. ? ???? ????? ?? “??”? ??? ???. ? ?? ???? ???? ??? ?? ??? ?? ???? ????. ?? ?? ?? ?? ?.. ? ?? ??? ?? ?? ??? ???? ????? ?. ? ??? ?? ???? ?? ???? ???? ??? ???. ? ??? ??? ???? ??? ??? ? ?? ?? ??? ??. ? ?? ?? ??? ???? ?? ??? ??? ??? ???? ???, ??? ??? ?? ???? ?? ?? ? ? ??? ??. ? ??? ??? ?? ? ? ??? ?? ??? ??? ?? ?? ???? ??. ? ? = ? log ?(?)
  • 16. Information (Cont’d) ? ?? 1?? ?? ??? (?? 6?) ? ?? 5?? ?? ??? (?? 3?) ? ??? ??? 1? ?? ??? ?? ??? ? ? = ? log2 1 8,145,060 ? 23 ? ? = ? log2 1 45 ? 5.5 ? ? = ? log2 1 6 ? 2.6
  • 17. Entropy ? Entropy?? ? ??? ?(system)? ??? ?? ???. ? ??? ????? ? ?? ??. ????? ? ?? ?? ???… ? ???? ?? ?? ???? “? vs ?” ??? ??? ?? ? ??. ? ??? ??? ?? ?? ??? ??? ??. ? Entropy ? ? ???? ??? 2? ??? ???? ??, ? ??? ???? ???? ?? ??? bit ? ??? ??? ???? ? ??. ? ??? ?? ???? ??. ?? ??? ?? ?. ? ? = ? ? ? ? log2 ?(?) E ? = ? ? ? ? ?? E ? = ? ? ?(?)
  • 19. KL-divergence ? ???? ??? ??? ???? ?? ??? ??. (?? ???? ? ??) ? ?? ? P ?? ?? ??? ?? ??? ????, ? Q ?? ?? ???? ???? ???? ?? ? ?? ?? ???? ?? ???? KL-divergence ??? ??… ?? ?? ?. ? (????)
  • 21. KL-divergence (Cont’d) ? ? ?? ?? ??? ?? ?? ????? ???? ?? 0?? ? ? ??? ? ?? ??? ??? ?? ??? ??? ??? ?? ???? ??? ??? ?? ?? ?? ?? ???. ? ?? ??? ?? ?? ??? ?? ???? ??? ? ??? ????? ?? ??? (?? ??) ??? ? ?? ??.
  • 23. KL-divergence (Cont’d) ? ?? ??? ??? ? ??? ??? ?? P ? ??? ???? ??? P ??? ??? ?????, ? ?? Q?? ?? ??? ???? ?? ?? P ?? ? ??? ??. ? ?? ?? ???? ?? ???? ???? KL ?? ???? ?? ??? ???. ? ?? ?? Q1, Q2 ? ???? ?? KL? P? ?? ???? Q1? ? ??. ? ??? Q1 ? Q2 ?? P? ? ??? ????? ??? ? ??. ? ??? ?? ????? ? ?? ???. ? ?? ??? ??? ??? ????? ???? ??? ??. ? ??? ??? ? ? ??? ????? ?????. ? P ?? ???? ?? ??? ??? ??? ? ???? KL ?? ????.
  • 25. Mixture Distribution ? ???? ?? ??? ???? ?? ?? ???? ???? ??? ?? ? ????. ? ?? ?? ???? ??(distribution)?? ?? ????. ? ????, ????, ??? ??, ????-t ??, ?? ??, ?? ?? ?? ? ???? ????? ??? ???? ???? ??? ????? ?? ??. ? ??? ???? ?? ?? ??? ??? ???? ?? ??? ????. ? ? ? ?? ??? ??? GMM (Gaussian Mixture Model) ? ????. ? ?? ?? (latent variable)? ???? ??? ??? ???? ??.
  • 26. K-means ???? ? EM ? K-means ????? ?? ??? ??. ? ??? ???? K ?? ???? ??????? ????. ? ?? ??? ??? ???? ?? ??? ????? ???? ???? ?. ? ?? ?? K ?? ???(central point)? ????, ? ?? ???? ??? ?? ??? ???? ???? ????. ? ?? ?? ?? ??? ??? ??. ? = ?=1 ? ?=1 ? ??? ? ? ? ? ? 2 ??? = 1, ?? ? = ?????? ? ? ? ? ? ? 2 0, ????????? Binary indicator variables
  • 27. K-means ???? ? MLE? ????. ??? = 1, ?? ? = ?????? ? ? ? ? ? ? 2 0, ????????? ? ? ?? ????? ?? ???? ??. ? ???? ??? ??. ? ?? ????? ???? ??? ?? ? ????? ?????? ?? ? GD? ????.
  • 28. K-means ? ??? ?? EM ? r? u ? ??? ??? ?? 2 ??? ?? ? ?? u? ??? ??? ??? ? u? ??? ???? J? ????? r? ??. ? r? ??? ???? u? ?? ? ??? ??? ??? ? 2??? ?? ? ?? ??? K=2 ? ?? ?? ?? ? ?? ?? ??? r? ??? ???.
  • 29. GMM (Gaussian Mixture Model) ? ??? K-means ? ? ? ?? ???? ??? ??? ?????. ? ?? ?? p(x)? ??? ??? ??? ???? ???? ???? ? ?? ?? ?? ???? ??? ?? ???? ???? ????. ? K-means? ??? ?? ??? ???? ??? ???? ??? ?? ??? ??? ??? ?. ? ?; ? = ?=1 ? ? ? ?(?|? ?, Σ ?)
  • 30. GMM (Gaussian Mixture Model) (Cont’d)
  • 31. GMM with latent variable ? ?? ?? z ? ???? GMM ? ????. Responsibility
  • 32. MLE for GMM ? ??? ??? ??? ???? ?? ?? ????.
  • 33. GMM ? EM ????. ? ??? ?? : ? ???? ??? ??, ???? pi ?? ???? ??? ??. ? E ?? : ??? ???? ?? ???? r ? ???. ? M ?? : ??? r ?? ???? ??? ????? ???. ? ?? ????.
  • 34. EM ? ?? ? ?? ???. ? ?? ???? ??? ???? ??? ??. ? ?? ?? ?? z ? ???? ???? ??? ?? ? ??. ? z ? ?? ?? ??? ?? ??. ?? ???? ??? ??? ?? ??. ? ?? ??? EM ? ???? ??. ? SGD ? ?? ?? z ? ???? ?? ?? ??? ????? ?. ? ???? ?? ??? ??? ? ???? ?? ???? ????. ? ??? ??? ? ?? ??? ? ????.
  • 35. Expectation of log likelihood. ? ????? ? ??? ??? MLE ??? ??? ? ??. ? ?? ??? ??? ?? ????? ???? MLE? ??. ? ??? ??? ?? ?? ??? ???? “????”? “Z”? ???. (?????)
  • 37. EM ? ??? ? ?? ???? ? ??? ?????? EM ??? ??. ? ?? ?? ?? z ? ??? ? ?? ????? ??. ? ?? ?? z ?? ??? ?? ??? ???? ???, ? z ? ???? ?? ?? ??? ??? ???? ??? ? ??. ? ?, ?? ??? ??? ? Z ? ???? ?? ??? ? ?? ??? ??? ? ???? ???? ??? ???? ??. (GMM??)
  • 38. EM ???? ??. ? ??? EM ????? ?? ??? ??? ????? ??. ? MLE ??? ? ???? ??? ? ???? ?? EM ???? ?? ? ? ??. ? ??? ??? ?? ?? ?? ?? ?? ???!!! ??? ?? ??. ? ?? z ? ???? ??? ? ? ?? ??? ??. ? ??? ??? z ? ? ??? ??. ? ??? ??? z? ???? ??? ?? ???? ??? ?????
  • 39. EM ???? ??. (Cont’d) ? EM ? ???? Z? ?? ???? MLE? ??? ??. ? p(x) ? ???? ?? ??? ???? ?? ??? ???. (incomplete-data) ? p(x, z) ? MLE? ?? ?? ? ?? ??. (complete-data) ? Z ? ?? ????(?, PMF)? ?? ??? ??. ? ?? ?? ?? (PDF)? ???? ?? ???? ??? ??? ???? ???. ? ?? ?? p(z|x) ? ??? ?? ??? ???. ? ??? ??? ??? ????? ???? ??? ??. (E-Step??) ? ??? ?? ??????? -> VI
  • 41. q(z)? ?? ? ?? VI ?? ???? ?? ???? q(z)? ????. ? ??? ?? ?? ???? ?? ??? z ? ??? ?? ?? ?? ?? q() ?. ? ?? z? ??? ?? ?? ?? q(z)? ????? ? ? ?? ?? ??? ?? ?? ? ???.
  • 42. Variational Inference log ? ?; ? ? ? ≡ ?(?|?)?(?, ?) ??(?||?)
  • 43. EM for VI ? L? ?????. (??? q ? ? ??) ? ??? ? ? ???? ?? ??. ? KL ? ?? ?????. ? ? ?? ? ?? ???? ?? ? ??. ? ??? ??? ? ? ??? ?? ? ?.
  • 44. ?? ? ??? ???? ??? ?? ????? ????. ? Jensen’s Inequality (?? ???) – ?? f ? convex ? ?? ??? ??. ? Gibb’s Inequality (?? ???) – p ? q ? ?? ?? ??? ??? ?.
  • 46. Decomposition of ?(?) ? ? = ? ? ?? ??(?||?) = 0 ? ??. ? ? ? ? ??? ?? ?? ??. ??(?||?)? ????? ?? ? ? ? ? ? ??? ?? ??? ??? ??.
  • 47. E-Step ? ???? ? ? ???? ???? ?? ? ? ??? ? ??(?||?) = 0 ??? ???? ????. ? ??? ? ? ???? Bound ?? ? ? ???.
  • 48. M-Step ? ?? ? ? ??? ???? ???? ? ? ??? ? ?? MLE ? ???? ??? ? ? ?? ??. ? ?? ??? ? ? ?? Bound ?? ? ? ???.
  • 49. Overview for EM ? ? ??? EM? ?? ?? ???? ????. ? ?? ??? ???? ? ??? ??? EM ????? ??? ? ?? ???? ?? ??? ??? ??? ??? ? ??? ??? ??. ? ? ? ? ??? ? ??? ? ?? concave ????? ?? ?? ??? ??. (?? ?) ? ? ??? E-Step?? ?????. ? ??? ? ??? ????? ??? ???? ?? ???? ??. ? ?? ????? ? ??? ??. ? ?? ???? ??? ? ??? ??. (???) ? ? ??? M-Step ????. ? ?? ??? ??? ??? ???? ??.
  • 51. ??? (Variational Method) ? ???? ???? ?????? ?? ???? ?? ? ?? ??? ??? ???? ??? ???? ???, ? ??? ???? ?? ??? ??? ? ??. : ?? ?? ???(functional). ? ???? ??? ???? ??. ? ???? ???? ??? ?? ?? ? ??? ???? ???? ??. ? ??? ??? ?? ??? ???. ? ??? VI ??? ?? ??? ??? ??? ???? ??? ??? ????? ?. ? ???? ?? ???? ? ????(quadratic) or ?? ??? ??? ?? ?? or ?? ??
  • 52. VI ??? ?? ? VI ? ??? ?? ?? ????? ?? ??? ???? ??. ? ?, Full Bayesian ??? ??. ? ??? ??? ?? ????? ?? Z ? ????. ? ??? ???? ?? ???? ?? latent variable ? ????. ? ?? ?? latent variable ? ??? ??(continuous random variable)? ? ???. ? ?? ?? ???? ??? ???? ???? ??? ???? ???? ??. ? ?? ? ?? ?(?) ? ?? ?? ?(?|?) ? ?? ??? ?? ??? ?? ?.
  • 53. ???? ???? ??. ? ? ?? ?? ???? ?????? ?? ?? ??? ?????. ? ?? ??? ?? ?? ????? ?? ??? ???? Full ???? ?? ? ?? ? ???? ?? ??? ??? ?? ? ??? ?? ??? ?? ???? ???? ???? ??.
  • 54. ???? ???? ??. (Cont’d) ? ?? Z ? ?? ???? ??(family) ? ??? ??. ? KL? ????? ?? ???? ?? ?? ? ?? ?? ??? ? ????? ???? ?? ?? : ?(?; ?) ? ?? ?? ??. ? Factorized distributions
  • 55. Factorized distributions ? [??] ??? ? ? ??? ??? ? ??? ???? ? ??. ? ?, ??? ? ? ?? ?????? ??? ? ? ??. ? ?? ?? ??? ?(?) ? ????? ? ? ???. ? ??? ??? ??? ?? (mean-field theory) ??? ??.
  • 56. ??? ?? ? ??? ??????? ??? ?? ?????? ?? ?? ?? ? ??. ? (self-consistent field theory)??? ?. (? ???) ? ??? ????? ?? ???(many-body) ??? ??? ??? ????(one-body)? ?? ??? ???? ?? ? ??? ??? ?? ????? ???? ???? ????, ?? ?? ??? ? ???? ?