狠狠撸

Variational Inference
swear013@gmail.com
norman3.github.io

Information
? ????? ????.
? ??? ??(distribution)? ? ? ??? ??? ??? ???
?? ?.
? ?? ?? ??? ???? ??? ?? ??? ??.
? ?? ???? ???? ?? ? ???? ???? ??.
? Variational ?? ?? ???? ?? ???? ??? ????
???.

Probability
? “???? ? ?? ?? ??? 1/6 ??”
? ??? ????? ??
? “??? ???? 10?? ??? ?? ? ?? ?? ??? ?? 1/6 ?? ?? ???
XX?.”
? ??? ????? ??
? “?? ??? ??? ??? 0.000000000000000001 ??”
? ??? ???? ?? ??? ?? ?? ??
? “???? ??? ??? ??? ??? ??? ??? ?? ??? ??? ??? ??.”
? ??? ?? ??
?(?)

Probability (Cont’d)
? ?? ??? ?? ??? ???? ?????
? ????? ?? ?? ?? ?? ??? ??? ?? ??? ??? ? ??
? ??.
? ??? ???. <= ? ??? ???? ??.
? ?? ??? ???? ?? ?? ?? ??.
? ?? ??? ??? ??? “??” ? ?? ??
? ?? ?? ?? ?? (??? ???)
? http://cs229.stanford.edu/section/cs229-prob.pdf
?(?)

Probability (Cont’d)
? ?? ?? (Probability function ??)
? ?? ??? ???? ?? ?? ?? ??.
? ?? ?? ??? ?? ??.
? ?? 1??? (PMF) ??? 1 (PDF).
? ?? ?? ?? 0?? ?? ??.
? ?? ? ???? ??? ??? ?? ??? ???
?.
? PMF? PDF? ??? ?? ??? ??.
? ?? ≥ 0 ?
?
? ?? =1
R.V
PMF
? ?? ≥ 0
?∞
∞
? ?? = 1
PDF

?? ??? (2?? ?? ?? ??)
? ?,? ?, ? ? ?,? ?, ? = ? ?(?)? ?(?)
? R.V. ? ??? ??
? ?,? ? | ?
???? x? y ? ?? ???? ??
y ? ????? ? ??? ? ??.
? ?|? =
? ? ? ?(?)
?(?)
? ? = 3|? ? ? = 3|? = 0
? ? = 3|? = 1?? ?|? = 1

??? ?? ??
? ?|?
? ?|? = 1.1
? ? = 1|? = 1.1

Probability Distribution with Parameter
? ??(distribution)? ?? ?? ?? ??? ?? ???? ??
?? ??.
? ?? ???? ????? ?? ?? ??? ????? ?????
??.
? ????(parameter)? ?? ?? ???? ?? ????? ?? ?
?? ??,
?? ?? ??? ??? ?? ?? ? ??. (???? ????)
? Ex) ????, ?????, ????, ????, ????, ?????? ??
?(?; ?)

?? ????
????? ????
?? ????
????

MLE (Maximum Likelihood Estimation)
? = ? ?; ?
[??]
?? ???? ?? ????? ????.
????? ?? ??? ??
?? ??? likelihood ?? ??? ???.
? ?; ?
? ?? ?; ? ??
?? ?? p(x)??? ??? ??????,
? ??? ???? ??? L ??? ????.
??
? ?; ? = ?????? ? ?(?; ?)

??? ???? ? ??
? Frequentist
? ?? : ??? ???? ??
? ????? ?? ???? ??? ?
?
? (unknown but fixed)
? ?? ??? ?? ?? ??? ??
? ??.
? Bayesian
? ?? : ??? ??
? ????? ?? ??? ? ? ??.
? ??? ???? ?? ??? ???
??.
? ? = ?????? ? ?(?; ?) ? ? = ?????? ? ?(?|?)
?? ??

Expectation
? ?? ?? ?? ???(??)?? ???? ??? ??. (? ?
[?])
? ??? ?? ??? ?? ??? ?? ???.
? ?? ????? ???? ??? ????? ????? ??.
? ?? ??? ???? ?????
? ? [?] = ?? ? ?? , ? ? [?] = ? ? ? ? ??

Information
? Shannon ??? ??? ????.
? ???? ????? ?? “??”? ??? ???.
? ?? ???? ???? ??? ?? ??? ?? ???? ????. ?? ?? ?? ?? ?..
? ?? ??? ?? ?? ??? ???? ????? ?.
? ??? ?? ???? ?? ???? ???? ??? ???.
? ??? ??? ???? ??? ??? ? ?? ?? ??? ??.
? ?? ?? ??? ???? ?? ??? ??? ??? ???? ???, ??? ??? ?? ???? ?? ?? ?
? ??? ??.
? ??? ??? ?? ? ? ??? ?? ??? ??? ?? ?? ???? ??.
? ? = ? log ?(?)

Information (Cont’d)
? ?? 1?? ?? ??? (?? 6?)
? ?? 5?? ?? ??? (?? 3?)
? ??? ??? 1? ?? ??? ?? ???
? ? = ? log2
1
8,145,060
? 23
? ? = ? log2
1
45
? 5.5
? ? = ? log2
1
6
? 2.6

Entropy
? Entropy??
? ??? ?(system)? ??? ?? ???.
? ??? ????? ? ?? ??. ????? ? ?? ?? ???…
? ???? ?? ?? ???? “? vs ?” ??? ??? ?? ? ??.
? ??? ??? ?? ?? ??? ??? ??.
? Entropy ? ? ???? ??? 2? ??? ???? ??,
? ??? ???? ???? ?? ??? bit ? ??? ??? ???? ? ??.
? ??? ?? ???? ??. ?? ??? ?? ?.
? ? = ?
?
? ? log2 ?(?)
E ? = ? ? ? ? ??
E ? = ? ? ?(?)

KL-divergence
? ???? ??? ??? ???? ?? ??? ??. (?? ????
? ??)
? ??
? P ?? ?? ??? ?? ??? ????,
? Q ?? ?? ???? ???? ???? ??
? ?? ?? ???? ?? ???? KL-divergence ??? ??… ?? ??
?.
? (????)

KL-divergence (Cont’d)
? ? ?? ?? ??? ?? ?? ????? ???? ?? 0?? ?
? ???
? ?? ??? ??? ?? ??? ??? ??? ??
???? ??? ??? ?? ?? ?? ?? ???.
? ?? ??? ?? ?? ??? ?? ???? ???
? ??? ????? ?? ??? (?? ??) ???
? ?? ??.

Asymmetric

? ?? ??? ???
? ??? ??? ?? P ? ??? ???? ??? P ??? ??? ?????,
? ?? Q?? ?? ??? ???? ?? ?? P ?? ? ??? ??.
? ?? ?? ???? ?? ???? ???? KL ?? ???? ?? ??? ???.
? ?? ?? Q1, Q2 ? ???? ?? KL? P? ?? ???? Q1? ? ??.
? ??? Q1 ? Q2 ?? P? ? ??? ????? ??? ? ??.
? ??? ?? ?????
? ?? ???. ? ?? ??? ??? ??? ????? ???? ??? ??.
? ??? ??? ? ? ??? ????? ?????.
? P ?? ???? ?? ??? ??? ??? ? ???? KL ?? ????.

EM (Expectation-
Maximization)
?????? ?? EM ????? ???? ??.

Mixture Distribution
? ???? ?? ??? ???? ?? ?? ???? ???? ??? ??
? ????.
? ?? ?? ???? ??(distribution)?? ?? ????.
? ????, ????, ??? ??, ????-t ??, ?? ??, ?? ?? ??
? ???? ????? ??? ???? ???? ??? ????? ??
??.
? ??? ???? ?? ?? ??? ??? ???? ?? ??? ????.
? ? ? ?? ??? ??? GMM (Gaussian Mixture Model) ? ????.
? ?? ?? (latent variable)? ???? ??? ??? ???? ??.

K-means ????
? EM ? K-means ????? ?? ??? ??.
? ??? ???? K ?? ???? ??????? ????.
? ?? ??? ??? ???? ?? ??? ????? ???? ???? ?.
? ?? ?? K ?? ???(central point)? ????,
? ?? ???? ??? ?? ??? ???? ???? ????.
? ?? ?? ?? ??? ??? ??.
? =
?=1
?
?=1
?
??? ? ? ? ? ?
2 ??? = 1, ?? ? = ?????? ? ? ? ? ? ?
2
0, ?????????
Binary indicator variables

K-means ????
? MLE? ????.
??? = 1, ?? ? = ?????? ? ? ? ? ? ?
2
0, ?????????
? ? ?? ????? ?? ???? ??.
? ???? ??? ??.
? ?? ????? ???? ??? ??
? ????? ?????? ??
? GD? ????.

K-means ? ??? ?? EM
? r? u ? ??? ??? ?? 2 ???
??
? ?? u? ??? ??? ???
? u? ??? ???? J? ????? r?
??.
? r? ??? ???? u? ??
? ??? ??? ??? ? 2??? ??
? ?? ??? K=2 ? ?? ?? ??
? ?? ?? ??? r? ??? ???.

GMM (Gaussian Mixture Model)
? ??? K-means ? ? ? ?? ???? ??? ??? ?????.
? ?? ?? p(x)? ??? ??? ??? ???? ???? ????
? ?? ?? ?? ???? ??? ?? ???? ???? ????.
? K-means? ??? ?? ??? ???? ??? ???? ??? ?? ??? ??? ??? ?.
? ?; ? =
?=1
?
? ? ?(?|? ?, Σ ?)

GMM (Gaussian Mixture Model)
(Cont’d)

GMM with latent variable
? ?? ?? z ? ???? GMM ? ????.
Responsibility

MLE for GMM
? ??? ??? ??? ???? ?? ?? ????.

GMM ? EM ????.
? ??? ?? : ? ???? ??? ??, ???? pi ?? ???? ??? ??.
? E ?? : ??? ???? ?? ???? r ? ???.
? M ?? : ??? r ?? ???? ??? ????? ???.
? ?? ????.

EM ? ?? ? ?? ???.
? ?? ???? ??? ???? ??? ??.
? ?? ?? ?? z ? ???? ???? ??? ?? ? ??.
? z ? ?? ?? ??? ?? ??. ?? ???? ??? ??? ??
??.
? ?? ??? EM ? ???? ??.
? SGD ? ?? ?? z ? ???? ?? ?? ??? ????? ?.
? ???? ?? ??? ??? ? ???? ?? ???? ????.
? ??? ??? ? ?? ??? ? ????.

Expectation of log likelihood.
? ????? ? ??? ??? MLE ??? ??? ? ??.
? ?? ??? ??? ?? ????? ???? MLE? ??.
? ??? ??? ?? ?? ??? ???? “????”? “Z”? ???.
(?????)

EM ? ??? ? ?? ????
? ??? ?????? EM ??? ??.
? ?? ?? ?? z ? ??? ? ?? ????? ??.
? ?? ?? z ?? ??? ?? ??? ???? ???,
? z ? ???? ?? ?? ??? ??? ???? ??? ? ??.
? ?, ?? ??? ??? ? Z ? ???? ?? ??? ? ?? ??? ??? ?
???? ???? ??? ???? ??. (GMM??)

EM ???? ??.
? ??? EM ????? ?? ??? ??? ????? ??.
? MLE ??? ? ???? ??? ? ???? ?? EM ???? ??
? ? ??.
? ??? ??? ?? ?? ?? ?? ?? ???!!! ??? ??
??.
? ?? z ? ???? ??? ? ? ?? ??? ??.
? ??? ??? z ? ? ??? ??.
? ??? ??? z? ???? ??? ?? ???? ??? ?????

EM ???? ??. (Cont’d)
? EM ? ???? Z? ?? ???? MLE? ??? ??.
? p(x) ? ???? ?? ??? ???? ?? ??? ???. (incomplete-data)
? p(x, z) ? MLE? ?? ?? ? ?? ??. (complete-data)
? Z ? ?? ????(?, PMF)? ?? ??? ??.
? ?? ?? ?? (PDF)? ???? ?? ???? ??? ??? ???? ???.
? ?? ?? p(z|x) ? ??? ?? ??? ???.
? ??? ??? ??? ????? ???? ??? ??. (E-Step??)
? ??? ?? ??????? -> VI

q(z)? ??
? ?? VI ?? ???? ?? ???? q(z)? ????.
? ??? ?? ?? ???? ?? ??? z ? ??? ?? ?? ?? ?? q() ?.
? ?? z? ??? ?? ?? ?? q(z)? ????? ? ? ?? ?? ??? ?? ?? ?
???.

Variational Inference
log ? ?; ?
? ? ≡ ?(?|?)?(?, ?)
??(?||?)

EM for VI
? L? ?????. (??? q ? ?
??)
? ??? ? ? ???? ?? ??.
? KL ? ?? ?????.
? ? ?? ? ?? ???? ?? ?
??.
? ??? ??? ? ? ??? ?? ?
?.

??
? ??? ???? ??? ?? ????? ????.
? Jensen’s Inequality (?? ???) – ?? f ? convex ? ?? ???
??.
? Gibb’s Inequality (?? ???) – p ? q ? ?? ?? ??? ???
?.

Decomposition of ?(?)
? ? = ? ? ?? ??(?||?) = 0 ? ??.
? ? ? ? ??? ?? ?? ??.
??(?||?)? ????? ?? ? ? ? ? ? ???
?? ??? ??? ??.

E-Step
? ???? ? ? ???? ???? ?? ? ? ???
? ??(?||?) = 0 ??? ???? ????.
? ??? ? ? ???? Bound ?? ? ? ???.

M-Step
? ?? ? ? ??? ???? ???? ? ? ???
? ?? MLE ? ???? ??? ? ? ?? ??.
? ?? ??? ? ? ?? Bound ?? ? ? ???.

Overview for EM
? ? ??? EM? ?? ?? ???? ????.
? ?? ??? ???? ? ??? ??? EM ????? ???
? ?? ???? ?? ??? ??? ??? ??? ? ??? ??? ??.
? ? ? ? ??? ? ??? ? ?? concave ????? ?? ?? ??? ??. (??
?)
? ? ??? E-Step?? ?????.
? ??? ? ??? ????? ??? ???? ?? ???? ??.
? ?? ????? ? ??? ??.
? ?? ???? ??? ? ??? ??. (???)
? ? ??? M-Step ????.
? ?? ??? ??? ??? ???? ??.

VI (Variational Inference)
?? ?? ?????.

??? (Variational Method)
? ???? ???? ?????? ?? ???? ??
? ?? ??? ??? ???? ??? ???? ???,
? ??? ???? ?? ??? ??? ? ??. : ?? ?? ???(functional).
? ???? ??? ???? ??.
? ???? ???? ??? ?? ?? ? ??? ???? ???? ??.
? ??? ??? ?? ??? ???.
? ??? VI ??? ?? ??? ??? ??? ???? ??? ??? ????? ?.
? ???? ?? ????
? ????(quadratic) or ?? ??? ??? ?? ?? or ?? ??

VI ??? ??
? VI ? ??? ?? ?? ????? ?? ??? ???? ??.
? ?, Full Bayesian ??? ??.
? ??? ??? ?? ????? ?? Z ? ????.
? ??? ???? ?? ???? ?? latent variable ? ????.
? ?? ?? latent variable ? ??? ??(continuous random variable)? ?
???.
? ?? ?? ???? ??? ???? ???? ??? ???? ???? ??.
? ??
? ?? ?(?) ? ?? ?? ?(?|?) ? ?? ??? ?? ??? ?? ?.

???? ???? ??.
? ? ?? ?? ???? ?????? ?? ?? ??? ?????.
? ?? ??? ?? ?? ????? ?? ??? ???? Full ???? ??
? ??
? ???? ?? ??? ??? ??
? ??? ?? ??? ?? ???? ???? ???? ??.

???? ???? ??. (Cont’d)
? ?? Z ? ?? ???? ??(family) ? ??? ??.
? KL? ????? ?? ???? ?? ??
? ?? ?? ???
? ????? ???? ?? ?? : ?(?; ?)
? ?? ?? ??.
? Factorized distributions

Factorized distributions
? [??] ??? ? ? ??? ??? ? ??? ???? ? ??.
? ?, ??? ? ? ?? ?????? ??? ? ? ??.
? ?? ?? ??? ?(?) ? ????? ? ? ???.
? ??? ??? ??? ?? (mean-field theory) ??? ??.

??? ??
? ??? ??????? ??? ?? ?????? ?? ?? ?? ? ??.
? (self-consistent field theory)??? ?. (? ???)
? ??? ????? ?? ???(many-body) ???
??? ??? ????(one-body)? ?? ??? ???? ??
? ??? ??? ?? ????? ???? ???? ????, ?? ?? ???
? ???? ?

Factorized distributions (Cont’d)

狠狠撸

Variational inference intro. (korean ver.)

Recommended

More Related Content

What's hot (20)

Similar to Variational inference intro. (korean ver.) (20)

Variational inference intro. (korean ver.)