14. Generative Adversarial Nets (GAN)
Laplacian Pyramid of Generative Adversarial Nets [2]
13
[2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial
Networks. arXiv:1506.05751, 2015.
l 画像処理のテクニックと組み合わせて画像?成へ
周波数帯ごとに画像を?成していく
15. Generative Adversarial Nets (GAN)
Laplacian Pyramid of Generative Adversarial Nets [2]
14
[2] E. Denton, S. Chintala et al. Deep Generative Image Models using a Laplacian Pyramid of Adversarial
Networks. arXiv:1506.05751, 2015.
l 画像処理のテクニックと組み合わせて画像?成へ
周波数帯ごとに画像を?成していく
16. Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
15
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ネットワークを Convolutional Neural Net にすることで
より複雑な,よりリアルな画像が?成出来るように
17. Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
16
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ネットワークを Convolutional Neural Net にすることで
より複雑な,よりリアルな画像が?成出来るように
18. Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
17
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l Zの値を変えていくと,部屋の家具や背景が徐々に変化する
19. Generative Adversarial Nets (GAN)
Deep Convolutional Generative Adversarial Nets [3]
18
[3] A. Radford et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial
Netwroks. arXiv: 1511.06434, 2015.
l ある属性の画像を?成するZ の平均ベクトルの演算で
?成される画像の操作が可能
21. Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
20
l Autoencoder の中間層表現がある分布っぽいかどうかを
Dが判断する構造
l データ表現を任意の分布に落とし込める
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
Ex.) ここの表現を
正規分布にしたい!
22. Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
l 途中でカテゴリ情報を?れてやると,
Autoencoderはカテゴリに関係しない特徴 (Style)を獲得
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
途中でどのカテゴリか
教えてやる
スタイル情報を
好きな分布に落としこむ
(イメージ)
23. Generative Adversarial Nets (GAN) とならできること
Style Extraction [4]
22
l ?成したいカテゴリ情報 + 好きなスタイル特徴から
任意のスタイルの数字画像が?成できる
[4] A. Makhzani et al. Adversarial Autoencoders. arXiv: 1511.05644, 2015.
24. Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
23
l Character-level convolutional-recurrent network で
コードされたテキストをGとDへ付与
l G はテキスト情報と乱数から画像を?成,
D は画像とテキストのマッチングも含めて判断
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
25. Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
24
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
26. Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
25
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
27. Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
26
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l CUB(bird), Oxford-102(flower), MS-COCO で実験
28. Generative Adversarial Nets (GAN) とならできること
Text to Image [5]
27
[5] S. Reed et al. Generative Adversarial Text to Image Synthesis. arXiv:1605.05396, 2016.
l テキストとスタイル画像から所望の画像を?成する
Gと逆向きの (Zを推定する)
?向の学習器を作る
29. Generative Adversarial Nets (GAN) とならできること
Inpainting [6]
28[6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016.
l G が?部がマスクされた画像を?埋めするように学習
à “真の画像との誤差(L2)”と”Dを騙したかの誤差”を最?化
l L2だけではボケた画像が?成されるが,
Adversarial Nets を使うことでシャープな inpainting
Generator
Network (G)
Encoder
Network
Discriminator
Network (D)
L2 loss
real/fake
30. Generative Adversarial Nets (GAN) とならできること
Inpainting [6]
29
[6] D. Pathak et al. Context Encoders: Feature Learning by Inpainting. arXiv: 1604.07379, 2016.
32. まとめ
GAN の学習の概要と最近の研究事例
l “敵対的な” 2つの学習器を戦わせるという発想
l データの投げ?次第で?々なことができる
GAN で機械は芸術家の夢をGANGANみれるか?
l まだまだ低解像 (64x64程度) の画像までしか上?くいかない
l 最適化にすさまじい?智 (=テクニック) が必要
l しかし,?っぽさという定量化が難しい問題に対しての
アプローチの選択肢になりつつあるのでは?