ºÝºÝߣ

ºÝºÝߣShare a Scribd company logo
??? ????
3?
???
donghun2014@gmail.com
??? ?????
? ??? ???? 1?, 2??? ???? ??????
? ?? ???? ???? ??? ??? ?? ???? ??
? ?????, ???, ???? ????? ?????
? ¡°?????? ?? ???¡±? ??????..
? ??? ???? ¡°??¡± ??? ???? ???
1. ??? ???
2. ????? ?? ???
4/28/2016 ??? ???? 3? ? ??? 2
????
? ???? ?????? ???
? ???? ?? ??? ???? ?! ??? ??????
? donghun2014@gmail.com
? ??? ? ??? ? ??? ????? ?????
? ??? ???? ?? ????, ??? ???? ?? ??? ? ???
4/28/2016 ??? ???? 3? ? ??? 3
2???? ????
? ???? ??
? ??? ?????? ??
? ??? S/W ??: Deep Learning ?? ??
? ??? S/W ??: Reinforcement Learning ?? ??
? ??? S/W ??: Monte-Carlo Tree Search ?? ??
? ??? S/W? ??? ???
? ??? S/W? ?? ? ?????
? ??? S/W? ???
? ???? ???
4/28/2016 ??? ???? 3? ? ??? 4
??
? ???? ??
? ??? ?????? ??
? ??? S/W? ??? ???
? ??? S/W? ?? ? ?????
? ??? S/W? ???
? ???? ???
4/28/2016 ??? ???? 3? ? ??? 5
???? ??? ???
? ??? ??? ????(reinforcement learning)? ??
?????? ?? ???? ?? ??? ????
? ??? ???? ??? ??
? ¡°??¡±? ??? ????
? ??? ?? ??
? ?? ????
4/28/2016 ??? ???? 3? ? ??? 6
???
????
????
??? ??
?? ????
??? ???
???? ??? ???
? ??? ??? ????(reinforcement learning)? ??
?????? ?? ???? ?? ??? ????
? ??? ???? ??? ??
? ¡°??¡±? ??? ????
? ??? ?? ??
? ?? ????
? ¡°??¡±? ??? ????
4/28/2016 ??? ???? 3? ? ??? 7
???
????
????
??? ??
?? ????
??? ???
???? ??? ???
? ??? ??? ????(reinforcement learning)? ??
?????? ?? ???? ?? ??? ????
? ??? ???? ??? ??
? ¡°??¡±? ??? ????
? ??? ?? ??
? ?? ????
? ¡°??¡±? ??? ????
? ¡°??¡±? ????
4/28/2016 ??? ???? 3? ? ??? 8
???
????
????
??? ??
?? ????
??? ???
???? ??? ???
? ??? ??? ????(reinforcement learning)? ??
?????? ?? ???? ?? ??? ????
? ??? ???? ??? ??
? ¡°??¡±? ??? ????
? ??? ?? ??
? ?? ????
? ¡°??¡±? ??? ????
? ¡°??¡±? ????
? ????? ????
4/28/2016 ??? ???? 3? ? ??? 9
???
????
????
??? ??
?? ????
??? ???
???? ??? ???
? ??? ??? ????(reinforcement learning)? ??
?????? ?? ???? ?? ??? ????
? ??? ???? ??? ??
? ¡°??¡±? ??? ????
? ??? ?? ??
? ?? ????
? ¡°??¡±? ??? ????
? ¡°??¡±? ????
? ????? ????
? ?? ???? ¡°??¡±? ? ?? ????..
4/28/2016 ??? ???? 3? ? ??? 10
???
????
????
??? ??
?? ????
??? ???
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
4/28/2016 ??? ???? 3? ? ??? 11
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
1. ?? ??? ????
2. ?? ?????? ?? ???
3. ? ? ?? ?? ??? ??? ????
4/28/2016 ??? ???? 3? ? ??? 12
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
1. ?? ??? ????
2. ?? ?????? ?? ???
3. ? ? ?? ?? ??? ??? ????
? ?? ?? ??? ??? ??? ????,
?? ?????? ??? ¡°?¡±???? ??? ??!
? Asynchronous Policy and Value MCTS (APV-MCTS) ????
4/28/2016 ??? ???? 3? ? ??? 13
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
? Asynchronous Policy and Value MCTS (APV-MCTS) ????
? ??? ?? ?? ??? ????? ????? ??
? ????? ????? master node?? ??
? ????? slave node?? ??? ????? ??
4/28/2016 ??? ???? 3? ? ??? 14
???? ??? ???
? ??? ??: s
? Policy network? value network? ??? ? input? (??? ??)
? ???? 19x19 ? ?(?)?? ?? ?/?/??
? ???, ? ?(?)? ???
? ?? ?? 1 (¡°? ? ??? ??¡±? ???)
? ?? ???, ? ? ?? ???? (?? 1, ?? 8) (??8? binary array)
? ??? ?? ?? ??? ???? (?? 1, ?? 8)
? ??? ?? ???? ?? ?? ?? ? (?? 1, ?? 8)
? ?? ?? ????, ??? ? ?? ??? ??? ??? ? ?? ??? (?? 1, ?? 8)
? ?? ?? ????, ? ?? ??? ?? ??? ? ?? ?? (?? 1, ?? 8)
? ?? ?? ????, ?? ?? ???? ????
? ?? ?? ????, ?? ?? ????? ????
? ?? ???? ??? ??? ?????
? ?? ???? ???? (?? Value Network (????) ?? ????)
4/28/2016 ??? ???? 3? ? ??? 15
???? ??? ???
? ??? ?? s (19x19x48) tensor? ??? ??,
? ???? ? ???? ?????
? APV-MCTS? ?????
? ?? ??? ?? s? ?? node? ??
4/28/2016 ??? ???? 3? ? ??? 16
???? ??? ???
? ??? ?? s (19x19x48) tensor? ??? ??,
? ???? ? ???? ?????
? APV-MCTS? ?????
? ?? ??? ?? s? ?? node? ??
? ????
? ?? ?? ???? node??? ? ??? on-demand? ??
? ?? ? ? node ??? ?
? ?? ??? ???? a? ???, (s,a)? ????? ????
? ? (s,a)? ??? ?? ??? ????? ?? (??? ??? 2? MCTS ?? ??)
? ? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? , ? ?, ?
4/28/2016 ??? ???? 3? ? ??? 17
???? ??? ???
? APV-MCTS 1??: ¡°Search¡±
? ??: ?? ????? s? ???? ???? node s?? ????,
??? ???? ????? ?? ??? ?? ?
? ????? ?? ??? ?? ??? ?? ??
4/28/2016 ??? ???? 3? ? ??? 18
???? ??? ???
? APV-MCTS 1??: ¡°Search¡±
? ??: ?? ????? s? ???? ???? node s?? ????,
??? ???? ????? ?? ??? ?? ?
? ????? ?? ??? ?? ??? ?? ??
? ???? node s??, ??? ?? ???? a?? ???? ??
? ??? ?? (s,a)? ??? ??? ??, ???? ?? ?? a??:
? ?, ? + ? ???? ?(?, ?)
¦Ò ? ??(?, ?)
1 + ??(?, ?)
? ? ???? = ? ? ??? (??: 50 ? 5. ????? ????? ???? ???? ??????)
? ¦Ò ? ??(?, ?) ? ??? ¡°??? ?? ??¡± ?? roll-out?? ???? ??? ?
? Roll-out? ??? search 2?? ¡°Expansion¡±?? ??
4/28/2016 ??? ???? 3? ? ??? 19
???? ??? ???
? APV-MCTS 1??: ¡°Search¡±
? ??? ?? (s,a)? ??? ??? ??, ???? ?? ?? a??:
? ?, ? + ? ???? ?(?, ?)
¦Ò ? ??(?, ?)
1 + ??(?, ?)
? ? ?, ? : ? ??? ?? s??, ?? a? ??, ??? ???? ???
? ?(?, ?)
¦Ò ? ? ?(?,?)
1+? ?(?,?)
: ? ??? ?? s??, ? ? ?? ?? a? ???? ???
? ¦Ò ? ??(?, ?) ? ??? ¡°??? ?? ??¡± ?? roll-out?? ???? ??? ?
? Roll-out? ????? APV-MCTS ?? ???? ? ???
? ? ???? = 5 ? ??? (? ???? ???? ??? ??? ??)
4/28/2016 ??? ???? 3? ? ??? 20
???? ??? ???
? APV-MCTS 1??: ¡°Search¡±
? ??: ?? ????? s? ???? ???? node s?? ????,
??? ???? ????? ?? ??? ?? ?
? ????? ?? ??? ?? ??? ?? ??
? s?? ?? a? ????, ?? ??? ??? ???
? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????:
?? ?, ? = ?? ?, ? + ? ??
?? ?, ? = ?? ?, ? ? ? ??
? ? ?? = 3?? ??
? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ???
?????¡±? ????? ????
? ???????? ???, ?? ????? ???? ?? ???? ??? ??
4/28/2016 ??? ???? 3? ? ??? 21
???? ??? ???
? APV-MCTS 1??: ¡°Search¡±
? ??: ?? ????? s? ???? ???? node s?? ????,
??? ???? ????? ?? ??? ?? ?
? ????? ?? ??? ?? ??? ?? ??
? s?? ?? a? ????, ?? ??? ??? ???
? ??? ?? ??? ?? ??? s? ????, ???
? ???? ??, ?? ? ?? s? ???
? ???? ??? ?? ???? ????? ??? ?? ??? ??
? ??? ?? ??? ?? ??.
4/28/2016 ??? ???? 3? ? ??? 22
???? ??? ???
? APV-MCTS 2??: ¡°Evaluation¡±
? ??: ?? ???? ????? ?? ???? ??? node ? ???, ??
???? ??? ??? ?? ????? ???? ?
? ???? ??? 2?? ???? ?
1. ??? ??
2. Roll-out ????? ??
4/28/2016 ??? ???? 3? ? ??? 23
???? ??? ???
? APV-MCTS 2??: ¡°Evaluation¡±
? Value network (???: ?? ?? ?? ???? ??? ??) ???:
? ??? ??? ? (??? ?) ? ???? (?/? ???) ? ???
? ?, ??? ?? ?? ?? ???, ???? queue? ???? ?
? ??, ? ? ??? ? ?? ?? ??? ???? ?? ?? ??? ? ?? memoize
? ??? ???? ?? ? ???
? ??? ?? ???? (4??: ¡°Expansion¡±?? ??) ?? call
? Call?? ???? ??. ?? call? ???? ??? ???? ???
? ????? ???? evaluation??? GPU ???? ?? ??
4/28/2016 ??? ???? 3? ? ??? 24
???? ??? ???
? APV-MCTS 2??: ¡°Evaluation¡±
? Roll-out ????? ?? ???
? Roll-out policy?? ??? ??? ?? ? ?? ??? ???? ?????
? ? ??? ??? ?????? ???? Policy network (???)?? ? 1000? ???
?? ? ???? ??? (???: ?? 0.003? vs Roll-out: ?? 0.000002?)
? Roll-out? ?? ??? ??? node? ? ????? ??
? Roll-out policy? ???? ?? ?? ?? ????? ??
? ?? ????? ?????? ?? ??
? ???? ???, ? ??? ??, ??? +1, ??? -1? ???? ??
? ?, ? ??? ???? ??? ??? ??? ?????? ?????? ??
? ?? ????? ???? ?? ?? ??? ¡°Backup¡±???? ??
4/28/2016 ??? ???? 3? ? ??? 25
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??: ??? ??? Roll-out ???? ??? ??? Value network ??
???? ?? ??? ??? ?? ????? ????
4/28/2016 ??? ???? 3? ? ??? 26
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ¡°Search¡±???? ? ?? ?????::
? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????:
?? ?, ? = ?? ?, ? + ? ??
?? ?, ? = ?? ?, ? ? ? ??
? ? ?? = 3?? ??
? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ???
?????¡±? ????? ????
? ???????? ???, ?? ????? ???? ?? ???? ??? ??
4/28/2016 ??? ???? 3? ? ??? 27
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ¡°Search¡±???? ? ?? ?????::
? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????:
?? ?, ? = ?? ?, ? + ? ??
?? ?, ? = ?? ?, ? ? ? ??
? ? ?? = 3?? ??
? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ???
?????¡±? ????? ????
? ???????? ???, ?? ????? ???? ?? ???? ??? ??
? ?? ?????? Evaluation? ?? ????,
??? ?? ?, ? , ??(?, ?)? ????? ??
4/28/2016 ??? ???? 3? ? ??? 28
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??? ?? ?, ? , ??(?, ?)? ????? ??
? ?? ?? +1, ??? ?? ??? ??? ???? ?
4/28/2016 ??? ???? 3? ? ??? 29
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??? ?? ?, ? , ??(?, ?)? ????? ??
? ?? ?? +1, ??? ?? ??? ??? ???? ?
? ?? ??? ??? ?????? ??? ?? ?, ? ?? ?????
? ?? Search?? ??? ?? ????????,
?? ?, ? = ?? ?, ? + ? ??
?? ?, ? = ?? ?, ? ? ? ??
? ?? ??? ??? ???, ??? ? ??? ??? ?? ??????
?? ?, ? = ?? ?, ? ? ? ?? + 1
?? ?, ? = ?? ?, ? + ? ?? + ??
4/28/2016 ??? ???? 3? ? ??? 30
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??? ?? ?, ? , ??(?, ?)? ????? ??
? ?? ?? +1, ??? ?? ??? ??? ???? ?
? ?? ??? ??? ?????? ??? ?? ?, ? ?? ?????
? ?? ?, ? , ?? ?, ? ?? Evaluation??? ??? ????? ??????.
4/28/2016 ??? ???? 3? ? ??? 31
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??? ?? ?, ? , ??(?, ?)? ????? ??
? ?? ?? +1, ??? ?? ??? ??? ???? ?
? ?? ??? ??? ?????? ??? ?? ?, ? ?? ?????
? ?? ?, ? , ?? ?, ? ?? Evaluation??? ??? ????? ??????.
? ?? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? ? ???? ?(?, ?) ?? ??????
? ?, ? = 1 ? ?
?? ?, ?
?? ?, ?
+ ?
?? ?, ?
?? ?, ?
4/28/2016 ??? ???? 3? ? ??? 32
???? ??? ???
? APV-MCTS 3??: ¡°Backup¡±
? ??? ?? ?, ? , ??(?, ?)? ????? ??
? ?? ?? +1, ??? ?? ??? ??? ???? ?
? ?? ??? ??? ?????? ??? ?? ?, ? ?? ?????
? ?? ????? ??????
? Lock-free update: ?? ?? memory space? ???? ??? ??? ??
? ???? ??? ??, ???? ???, ????? ???? ???? [??]
4/28/2016 ??? ???? 3? ? ??? 33
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ??? ?? (?, ?)? ??? ?? ????, ? ??? ???? ???
?? ?¡ä? ???? ????? ????? ??
? ????: ?? ?, ? > ? ???
? ? ???? ???? ??????? GPU ??? ????? ??? ???? ??
4/28/2016 ??? ???? 3? ? ??? 34
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ??? ?? (?, ?)? ??? ?? ????, ? ??? ???? ???
?? ?¡ä? ???? ????? ????? ??
? ????: ?? ?, ? > ? ???
? ? ???? ???? ??????? GPU ??? ????? ??? ???? ??
? ?? ?¡ä? initialization? ??? ??.
?? ?¡ä, ? = 0, ?? ?¡ä, ? = 0
?? ?¡ä, ? = 0, ?? ?¡ä, ? = 0
? ?¡ä
, ? = ?? ? ?¡ä
? ?? ? ?¡ä ? tree policy. Roll-out policy?? ?? ? ????? ?? ???.
? ?(?¡ä, ?)? ????? 0?? init?.
4/28/2016 ??? ???? 3? ? ??? 35
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ?? ?¡ä? initialization?? ?? ??
? ??? ???? ?? ?¡ä, ? , ?? ?¡ä, ? ????
? ? ?¡ä
, ? ?? ??? ???? ??? ????
? Init???? ? ?? ? ?¡ä, ? = ?? ? ?¡ä ? ???
? ??? ? ?¡ä, ? = ? ? ? ?¡ä ? ???????? ??
4/28/2016 ??? ???? 3? ? ??? 36
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ?? ?¡ä? initialization?? ?? ??
? ??? ???? ?? ?¡ä, ? , ?? ?¡ä, ? ????
? ? ?¡ä
, ? ?? ??? ???? ??? ????
? Init???? ? ?? ? ?¡ä, ? = ?? ? ?¡ä ? ???
? ??? ? ?¡ä, ? = ? ? ? ?¡ä ? ???????? ??
? ? ?????? ?????? ???
? ???? ?? ?????. ???? ????? queue??
? Init? ??? ??? ?? ??? ???? ???, ?????? ?? ??? ???
4/28/2016 ??? ???? 3? ? ??? 37
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ?? ??: GPU?? (???, ??? ?? ???)
? Init? ? ???? ????? ???, ?? ???? ??? ?? ???? ??
? ????????, ? ????? ?? ?????? ??? ??? ???
4/28/2016 ??? ???? 3? ? ??? 38
???? ??? ???
? APV-MCTS 4??: ¡°Expansion¡±
? ?? ??: GPU?? (???, ??? ?? ???)
? Init? ? ???? ????? ???, ?? ???? ??? ?? ???? ??
? ????????, ? ????? ?? ?????? ??? ??? ???
? ?? ?? / latency?? ??
? GPU?? ???? queue?? ???? expansion ??? ??
? ? ???? ?? ??
? Mini-batch? 1? ??
? ?????? ???? ??? ? ? ???????, ?? latency??? ?? ??
? ???? ?? ??? ??? ? ???? ???? ????? ???
4/28/2016 ??? ???? 3? ? ??? 39
???? ??? ???
? APV-MCTS ???? ??
1. Search: ?? ??? ??? ???? ?? ????
2. Evaluation: ?? ?? ??? ??(??? ??? ??)? ?? ??
3. Backup: ??? ?? ?? ??? ??
4. Expansion: ????? ?? ??? ??
? ????? ??? ??? ????
? ?? ???? ???? ???? ???? ????? ?? ??
? ??? 9?? ??? ??? ?? ???? ??
4/28/2016 ??? ???? 3? ? ??? 40
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
1. ?? ??? ????
2. ?? ?????? ?? ??? (APV-MCTS)
3. ? ? ?? ?? ??? ??? ????
4/28/2016 ??? ???? 3? ? ??? 41
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ??? ??????
1. ?? ??? ????
2. ?? ?????? ?? ??? (APV-MCTS)
3. ? ? ?? ?? ??? ??? ????
? ?????? ¡°?? ??¡± ??? ??? ???? ?? ???
4/28/2016 ??? ???? 3? ? ??? 42
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??.
? ?????? ¡°?? ??¡± ??? ??? ???? ?? ???
? Search????, ?? ?? ????? ??? ?? ??
? ?, ? + ? ???? ?(?, ?)
¦Ò ? ??(?, ?)
1 + ??(?, ?)
? ?? ??????? ???? ?? ???? 0?? ??
? ???? ??/?? ???. ??? ??? ??? ??
4/28/2016 ??? ???? 3? ? ??? 43
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??.
? ?????? ¡°?? ??¡± ??? ??? ???? ?? ???
? Search????, ?? ?? ????? ??? ?? ??
? ?, ? + ? ???? ?(?, ?)
¦Ò ? ??(?, ?)
1 + ??(?, ?)
? ?? ??????? ???? ?? ???? 0?? ??
? ???? ??/?? ???. ??? ??? ??? ??
? ??? ??? ?? ??? ?? ?? ??? APV-MCTS? ???? ??.
4/28/2016 ??? ???? 3? ? ??? 44
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??.
? ?????? ¡°?? ??¡± ??? ??? ????? ??????
? ? ?, ? + ? ???? ?(?, ?)
¦Ò ? ? ?(?,?)
1+? ?(?,?)
? ????? ???
? ? ?, ? ? ????? ??? ?? ???!
? ??? ???? ??? ??, ???? ??? ??? ??? APV-MCTS?
????? ???? ???? ?? ????? ???? ??
4/28/2016 ??? ???? 3? ? ??? 45
???? ??? ???
? ??? ??? ??? ??
? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??.
? ¡°??¡±? ???
? ?? ??? ?? ? ??? ??? ?? ?? ?? ???
? ?? ??? ???? ?? ?? ?? ?????? 10% ????
? AlphaGo resigns
? ?, ?? ??? ? ??? ??? ???? ???? ???.
max
?
? ? ?, ? = ? ? ?, ? < ?0.8
4/28/2016 ??? ???? 3? ? ??? 46
??
? ???? ??
? ??? ?????? ??
? ??? S/W? ??? ???
? ??? S/W? ?? ? ?????
? ??? S/W? ???
? ???? ???
4/28/2016 ??? ???? 3? ? ??? 47
???? ?? ? ?????
? ???? ???? ??? ???? ???????
4/28/2016 ??? ???? 3? ? ??? 48
???? ?? ? ?????
? ???? ???? ??? ???? ???????
? ?? ¡°?? ? ?????¡± ??? ?? ??:
? ??? ???? ??? ??? ?? ???? ??? ??????
? ?, ??? ??? (??? ??? 1-2??? ?? ??????),
? ?????? ?? ???? ???? ?? ??? ?????
4/28/2016 ??? ???? 3? ? ??? 49
???? ?? ? ?????
? ???? ???? ??? ???? ???????
? ?? ¡°?? ? ?????¡± ??? ?? ??:
? ??? ???? ??? ??? ?? ???? ??? ??????
? ?, ??? ??? (??? ??? 1-2??? ?? ??????),
? ?????? ?? ???? ???? ?? ??? ?????
? ?? ???? ??? ????
1. ??? ? ?(?|?)? ?? ??? ????
2. ??? ? ?(?|?)? ?? ??? ????
3. ??? ? ?(?)? ?? ??? ????
4/28/2016 ??? ???? 3? ? ??? 50
???? ?? ? ?????
1. ??? ? ?(?|?)? ?? ??? ????
? ???
? KGS ??
? 160,000 ?? ???? ? 3?? ? (2940??) ? ¡°????¡±
? KGS 6-9? ??? ?? ?????? ??? ??
? ? ??? ? 35.4%? ???
? ¡°????¡±??, ??? ?? ? ??? ? ? ??? ?? ?? ?? ??? (?, ?)
4/28/2016 ??? ???? 3? ? ??? 51
???? ?? ? ?????
1. ??? ? ?(?|?)? ?? ??? ????
? ??? ????
? KGS ??
? 2940?? ? ¡°????¡± (?, ?)
? ? ¡°????¡±? ???
? ???, ??? ??? ??? ??? ??: ?? ?
? 1?? ??? 8?? ???
? ? ¡°????¡± ??? feature? ?? ??
? 47?? binary feature
4/28/2016 ??? ???? 3? ? ??? 52
???? ?? ? ?????
1. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
? ????? ??? ??? ? 100??? test set, ???? training set
? Training set??
? ???? ? ?? ?? ??? ????, minibatch ??: ? ?, ? ?
?=1
?
? Minibatch ??, ?? ?? ???? ?? ??
¦¤? =
?
?
?
?=1
?
? log ? ? ? ?
|? ?
??
4/28/2016 ??? ???? 3? ? ??? 53
???? ?? ? ?????
1. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
¦¤? =
?
?
?
?=1
?
? log ? ? ? ?
|? ?
??
? ? = 0.003?? ??, ? 8??? ¦¤? ?????? ???? ????
? ? = 16
? ???? 100??? ? ??? ?????? ?? gradient?(¦¤?)? ??
? Deep Q Network? ????? ???. ????: [??]
4/28/2016 ??? ???? 3? ? ??? 54
???? ?? ? ?????
1. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
¦¤? =
?
?
?
?=1
?
? log ? ? ? ?
|? ?
??
? GPU 50? ??, 3?? ?? 3?4?? ???? ??, ??.
? ????? ?? ???? ? ? ? ? ?? ??
4/28/2016 ??? ???? 3? ? ??? 55
???? ?? ? ?????
2. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
? ?? 10000 ??, ? ???? ? ?? (? = 128)
? ? ????, ??? ??? ? ?
??? ??? ?? ?? ?? ??
?
? ??
?? ???? ?? (?1
?
, ?1
?
, ?2
?
, ¡­ , ? ? ?
?
)? ????
? ? ???? ???? ?? ??? ?? ????
¦¤? =
?
?
?
?=1
?
?
?=1
? ?
? log ? ? ? ?
?
|??
?
??
??
?
? ?(??
?
)
4/28/2016 ??? ???? 3? ? ??? 56
???? ?? ? ?????
2. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
¦¤? =
?
?
?
?=1
?
?
?=1
? ?
? log ? ? ? ?
?
|??
?
??
??
?
? ?(??
?
)
? 1st pass?? ? ? = 0 ??. 2nd pass?? ? ? = ? ? ? ??.
? ?? ??? ?? ?? (? ??? ????? ??)
4/28/2016 ??? ???? 3? ? ??? 57
???? ?? ? ?????
2. ??? ? ?(?|?)? ?? ??? ????
? ???? ??
? ? 1?? ????? ??? ? ???? ??
? 2?? ????? ?? ?? ??? ? ?? ?? ????? ??
? ?? ??? ? ?
? ?? ???? ???? ??? ? ??
? 10000???? ???? ????? ?????? ? ?(?|?)? ?? ??
? 50?? GPU? ??, 1?? ???
4/28/2016 ??? ???? 3? ? ??? 58
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ??? ????
? ??: 3???? ??? ?? ? ? ??? ???? ? ??? ?, ? ??
? ?? ?? ??
? ? ??? 3?? ?? ??, ?? ? ???
? ? ???? ? ? ??? ?? ? ? ???
4/28/2016 ??? ???? 3? ? ??? 59
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ??? ????
? 3?? ?? ??
? ?? ??? 1~480 ??? ? ?? ?¡ä? ???? ??
? ? ? ???? ? ?? ??
? ? ?? ??? ???? ???? ?
? ?? ??? 1~391 ??? ? ?? ?¡ä¡ä? ???? ??
? ? ??? ?? ?, ?¡ä¡ä ? ?? ??? ?? ???? ??? ??
? ? ??? ? ?? ???? ?? ???? ??
? ?? ???? ??? ???? ??/?? ??? ?? ??
4/28/2016 ??? ???? 3? ? ??? 60
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ???? ??
? 3???? ??? ?? ? ? ??? ???? ? ??? ?, ? ??
? ? ??? 3?? ?? ??, ?? ? ???
? ? ???? ? ? ??? ?? ? ? ???
? ? 100??? test set??, ??? 2900??? training set?? ??
4/28/2016 ??? ???? 3? ? ??? 61
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ???? ??
? 3???? ??? ?, ? ? ???? ??
? ? 100??? test set??, ??? 2900??? training set?? ??
? ??? ?? ?? ????
¦¤? =
?
?
?
?=1
?
? ? ? ? ? ? ?
?? ? ? ?
??
4/28/2016 ??? ???? 3? ? ??? 62
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ???? ??
¦¤? =
?
?
?
?=1
?
? ? ? ? ? ? ?
?? ? ? ?
??
? ? = 0.003?? ??, ? 8??? ¦¤? ?????? ???? ????
? ? = 32
? ???? 100??? ? ??? ?????? ?? gradient?(¦¤?)? ??
4/28/2016 ??? ???? 3? ? ??? 63
???? ?? ? ?????
3. ??? ? ?(?)? ?? ??? ????
? ???? ??
¦¤? =
?
?
?
?=1
?
? ? ? ? ? ? ?
?? ? ? ?
??
? GPU 50? ??, 1?? ?? 5?? ???? ??, ??.
? ????? ?? ???? ? ?(?)?? ??
4/28/2016 ??? ???? 3? ? ??? 64
???? ?? ? ?????
? ???? ??? ?? ???? ??? ???
?? ?????? ???? ???? ??????
1. ??? ? ?(?|?)? ?? ??? ????
2. ??? ? ?(?|?)? ?? ??? ????
3. ??? ? ?(?)? ?? ??? ????
? ? ????? ??? ?? ? ??? ?????
? ??? ??? ?? ? ???? ??? ???? ?? ??!
? ? ?? ?? ????? ??????
? donghun2014@gmail.com
4/28/2016 ??? ???? 3? ? ??? 65
??
? ???? ??
? ??? ?????? ??
? ??? S/W? ??? ???
? ??? S/W? ?? ? ?????
? ??? S/W? ???
? ???? ???
4/28/2016 ??? ???? 3? ? ??? 66
???? ???
4/28/2016 ??? ???? 3? ? ??? 67
???? ??? (??????!)
? ?? ????? ??? ???? ????
4/28/2016 ??? ???? 3? ? ??? 68
???? ??? (??????!)
? ?? ????? ??? ???? ????
? ??? ????? ???? ???? ?? ?? ? ??? ???..
? ??? ???? ??? ???? ???? ??? ??? ????
? ??? ?? ? ???? ????? ??? ???????
? ???? donghun2014@gmail.com ?? ??????!
4/28/2016 ??? ???? 3? ? ??? 69
????
? ¡°??? ????¡± 1, 2, 3??? ??? ??? ??? ????
? 1? [??]
? ???? ??
? ??? ?????? ?? (??? ??? ??)
? 2? [??]
? ??? ?????? ?? (??? ??)
? 3?
? ??? S/W? ??? ???
? ??? S/W? ?? ? ?????
? ???? ¡°??? ????¡±? 3???? ??????
? ??? ??? ?? ?? ??? ????? ??? ? ? ??? ????
4/28/2016 ??? ???? 3? ? ??? 70
????
? ????? ???????!
? ???? ???? ???? ?? ?? ???? ???
?? ??? ??????
? donghun2014@gmail.com
4/28/2016 ??? ???? 3? ? ??? 71

More Related Content

What's hot (20)

???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
???? ???? DQN?? (Reinforcement Learning from Basics to DQN)???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
Curt Park
?
?? ???? SVM(?, ???? ????)
?? ???? SVM(?, ???? ????)?? ???? SVM(?, ???? ????)
?? ???? SVM(?, ???? ????)
SANG WON PARK
?
???? ????? ??? Part 2
???? ????? ??? Part 2???? ????? ??? Part 2
???? ????? ??? Part 2
Dongmin Lee
?
Suphx: Mastering Mahjong with Deep Reinforcement Learning
Suphx: Mastering Mahjong with Deep Reinforcement LearningSuphx: Mastering Mahjong with Deep Reinforcement Learning
Suphx: Mastering Mahjong with Deep Reinforcement Learning
harmonylab
?
????? ??? Part 1
????? ??? Part 1????? ??? Part 1
????? ??? Part 1
Dongmin Lee
?
A Multi-Armed Bandit Framework For Recommendations at Netflix
A Multi-Armed Bandit Framework For Recommendations at NetflixA Multi-Armed Bandit Framework For Recommendations at Netflix
A Multi-Armed Bandit Framework For Recommendations at Netflix
Jaya Kawale
?
Google AlphaGo, ??? ??????
Google AlphaGo, ??? ??????Google AlphaGo, ??? ??????
Google AlphaGo, ??? ??????
Lee Ji Eun
?
Ç¿»¯Ñ§Ï°¤½¤Î3
Ç¿»¯Ñ§Ï°¤½¤Î3Ç¿»¯Ñ§Ï°¤½¤Î3
Ç¿»¯Ñ§Ï°¤½¤Î3
nishio
?
boosting ?? ?? (bagging vs boosting)
boosting ?? ?? (bagging vs boosting)boosting ?? ?? (bagging vs boosting)
boosting ?? ?? (bagging vs boosting)
SANG WON PARK
?
Guided policy search
Guided policy searchGuided policy search
Guided policy search
Jaehyeon Park
?
??? - ??? ??? ??
??? - ??? ??? ????? - ??? ??? ??
??? - ??? ??? ??
Hyungsoo Ryoo
?
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
WON JOON YOO
?
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4Õ¤狼¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
Motokawa Tetsuya
?
introduction to double deep Q-learning
introduction to double deep Q-learningintroduction to double deep Q-learning
introduction to double deep Q-learning
WEBFARMER. ltd.
?
Deep sets
Deep setsDeep sets
Deep sets
Tomohiro Takahashi
?
1???? GAN(Generative Adversarial Network) ?? ????
1???? GAN(Generative Adversarial Network) ?? ????1???? GAN(Generative Adversarial Network) ?? ????
1???? GAN(Generative Adversarial Network) ?? ????
NAVER Engineering
?
Introduction of Deep Reinforcement Learning
Introduction of Deep Reinforcement LearningIntroduction of Deep Reinforcement Learning
Introduction of Deep Reinforcement Learning
NAVER Engineering
?
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
kyoto university
?
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
Retrieva inc.
?
AI and Deep Learning
AI and Deep LearningAI and Deep Learning
AI and Deep Learning
Manoj Kumar
?
???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
???? ???? DQN?? (Reinforcement Learning from Basics to DQN)???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
???? ???? DQN?? (Reinforcement Learning from Basics to DQN)
Curt Park
?
?? ???? SVM(?, ???? ????)
?? ???? SVM(?, ???? ????)?? ???? SVM(?, ???? ????)
?? ???? SVM(?, ???? ????)
SANG WON PARK
?
???? ????? ??? Part 2
???? ????? ??? Part 2???? ????? ??? Part 2
???? ????? ??? Part 2
Dongmin Lee
?
Suphx: Mastering Mahjong with Deep Reinforcement Learning
Suphx: Mastering Mahjong with Deep Reinforcement LearningSuphx: Mastering Mahjong with Deep Reinforcement Learning
Suphx: Mastering Mahjong with Deep Reinforcement Learning
harmonylab
?
A Multi-Armed Bandit Framework For Recommendations at Netflix
A Multi-Armed Bandit Framework For Recommendations at NetflixA Multi-Armed Bandit Framework For Recommendations at Netflix
A Multi-Armed Bandit Framework For Recommendations at Netflix
Jaya Kawale
?
Google AlphaGo, ??? ??????
Google AlphaGo, ??? ??????Google AlphaGo, ??? ??????
Google AlphaGo, ??? ??????
Lee Ji Eun
?
Ç¿»¯Ñ§Ï°¤½¤Î3
Ç¿»¯Ñ§Ï°¤½¤Î3Ç¿»¯Ñ§Ï°¤½¤Î3
Ç¿»¯Ñ§Ï°¤½¤Î3
nishio
?
boosting ?? ?? (bagging vs boosting)
boosting ?? ?? (bagging vs boosting)boosting ?? ?? (bagging vs boosting)
boosting ?? ?? (bagging vs boosting)
SANG WON PARK
?
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
? ?? ??? ??? ??? ?? ?????. (Deep Learning for Natural Language Processing)
WON JOON YOO
?
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4Õ¤狼¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
¤ï¤«¤ê¤ä¤¹¤¤¥Ñ¥¿©`¥óÕJ×R 4ÕÂ
Motokawa Tetsuya
?
introduction to double deep Q-learning
introduction to double deep Q-learningintroduction to double deep Q-learning
introduction to double deep Q-learning
WEBFARMER. ltd.
?
1???? GAN(Generative Adversarial Network) ?? ????
1???? GAN(Generative Adversarial Network) ?? ????1???? GAN(Generative Adversarial Network) ?? ????
1???? GAN(Generative Adversarial Network) ?? ????
NAVER Engineering
?
Introduction of Deep Reinforcement Learning
Introduction of Deep Reinforcement LearningIntroduction of Deep Reinforcement Learning
Introduction of Deep Reinforcement Learning
NAVER Engineering
?
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
KMC ¸‚¼¼¥×¥í¥°¥é¥ß¥ó¥°¾šÁ•»á Advanced µÚ3»Ø ¤Õ¤í©`
kyoto university
?
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
¥Õ?©`¥¹¥Æ¥£¥ó¥¯?ÈëÃÅ
Retrieva inc.
?
AI and Deep Learning
AI and Deep LearningAI and Deep Learning
AI and Deep Learning
Manoj Kumar
?

Viewers also liked (20)

Concurrent Programming (Java thread ???)
Concurrent Programming (Java thread ???)Concurrent Programming (Java thread ???)
Concurrent Programming (Java thread ???)
JungGeun Lee
?
STRONG KOREA 20130609
STRONG KOREA 20130609STRONG KOREA 20130609
STRONG KOREA 20130609
Leo Kim
?
?? ??? ??? ??
?? ??? ??? ???? ??? ??? ??
?? ??? ??? ??
Joon Kim
?
20160409 microsoft ??? ?????? ????
20160409 microsoft ??? ?????? ????20160409 microsoft ??? ?????? ????
20160409 microsoft ??? ?????? ????
JungGeun Lee
?
4?????
4?????4?????
4?????
SK(?) C&C - ???
?
?? ??? ??#3 (???)
?? ??? ??#3 (???)?? ??? ??#3 (???)
?? ??? ??#3 (???)
Ant House
?
1???? smart education
1???? smart education1???? smart education
1???? smart education
Jaechoon Jo
?
????? 16 trix
????? 16 trix????? 16 trix
????? 16 trix
Ant House
?
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ???? [BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
BIZ+
?
????? ??? ???
????? ??? ???????? ??? ???
????? ??? ???
SK(?) C&C - ???
?
[???] Neural Architecture Search with Reinforcement Learning
[???] Neural Architecture Search with Reinforcement Learning[???] Neural Architecture Search with Reinforcement Learning
[???] Neural Architecture Search with Reinforcement Learning
Kiho Suh
?
Machine Learning Foundations (a case study approach) ?? ??
Machine Learning Foundations (a case study approach) ?? ??Machine Learning Foundations (a case study approach) ?? ??
Machine Learning Foundations (a case study approach) ?? ??
SANG WON PARK
?
??? ????: Undirencted Graphical Model
??? ????: Undirencted Graphical Model??? ????: Undirencted Graphical Model
??? ????: Undirencted Graphical Model
Jungkyu Lee
?
Reinforcement learning v0.5
Reinforcement learning v0.5Reinforcement learning v0.5
Reinforcement learning v0.5
SANG WON PARK
?
????? ?? ???
????? ?? ???????? ?? ???
????? ?? ???
SK(?) C&C - ???
?
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
Kiho Suh
?
????? ??? ???? ?? ???
????? ??? ???? ?? ???????? ??? ???? ?? ???
????? ??? ???? ?? ???
?? ?
?
??????? ?????? ????????
??????? ?????? ??????????????? ?????? ????????
??????? ?????? ????????
?? ?
?
?????16 sonar
?????16 sonar?????16 sonar
?????16 sonar
Ant House
?
?? ?? ?? Reinforcement Learning an introduction
?? ?? ?? Reinforcement Learning an introduction?? ?? ?? Reinforcement Learning an introduction
?? ?? ?? Reinforcement Learning an introduction
Taehoon Kim
?
Concurrent Programming (Java thread ???)
Concurrent Programming (Java thread ???)Concurrent Programming (Java thread ???)
Concurrent Programming (Java thread ???)
JungGeun Lee
?
STRONG KOREA 20130609
STRONG KOREA 20130609STRONG KOREA 20130609
STRONG KOREA 20130609
Leo Kim
?
?? ??? ??? ??
?? ??? ??? ???? ??? ??? ??
?? ??? ??? ??
Joon Kim
?
20160409 microsoft ??? ?????? ????
20160409 microsoft ??? ?????? ????20160409 microsoft ??? ?????? ????
20160409 microsoft ??? ?????? ????
JungGeun Lee
?
?? ??? ??#3 (???)
?? ??? ??#3 (???)?? ??? ??#3 (???)
?? ??? ??#3 (???)
Ant House
?
1???? smart education
1???? smart education1???? smart education
1???? smart education
Jaechoon Jo
?
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ???? [BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
[BIZ+005 ???? ??/?? ???] ? ??? ?? ???? ???? | ??? ????
BIZ+
?
[???] Neural Architecture Search with Reinforcement Learning
[???] Neural Architecture Search with Reinforcement Learning[???] Neural Architecture Search with Reinforcement Learning
[???] Neural Architecture Search with Reinforcement Learning
Kiho Suh
?
Machine Learning Foundations (a case study approach) ?? ??
Machine Learning Foundations (a case study approach) ?? ??Machine Learning Foundations (a case study approach) ?? ??
Machine Learning Foundations (a case study approach) ?? ??
SANG WON PARK
?
??? ????: Undirencted Graphical Model
??? ????: Undirencted Graphical Model??? ????: Undirencted Graphical Model
??? ????: Undirencted Graphical Model
Jungkyu Lee
?
Reinforcement learning v0.5
Reinforcement learning v0.5Reinforcement learning v0.5
Reinforcement learning v0.5
SANG WON PARK
?
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
[???] Multiagent Bidirectional- Coordinated Nets for Learning to Play StarCra...
Kiho Suh
?
????? ??? ???? ?? ???
????? ??? ???? ?? ???????? ??? ???? ?? ???
????? ??? ???? ?? ???
?? ?
?
??????? ?????? ????????
??????? ?????? ??????????????? ?????? ????????
??????? ?????? ????????
?? ?
?
?? ?? ?? Reinforcement Learning an introduction
?? ?? ?? Reinforcement Learning an introduction?? ?? ?? Reinforcement Learning an introduction
?? ?? ?? Reinforcement Learning an introduction
Taehoon Kim
?

Similar to ??? ???? 3? (20)

???? ???? ??? ???? ????
???? ???? ??? ???? ???????? ???? ??? ???? ????
???? ???? ??? ???? ????
Woong won Lee
?
Early stopping as nonparametric variational inference
Early stopping as nonparametric variational inferenceEarly stopping as nonparametric variational inference
Early stopping as nonparametric variational inference
taeseon ryu
?
????????? ????? ?????
????????? ????? ?????????????? ????? ?????
????????? ????? ?????
Euijin Jeong
?
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
Jaikwang Lee
?
?????? ????? ??? ?? ??? ????
?????? ????? ??? ?? ??? ?????????? ????? ??? ?? ??? ????
?????? ????? ??? ?? ??? ????
?? ?
?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
NAVER D2
?
Debugging with visual studio. ??? ????? ??? ???
Debugging with visual studio. ??? ????? ??? ???Debugging with visual studio. ??? ????? ??? ???
Debugging with visual studio. ??? ????? ??? ???
Kiyoung Moon
?
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
KyeongUkJang
?
??? ???
??? ?????? ???
??? ???
Donghun Lee
?
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning
?? ?
?
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
OpenStack Korea Community
?
? ?? ???? ??
? ?? ???? ??? ?? ???? ??
? ?? ???? ??
Dongyi Kim
?
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
Isaac Jeon
?
[215]????????????????????????????? ????????
[215]????????????????????????????? ????????[215]????????????????????????????? ????????
[215]????????????????????????????? ????????
NAVER D2
?
JVM Memory And GC Tuning Test
JVM Memory And GC Tuning Test JVM Memory And GC Tuning Test
JVM Memory And GC Tuning Test
?? ?
?
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
Hyojun Jeon
?
???? ?? ???? ??? ??? ??? AI ????
???? ?? ???? ??? ??? ??? AI ???????? ?? ???? ??? ??? ??? AI ????
???? ?? ???? ??? ??? ??? AI ????
NAVER D2
?
DL from scratch(6)
DL from scratch(6)DL from scratch(6)
DL from scratch(6)
Park Seong Hyeon
?
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???) ??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
Tae Young Lee
?
Pose Graph based SLAM
Pose Graph based SLAMPose Graph based SLAM
Pose Graph based SLAM
EdwardIm1
?
???? ???? ??? ???? ????
???? ???? ??? ???? ???????? ???? ??? ???? ????
???? ???? ??? ???? ????
Woong won Lee
?
Early stopping as nonparametric variational inference
Early stopping as nonparametric variational inferenceEarly stopping as nonparametric variational inference
Early stopping as nonparametric variational inference
taeseon ryu
?
????????? ????? ?????
????????? ????? ?????????????? ????? ?????
????????? ????? ?????
Euijin Jeong
?
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
???????? ?????????? Bigquery?? ???????? ????????? (20170215 T????)
Jaikwang Lee
?
?????? ????? ??? ?? ??? ????
?????? ????? ??? ?? ??? ?????????? ????? ??? ?? ??? ????
?????? ????? ??? ?? ??? ????
?? ?
?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
[2017 Incognito] ?? ?? ??? ?? ROP ??? ?? ?
NAVER D2
?
Debugging with visual studio. ??? ????? ??? ???
Debugging with visual studio. ??? ????? ??? ???Debugging with visual studio. ??? ????? ??? ???
Debugging with visual studio. ??? ????? ??? ???
Kiyoung Moon
?
Chapter 11 Practical Methodology
Chapter 11 Practical MethodologyChapter 11 Practical Methodology
Chapter 11 Practical Methodology
KyeongUkJang
?
Imagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement LearningImagination-Augmented Agents for Deep Reinforcement Learning
Imagination-Augmented Agents for Deep Reinforcement Learning
?? ?
?
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
[OpenInfra Days Korea 2018] Day 2 - E1: ???? - OpenStack ???
OpenStack Korea Community
?
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
NDC 2018 ?! ???? ?? ??? ???? ???? ???? - ??, ?????, ??? ????
Isaac Jeon
?
[215]????????????????????????????? ????????
[215]????????????????????????????? ????????[215]????????????????????????????? ????????
[215]????????????????????????????? ????????
NAVER D2
?
JVM Memory And GC Tuning Test
JVM Memory And GC Tuning Test JVM Memory And GC Tuning Test
JVM Memory And GC Tuning Test
?? ?
?
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
[NDC18] ??? ? ???? ??? ????? ???: ?? ??? ?? ?? ??
Hyojun Jeon
?
???? ?? ???? ??? ??? ??? AI ????
???? ?? ???? ??? ??? ??? AI ???????? ?? ???? ??? ??? ??? AI ????
???? ?? ???? ??? ??? ??? AI ????
NAVER D2
?
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???) ??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
??? ????? ??1 - ???? ?? ?????, ?????? (2020? ???)
Tae Young Lee
?
Pose Graph based SLAM
Pose Graph based SLAMPose Graph based SLAM
Pose Graph based SLAM
EdwardIm1
?

??? ???? 3?

  • 2. ??? ????? ? ??? ???? 1?, 2??? ???? ?????? ? ?? ???? ???? ??? ??? ?? ???? ?? ? ?????, ???, ???? ????? ????? ? ¡°?????? ?? ???¡±? ??????.. ? ??? ???? ¡°??¡± ??? ???? ??? 1. ??? ??? 2. ????? ?? ??? 4/28/2016 ??? ???? 3? ? ??? 2
  • 3. ???? ? ???? ?????? ??? ? ???? ?? ??? ???? ?! ??? ?????? ? donghun2014@gmail.com ? ??? ? ??? ? ??? ????? ????? ? ??? ???? ?? ????, ??? ???? ?? ??? ? ??? 4/28/2016 ??? ???? 3? ? ??? 3
  • 4. 2???? ???? ? ???? ?? ? ??? ?????? ?? ? ??? S/W ??: Deep Learning ?? ?? ? ??? S/W ??: Reinforcement Learning ?? ?? ? ??? S/W ??: Monte-Carlo Tree Search ?? ?? ? ??? S/W? ??? ??? ? ??? S/W? ?? ? ????? ? ??? S/W? ??? ? ???? ??? 4/28/2016 ??? ???? 3? ? ??? 4
  • 5. ?? ? ???? ?? ? ??? ?????? ?? ? ??? S/W? ??? ??? ? ??? S/W? ?? ? ????? ? ??? S/W? ??? ? ???? ??? 4/28/2016 ??? ???? 3? ? ??? 5
  • 6. ???? ??? ??? ? ??? ??? ????(reinforcement learning)? ?? ?????? ?? ???? ?? ??? ???? ? ??? ???? ??? ?? ? ¡°??¡±? ??? ???? ? ??? ?? ?? ? ?? ???? 4/28/2016 ??? ???? 3? ? ??? 6 ??? ???? ???? ??? ?? ?? ???? ??? ???
  • 7. ???? ??? ??? ? ??? ??? ????(reinforcement learning)? ?? ?????? ?? ???? ?? ??? ???? ? ??? ???? ??? ?? ? ¡°??¡±? ??? ???? ? ??? ?? ?? ? ?? ???? ? ¡°??¡±? ??? ???? 4/28/2016 ??? ???? 3? ? ??? 7 ??? ???? ???? ??? ?? ?? ???? ??? ???
  • 8. ???? ??? ??? ? ??? ??? ????(reinforcement learning)? ?? ?????? ?? ???? ?? ??? ???? ? ??? ???? ??? ?? ? ¡°??¡±? ??? ???? ? ??? ?? ?? ? ?? ???? ? ¡°??¡±? ??? ???? ? ¡°??¡±? ???? 4/28/2016 ??? ???? 3? ? ??? 8 ??? ???? ???? ??? ?? ?? ???? ??? ???
  • 9. ???? ??? ??? ? ??? ??? ????(reinforcement learning)? ?? ?????? ?? ???? ?? ??? ???? ? ??? ???? ??? ?? ? ¡°??¡±? ??? ???? ? ??? ?? ?? ? ?? ???? ? ¡°??¡±? ??? ???? ? ¡°??¡±? ???? ? ????? ???? 4/28/2016 ??? ???? 3? ? ??? 9 ??? ???? ???? ??? ?? ?? ???? ??? ???
  • 10. ???? ??? ??? ? ??? ??? ????(reinforcement learning)? ?? ?????? ?? ???? ?? ??? ???? ? ??? ???? ??? ?? ? ¡°??¡±? ??? ???? ? ??? ?? ?? ? ?? ???? ? ¡°??¡±? ??? ???? ? ¡°??¡±? ???? ? ????? ???? ? ?? ???? ¡°??¡±? ? ?? ????.. 4/28/2016 ??? ???? 3? ? ??? 10 ??? ???? ???? ??? ?? ?? ???? ??? ???
  • 11. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? 4/28/2016 ??? ???? 3? ? ??? 11
  • 12. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? 1. ?? ??? ???? 2. ?? ?????? ?? ??? 3. ? ? ?? ?? ??? ??? ???? 4/28/2016 ??? ???? 3? ? ??? 12
  • 13. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? 1. ?? ??? ???? 2. ?? ?????? ?? ??? 3. ? ? ?? ?? ??? ??? ???? ? ?? ?? ??? ??? ??? ????, ?? ?????? ??? ¡°?¡±???? ??? ??! ? Asynchronous Policy and Value MCTS (APV-MCTS) ???? 4/28/2016 ??? ???? 3? ? ??? 13
  • 14. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? ? Asynchronous Policy and Value MCTS (APV-MCTS) ???? ? ??? ?? ?? ??? ????? ????? ?? ? ????? ????? master node?? ?? ? ????? slave node?? ??? ????? ?? 4/28/2016 ??? ???? 3? ? ??? 14
  • 15. ???? ??? ??? ? ??? ??: s ? Policy network? value network? ??? ? input? (??? ??) ? ???? 19x19 ? ?(?)?? ?? ?/?/?? ? ???, ? ?(?)? ??? ? ?? ?? 1 (¡°? ? ??? ??¡±? ???) ? ?? ???, ? ? ?? ???? (?? 1, ?? 8) (??8? binary array) ? ??? ?? ?? ??? ???? (?? 1, ?? 8) ? ??? ?? ???? ?? ?? ?? ? (?? 1, ?? 8) ? ?? ?? ????, ??? ? ?? ??? ??? ??? ? ?? ??? (?? 1, ?? 8) ? ?? ?? ????, ? ?? ??? ?? ??? ? ?? ?? (?? 1, ?? 8) ? ?? ?? ????, ?? ?? ???? ???? ? ?? ?? ????, ?? ?? ????? ???? ? ?? ???? ??? ??? ????? ? ?? ???? ???? (?? Value Network (????) ?? ????) 4/28/2016 ??? ???? 3? ? ??? 15
  • 16. ???? ??? ??? ? ??? ?? s (19x19x48) tensor? ??? ??, ? ???? ? ???? ????? ? APV-MCTS? ????? ? ?? ??? ?? s? ?? node? ?? 4/28/2016 ??? ???? 3? ? ??? 16
  • 17. ???? ??? ??? ? ??? ?? s (19x19x48) tensor? ??? ??, ? ???? ? ???? ????? ? APV-MCTS? ????? ? ?? ??? ?? s? ?? node? ?? ? ???? ? ?? ?? ???? node??? ? ??? on-demand? ?? ? ?? ? ? node ??? ? ? ?? ??? ???? a? ???, (s,a)? ????? ???? ? ? (s,a)? ??? ?? ??? ????? ?? (??? ??? 2? MCTS ?? ??) ? ? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? , ? ?, ? 4/28/2016 ??? ???? 3? ? ??? 17
  • 18. ???? ??? ??? ? APV-MCTS 1??: ¡°Search¡± ? ??: ?? ????? s? ???? ???? node s?? ????, ??? ???? ????? ?? ??? ?? ? ? ????? ?? ??? ?? ??? ?? ?? 4/28/2016 ??? ???? 3? ? ??? 18
  • 19. ???? ??? ??? ? APV-MCTS 1??: ¡°Search¡± ? ??: ?? ????? s? ???? ???? node s?? ????, ??? ???? ????? ?? ??? ?? ? ? ????? ?? ??? ?? ??? ?? ?? ? ???? node s??, ??? ?? ???? a?? ???? ?? ? ??? ?? (s,a)? ??? ??? ??, ???? ?? ?? a??: ? ?, ? + ? ???? ?(?, ?) ¦Ò ? ??(?, ?) 1 + ??(?, ?) ? ? ???? = ? ? ??? (??: 50 ? 5. ????? ????? ???? ???? ??????) ? ¦Ò ? ??(?, ?) ? ??? ¡°??? ?? ??¡± ?? roll-out?? ???? ??? ? ? Roll-out? ??? search 2?? ¡°Expansion¡±?? ?? 4/28/2016 ??? ???? 3? ? ??? 19
  • 20. ???? ??? ??? ? APV-MCTS 1??: ¡°Search¡± ? ??? ?? (s,a)? ??? ??? ??, ???? ?? ?? a??: ? ?, ? + ? ???? ?(?, ?) ¦Ò ? ??(?, ?) 1 + ??(?, ?) ? ? ?, ? : ? ??? ?? s??, ?? a? ??, ??? ???? ??? ? ?(?, ?) ¦Ò ? ? ?(?,?) 1+? ?(?,?) : ? ??? ?? s??, ? ? ?? ?? a? ???? ??? ? ¦Ò ? ??(?, ?) ? ??? ¡°??? ?? ??¡± ?? roll-out?? ???? ??? ? ? Roll-out? ????? APV-MCTS ?? ???? ? ??? ? ? ???? = 5 ? ??? (? ???? ???? ??? ??? ??) 4/28/2016 ??? ???? 3? ? ??? 20
  • 21. ???? ??? ??? ? APV-MCTS 1??: ¡°Search¡± ? ??: ?? ????? s? ???? ???? node s?? ????, ??? ???? ????? ?? ??? ?? ? ? ????? ?? ??? ?? ??? ?? ?? ? s?? ?? a? ????, ?? ??? ??? ??? ? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????: ?? ?, ? = ?? ?, ? + ? ?? ?? ?, ? = ?? ?, ? ? ? ?? ? ? ?? = 3?? ?? ? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ??? ?????¡±? ????? ???? ? ???????? ???, ?? ????? ???? ?? ???? ??? ?? 4/28/2016 ??? ???? 3? ? ??? 21
  • 22. ???? ??? ??? ? APV-MCTS 1??: ¡°Search¡± ? ??: ?? ????? s? ???? ???? node s?? ????, ??? ???? ????? ?? ??? ?? ? ? ????? ?? ??? ?? ??? ?? ?? ? s?? ?? a? ????, ?? ??? ??? ??? ? ??? ?? ??? ?? ??? s? ????, ??? ? ???? ??, ?? ? ?? s? ??? ? ???? ??? ?? ???? ????? ??? ?? ??? ?? ? ??? ?? ??? ?? ??. 4/28/2016 ??? ???? 3? ? ??? 22
  • 23. ???? ??? ??? ? APV-MCTS 2??: ¡°Evaluation¡± ? ??: ?? ???? ????? ?? ???? ??? node ? ???, ?? ???? ??? ??? ?? ????? ???? ? ? ???? ??? 2?? ???? ? 1. ??? ?? 2. Roll-out ????? ?? 4/28/2016 ??? ???? 3? ? ??? 23
  • 24. ???? ??? ??? ? APV-MCTS 2??: ¡°Evaluation¡± ? Value network (???: ?? ?? ?? ???? ??? ??) ???: ? ??? ??? ? (??? ?) ? ???? (?/? ???) ? ??? ? ?, ??? ?? ?? ?? ???, ???? queue? ???? ? ? ??, ? ? ??? ? ?? ?? ??? ???? ?? ?? ??? ? ?? memoize ? ??? ???? ?? ? ??? ? ??? ?? ???? (4??: ¡°Expansion¡±?? ??) ?? call ? Call?? ???? ??. ?? call? ???? ??? ???? ??? ? ????? ???? evaluation??? GPU ???? ?? ?? 4/28/2016 ??? ???? 3? ? ??? 24
  • 25. ???? ??? ??? ? APV-MCTS 2??: ¡°Evaluation¡± ? Roll-out ????? ?? ??? ? Roll-out policy?? ??? ??? ?? ? ?? ??? ???? ????? ? ? ??? ??? ?????? ???? Policy network (???)?? ? 1000? ??? ?? ? ???? ??? (???: ?? 0.003? vs Roll-out: ?? 0.000002?) ? Roll-out? ?? ??? ??? node? ? ????? ?? ? Roll-out policy? ???? ?? ?? ?? ????? ?? ? ?? ????? ?????? ?? ?? ? ???? ???, ? ??? ??, ??? +1, ??? -1? ???? ?? ? ?, ? ??? ???? ??? ??? ??? ?????? ?????? ?? ? ?? ????? ???? ?? ?? ??? ¡°Backup¡±???? ?? 4/28/2016 ??? ???? 3? ? ??? 25
  • 26. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??: ??? ??? Roll-out ???? ??? ??? Value network ?? ???? ?? ??? ??? ?? ????? ???? 4/28/2016 ??? ???? 3? ? ??? 26
  • 27. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ¡°Search¡±???? ? ?? ?????:: ? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????: ?? ?, ? = ?? ?, ? + ? ?? ?? ?, ? = ?? ?, ? ? ? ?? ? ? ?? = 3?? ?? ? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ??? ?????¡±? ????? ???? ? ???????? ???, ?? ????? ???? ?? ???? ??? ?? 4/28/2016 ??? ???? 3? ? ??? 27
  • 28. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ¡°Search¡±???? ? ?? ?????:: ? ??? (?, ?)? ?? ????? ?? ??? ??? ?, ??? ?? ?? ????: ?? ?, ? = ?? ?, ? + ? ?? ?? ?, ? = ?? ?, ? ? ? ?? ? ? ?? = 3?? ?? ? ????? ??? ??? ??, ¡°? ??? ?? 3? ? ??? 3? ? ? ??? ?????¡±? ????? ???? ? ???????? ???, ?? ????? ???? ?? ???? ??? ?? ? ?? ?????? Evaluation? ?? ????, ??? ?? ?, ? , ??(?, ?)? ????? ?? 4/28/2016 ??? ???? 3? ? ??? 28
  • 29. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??? ?? ?, ? , ??(?, ?)? ????? ?? ? ?? ?? +1, ??? ?? ??? ??? ???? ? 4/28/2016 ??? ???? 3? ? ??? 29
  • 30. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??? ?? ?, ? , ??(?, ?)? ????? ?? ? ?? ?? +1, ??? ?? ??? ??? ???? ? ? ?? ??? ??? ?????? ??? ?? ?, ? ?? ????? ? ?? Search?? ??? ?? ????????, ?? ?, ? = ?? ?, ? + ? ?? ?? ?, ? = ?? ?, ? ? ? ?? ? ?? ??? ??? ???, ??? ? ??? ??? ?? ?????? ?? ?, ? = ?? ?, ? ? ? ?? + 1 ?? ?, ? = ?? ?, ? + ? ?? + ?? 4/28/2016 ??? ???? 3? ? ??? 30
  • 31. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??? ?? ?, ? , ??(?, ?)? ????? ?? ? ?? ?? +1, ??? ?? ??? ??? ???? ? ? ?? ??? ??? ?????? ??? ?? ?, ? ?? ????? ? ?? ?, ? , ?? ?, ? ?? Evaluation??? ??? ????? ??????. 4/28/2016 ??? ???? 3? ? ??? 31
  • 32. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??? ?? ?, ? , ??(?, ?)? ????? ?? ? ?? ?? +1, ??? ?? ??? ??? ???? ? ? ?? ??? ??? ?????? ??? ?? ?, ? ?? ????? ? ?? ?, ? , ?? ?, ? ?? Evaluation??? ??? ????? ??????. ? ?? ?, ? , ?? ?, ? , ?? ?, ? , ?? ?, ? ? ???? ?(?, ?) ?? ?????? ? ?, ? = 1 ? ? ?? ?, ? ?? ?, ? + ? ?? ?, ? ?? ?, ? 4/28/2016 ??? ???? 3? ? ??? 32
  • 33. ???? ??? ??? ? APV-MCTS 3??: ¡°Backup¡± ? ??? ?? ?, ? , ??(?, ?)? ????? ?? ? ?? ?? +1, ??? ?? ??? ??? ???? ? ? ?? ??? ??? ?????? ??? ?? ?, ? ?? ????? ? ?? ????? ?????? ? Lock-free update: ?? ?? memory space? ???? ??? ??? ?? ? ???? ??? ??, ???? ???, ????? ???? ???? [??] 4/28/2016 ??? ???? 3? ? ??? 33
  • 34. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ??? ?? (?, ?)? ??? ?? ????, ? ??? ???? ??? ?? ?¡ä? ???? ????? ????? ?? ? ????: ?? ?, ? > ? ??? ? ? ???? ???? ??????? GPU ??? ????? ??? ???? ?? 4/28/2016 ??? ???? 3? ? ??? 34
  • 35. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ??? ?? (?, ?)? ??? ?? ????, ? ??? ???? ??? ?? ?¡ä? ???? ????? ????? ?? ? ????: ?? ?, ? > ? ??? ? ? ???? ???? ??????? GPU ??? ????? ??? ???? ?? ? ?? ?¡ä? initialization? ??? ??. ?? ?¡ä, ? = 0, ?? ?¡ä, ? = 0 ?? ?¡ä, ? = 0, ?? ?¡ä, ? = 0 ? ?¡ä , ? = ?? ? ?¡ä ? ?? ? ?¡ä ? tree policy. Roll-out policy?? ?? ? ????? ?? ???. ? ?(?¡ä, ?)? ????? 0?? init?. 4/28/2016 ??? ???? 3? ? ??? 35
  • 36. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ?? ?¡ä? initialization?? ?? ?? ? ??? ???? ?? ?¡ä, ? , ?? ?¡ä, ? ???? ? ? ?¡ä , ? ?? ??? ???? ??? ???? ? Init???? ? ?? ? ?¡ä, ? = ?? ? ?¡ä ? ??? ? ??? ? ?¡ä, ? = ? ? ? ?¡ä ? ???????? ?? 4/28/2016 ??? ???? 3? ? ??? 36
  • 37. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ?? ?¡ä? initialization?? ?? ?? ? ??? ???? ?? ?¡ä, ? , ?? ?¡ä, ? ???? ? ? ?¡ä , ? ?? ??? ???? ??? ???? ? Init???? ? ?? ? ?¡ä, ? = ?? ? ?¡ä ? ??? ? ??? ? ?¡ä, ? = ? ? ? ?¡ä ? ???????? ?? ? ? ?????? ?????? ??? ? ???? ?? ?????. ???? ????? queue?? ? Init? ??? ??? ?? ??? ???? ???, ?????? ?? ??? ??? 4/28/2016 ??? ???? 3? ? ??? 37
  • 38. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ?? ??: GPU?? (???, ??? ?? ???) ? Init? ? ???? ????? ???, ?? ???? ??? ?? ???? ?? ? ????????, ? ????? ?? ?????? ??? ??? ??? 4/28/2016 ??? ???? 3? ? ??? 38
  • 39. ???? ??? ??? ? APV-MCTS 4??: ¡°Expansion¡± ? ?? ??: GPU?? (???, ??? ?? ???) ? Init? ? ???? ????? ???, ?? ???? ??? ?? ???? ?? ? ????????, ? ????? ?? ?????? ??? ??? ??? ? ?? ?? / latency?? ?? ? GPU?? ???? queue?? ???? expansion ??? ?? ? ? ???? ?? ?? ? Mini-batch? 1? ?? ? ?????? ???? ??? ? ? ???????, ?? latency??? ?? ?? ? ???? ?? ??? ??? ? ???? ???? ????? ??? 4/28/2016 ??? ???? 3? ? ??? 39
  • 40. ???? ??? ??? ? APV-MCTS ???? ?? 1. Search: ?? ??? ??? ???? ?? ???? 2. Evaluation: ?? ?? ??? ??(??? ??? ??)? ?? ?? 3. Backup: ??? ?? ?? ??? ?? 4. Expansion: ????? ?? ??? ?? ? ????? ??? ??? ???? ? ?? ???? ???? ???? ???? ????? ?? ?? ? ??? 9?? ??? ??? ?? ???? ?? 4/28/2016 ??? ???? 3? ? ??? 40
  • 41. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? 1. ?? ??? ???? 2. ?? ?????? ?? ??? (APV-MCTS) 3. ? ? ?? ?? ??? ??? ???? 4/28/2016 ??? ???? 3? ? ??? 41
  • 42. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ??? ?????? 1. ?? ??? ???? 2. ?? ?????? ?? ??? (APV-MCTS) 3. ? ? ?? ?? ??? ??? ???? ? ?????? ¡°?? ??¡± ??? ??? ???? ?? ??? 4/28/2016 ??? ???? 3? ? ??? 42
  • 43. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??. ? ?????? ¡°?? ??¡± ??? ??? ???? ?? ??? ? Search????, ?? ?? ????? ??? ?? ?? ? ?, ? + ? ???? ?(?, ?) ¦Ò ? ??(?, ?) 1 + ??(?, ?) ? ?? ??????? ???? ?? ???? 0?? ?? ? ???? ??/?? ???. ??? ??? ??? ?? 4/28/2016 ??? ???? 3? ? ??? 43
  • 44. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??. ? ?????? ¡°?? ??¡± ??? ??? ???? ?? ??? ? Search????, ?? ?? ????? ??? ?? ?? ? ?, ? + ? ???? ?(?, ?) ¦Ò ? ??(?, ?) 1 + ??(?, ?) ? ?? ??????? ???? ?? ???? 0?? ?? ? ???? ??/?? ???. ??? ??? ??? ?? ? ??? ??? ?? ??? ?? ?? ??? APV-MCTS? ???? ??. 4/28/2016 ??? ???? 3? ? ??? 44
  • 45. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??. ? ?????? ¡°?? ??¡± ??? ??? ????? ?????? ? ? ?, ? + ? ???? ?(?, ?) ¦Ò ? ? ?(?,?) 1+? ?(?,?) ? ????? ??? ? ? ?, ? ? ????? ??? ?? ???! ? ??? ???? ??? ??, ???? ??? ??? ??? APV-MCTS? ????? ???? ???? ?? ????? ???? ?? 4/28/2016 ??? ???? 3? ? ??? 45
  • 46. ???? ??? ??? ? ??? ??? ??? ?? ? ?? ? ??? ???? APV-MCTS?? ?? ?? ?? ?? ??. ? ¡°??¡±? ??? ? ?? ??? ?? ? ??? ??? ?? ?? ?? ??? ? ?? ??? ???? ?? ?? ?? ?????? 10% ???? ? AlphaGo resigns ? ?, ?? ??? ? ??? ??? ???? ???? ???. max ? ? ? ?, ? = ? ? ?, ? < ?0.8 4/28/2016 ??? ???? 3? ? ??? 46
  • 47. ?? ? ???? ?? ? ??? ?????? ?? ? ??? S/W? ??? ??? ? ??? S/W? ?? ? ????? ? ??? S/W? ??? ? ???? ??? 4/28/2016 ??? ???? 3? ? ??? 47
  • 48. ???? ?? ? ????? ? ???? ???? ??? ???? ??????? 4/28/2016 ??? ???? 3? ? ??? 48
  • 49. ???? ?? ? ????? ? ???? ???? ??? ???? ??????? ? ?? ¡°?? ? ?????¡± ??? ?? ??: ? ??? ???? ??? ??? ?? ???? ??? ?????? ? ?, ??? ??? (??? ??? 1-2??? ?? ??????), ? ?????? ?? ???? ???? ?? ??? ????? 4/28/2016 ??? ???? 3? ? ??? 49
  • 50. ???? ?? ? ????? ? ???? ???? ??? ???? ??????? ? ?? ¡°?? ? ?????¡± ??? ?? ??: ? ??? ???? ??? ??? ?? ???? ??? ?????? ? ?, ??? ??? (??? ??? 1-2??? ?? ??????), ? ?????? ?? ???? ???? ?? ??? ????? ? ?? ???? ??? ???? 1. ??? ? ?(?|?)? ?? ??? ???? 2. ??? ? ?(?|?)? ?? ??? ???? 3. ??? ? ?(?)? ?? ??? ???? 4/28/2016 ??? ???? 3? ? ??? 50
  • 51. ???? ?? ? ????? 1. ??? ? ?(?|?)? ?? ??? ???? ? ??? ? KGS ?? ? 160,000 ?? ???? ? 3?? ? (2940??) ? ¡°????¡± ? KGS 6-9? ??? ?? ?????? ??? ?? ? ? ??? ? 35.4%? ??? ? ¡°????¡±??, ??? ?? ? ??? ? ? ??? ?? ?? ?? ??? (?, ?) 4/28/2016 ??? ???? 3? ? ??? 51
  • 52. ???? ?? ? ????? 1. ??? ? ?(?|?)? ?? ??? ???? ? ??? ???? ? KGS ?? ? 2940?? ? ¡°????¡± (?, ?) ? ? ¡°????¡±? ??? ? ???, ??? ??? ??? ??? ??: ?? ? ? 1?? ??? 8?? ??? ? ? ¡°????¡± ??? feature? ?? ?? ? 47?? binary feature 4/28/2016 ??? ???? 3? ? ??? 52
  • 53. ???? ?? ? ????? 1. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ? ????? ??? ??? ? 100??? test set, ???? training set ? Training set?? ? ???? ? ?? ?? ??? ????, minibatch ??: ? ?, ? ? ?=1 ? ? Minibatch ??, ?? ?? ???? ?? ?? ¦¤? = ? ? ? ?=1 ? ? log ? ? ? ? |? ? ?? 4/28/2016 ??? ???? 3? ? ??? 53
  • 54. ???? ?? ? ????? 1. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ¦¤? = ? ? ? ?=1 ? ? log ? ? ? ? |? ? ?? ? ? = 0.003?? ??, ? 8??? ¦¤? ?????? ???? ???? ? ? = 16 ? ???? 100??? ? ??? ?????? ?? gradient?(¦¤?)? ?? ? Deep Q Network? ????? ???. ????: [??] 4/28/2016 ??? ???? 3? ? ??? 54
  • 55. ???? ?? ? ????? 1. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ¦¤? = ? ? ? ?=1 ? ? log ? ? ? ? |? ? ?? ? GPU 50? ??, 3?? ?? 3?4?? ???? ??, ??. ? ????? ?? ???? ? ? ? ? ?? ?? 4/28/2016 ??? ???? 3? ? ??? 55
  • 56. ???? ?? ? ????? 2. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ? ?? 10000 ??, ? ???? ? ?? (? = 128) ? ? ????, ??? ??? ? ? ??? ??? ?? ?? ?? ?? ? ? ?? ?? ???? ?? (?1 ? , ?1 ? , ?2 ? , ¡­ , ? ? ? ? )? ???? ? ? ???? ???? ?? ??? ?? ???? ¦¤? = ? ? ? ?=1 ? ? ?=1 ? ? ? log ? ? ? ? ? |?? ? ?? ?? ? ? ?(?? ? ) 4/28/2016 ??? ???? 3? ? ??? 56
  • 57. ???? ?? ? ????? 2. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ¦¤? = ? ? ? ?=1 ? ? ?=1 ? ? ? log ? ? ? ? ? |?? ? ?? ?? ? ? ?(?? ? ) ? 1st pass?? ? ? = 0 ??. 2nd pass?? ? ? = ? ? ? ??. ? ?? ??? ?? ?? (? ??? ????? ??) 4/28/2016 ??? ???? 3? ? ??? 57
  • 58. ???? ?? ? ????? 2. ??? ? ?(?|?)? ?? ??? ???? ? ???? ?? ? ? 1?? ????? ??? ? ???? ?? ? 2?? ????? ?? ?? ??? ? ?? ?? ????? ?? ? ?? ??? ? ? ? ?? ???? ???? ??? ? ?? ? 10000???? ???? ????? ?????? ? ?(?|?)? ?? ?? ? 50?? GPU? ??, 1?? ??? 4/28/2016 ??? ???? 3? ? ??? 58
  • 59. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ??? ???? ? ??: 3???? ??? ?? ? ? ??? ???? ? ??? ?, ? ?? ? ?? ?? ?? ? ? ??? 3?? ?? ??, ?? ? ??? ? ? ???? ? ? ??? ?? ? ? ??? 4/28/2016 ??? ???? 3? ? ??? 59
  • 60. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ??? ???? ? 3?? ?? ?? ? ?? ??? 1~480 ??? ? ?? ?¡ä? ???? ?? ? ? ? ???? ? ?? ?? ? ? ?? ??? ???? ???? ? ? ?? ??? 1~391 ??? ? ?? ?¡ä¡ä? ???? ?? ? ? ??? ?? ?, ?¡ä¡ä ? ?? ??? ?? ???? ??? ?? ? ? ??? ? ?? ???? ?? ???? ?? ? ?? ???? ??? ???? ??/?? ??? ?? ?? 4/28/2016 ??? ???? 3? ? ??? 60
  • 61. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ???? ?? ? 3???? ??? ?? ? ? ??? ???? ? ??? ?, ? ?? ? ? ??? 3?? ?? ??, ?? ? ??? ? ? ???? ? ? ??? ?? ? ? ??? ? ? 100??? test set??, ??? 2900??? training set?? ?? 4/28/2016 ??? ???? 3? ? ??? 61
  • 62. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ???? ?? ? 3???? ??? ?, ? ? ???? ?? ? ? 100??? test set??, ??? 2900??? training set?? ?? ? ??? ?? ?? ???? ¦¤? = ? ? ? ?=1 ? ? ? ? ? ? ? ? ?? ? ? ? ?? 4/28/2016 ??? ???? 3? ? ??? 62
  • 63. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ???? ?? ¦¤? = ? ? ? ?=1 ? ? ? ? ? ? ? ? ?? ? ? ? ?? ? ? = 0.003?? ??, ? 8??? ¦¤? ?????? ???? ???? ? ? = 32 ? ???? 100??? ? ??? ?????? ?? gradient?(¦¤?)? ?? 4/28/2016 ??? ???? 3? ? ??? 63
  • 64. ???? ?? ? ????? 3. ??? ? ?(?)? ?? ??? ???? ? ???? ?? ¦¤? = ? ? ? ?=1 ? ? ? ? ? ? ? ? ?? ? ? ? ?? ? GPU 50? ??, 1?? ?? 5?? ???? ??, ??. ? ????? ?? ???? ? ?(?)?? ?? 4/28/2016 ??? ???? 3? ? ??? 64
  • 65. ???? ?? ? ????? ? ???? ??? ?? ???? ??? ??? ?? ?????? ???? ???? ?????? 1. ??? ? ?(?|?)? ?? ??? ???? 2. ??? ? ?(?|?)? ?? ??? ???? 3. ??? ? ?(?)? ?? ??? ???? ? ? ????? ??? ?? ? ??? ????? ? ??? ??? ?? ? ???? ??? ???? ?? ??! ? ? ?? ?? ????? ?????? ? donghun2014@gmail.com 4/28/2016 ??? ???? 3? ? ??? 65
  • 66. ?? ? ???? ?? ? ??? ?????? ?? ? ??? S/W? ??? ??? ? ??? S/W? ?? ? ????? ? ??? S/W? ??? ? ???? ??? 4/28/2016 ??? ???? 3? ? ??? 66
  • 67. ???? ??? 4/28/2016 ??? ???? 3? ? ??? 67
  • 68. ???? ??? (??????!) ? ?? ????? ??? ???? ???? 4/28/2016 ??? ???? 3? ? ??? 68
  • 69. ???? ??? (??????!) ? ?? ????? ??? ???? ???? ? ??? ????? ???? ???? ?? ?? ? ??? ???.. ? ??? ???? ??? ???? ???? ??? ??? ???? ? ??? ?? ? ???? ????? ??? ??????? ? ???? donghun2014@gmail.com ?? ??????! 4/28/2016 ??? ???? 3? ? ??? 69
  • 70. ???? ? ¡°??? ????¡± 1, 2, 3??? ??? ??? ??? ???? ? 1? [??] ? ???? ?? ? ??? ?????? ?? (??? ??? ??) ? 2? [??] ? ??? ?????? ?? (??? ??) ? 3? ? ??? S/W? ??? ??? ? ??? S/W? ?? ? ????? ? ???? ¡°??? ????¡±? 3???? ?????? ? ??? ??? ?? ?? ??? ????? ??? ? ? ??? ???? 4/28/2016 ??? ???? 3? ? ??? 70
  • 71. ???? ? ????? ???????! ? ???? ???? ???? ?? ?? ???? ??? ?? ??? ?????? ? donghun2014@gmail.com 4/28/2016 ??? ???? 3? ? ??? 71