ݺߣ

ݺߣShare a Scribd company logo
1
AlphaGo, 새로운 시대의 시작
2016.03.02
Youngsung Son
2
Agenda
 AlphaGo 사건
 바둑 프로그램의 한계
 AlphaGo 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 AlphaGo 의의
 참고
3
https://m.facebook.com/story.php?story_fbid=10102619979696481&id=4
AlphaGo 사건
4
https://gogameguru.com/alpha-go-fan-hui/
Fan Hui 2단
Europe Champion 4회
(2013,2014,2015,2016)
AlphaGo 사건
5
 5번 대국
– 오전 공식경기: 제한시간 1시간, 30초 3회 초읽기
– 오후 비공식경기: 제한시간 없이 30초 3회 초읽기
 결과
– 오전 : Fan Hui 0-5 AlphaGo
– 오후 : Fan Hui 2-3 AlphaGo
AlphaGo 사건
http://www.yonhapnews.co.kr/bulletin/2016/02/15/0200000000AKR20160215002700007.HTML
6
https://gogameguru.com/alpha-go-fan-hui/
0 - 5
AlphaGo 사건
7
https://www.youtube.com/watch?v=SUbqykXVx0A
AlphaGo 사건
8
Alpha Go 사건
Mastering the game of Go with deep neural
networks and tree search – Nature, 2016
9
Agenda
 Alpha Go 사건
 바둑 프로그램의 한계
 Alpha Go 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 Alpha Go 시사점
 참고
10
http://time.com/3705316/deep-blue-kasparov/
체스마스터 Kasparov vs. IBM DeepBlue
1997.12
바둑 프로그램의 한계
11
http://nautil.us/issue/18/genius/why-the-chess-computer-deep-blue-played-like-a-human
바둑 프로그램의 한계
12
http://www.chessgames.com/perl/chesscollection?cid=1014770
바둑 프로그램의 한계
13
http://stanford.edu/~cpiech/cs221/apps/deepBlue.html https://www.uio.no/studier/emner/matnat/ifi/INF4130/h12/
undervisningsmateriale/chess-algorithms-theory-and-practice-ver2012.pdf
DeepBlue Chess Algorithm
바둑 프로그램의 한계
Monte Carlo Tree SearchGame Tree
14
너무나도 많은 경우의 수
바둑 프로그램의 한계
15
2081681993819799846
9947863334486277028
6522453884530548425
6394568209274196127
3801537852564845169
8519643907259916015
6281285460898883144
2712971531931755773
6620397247064840935
(19x19 board) 361!
바둑 프로그램의 한계
16
Agenda
 AlphaGo 사건
 바둑 프로그램의 한계
 AlphaGo 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 AlphaGo 시사점
 참고
17
48 CPU 494 : 1 1202 CPU 5 : 0
온라인 KGS
바둑 고수(5~9단)
16만 기보
3000만 착점 학습
100만번 self대국
하루 3만 대국 학습
AlphaGo 구성
18
AlphaGo 구성
19
http://deepmind.com/alpha-go.html
AlphaGo 구성
20
http://deepmind.com/alpha-go.html
AlphaGo 구성
21
AlphaGo 구성
22
AlphaGo 구성
Deep Learning을 통한 착수 후보 선정
23
AlphaGo 구성
MCTS 수행
24
100,000 simulation against open source Go program, Pachi
AlphaGo 구성
Training 13-layer policy network from 30million positions
2𝜇s of Rollout policy with weight 𝜋, 3ms of Policy network
25
Agenda
 Alpha Go 사건
 바둑 프로그램의 한계
 Alpha Go 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 Alpha Go 시사점
 참고
26
이세돌 9단 대국 계획
27
 일정
– 1국 : 3월 9일 (수) 오후 1시
– 2국 : 3월 10일 (목) 오후 1시
– 3국 : 3월 12일 (토) 오후 1시
– 4국 : 3월 13일 (일) 오후 1시
– 5국 : 3월 15일 (화) 오후 1시
 상대 : Aja Huang 아마 6단 (DeepMind 직원)
 장소 : 서울 광화문 포시즌스 호텔 특별 대국장
 규칙
– 중국규칙, 제한 시간 2시간, 1분 초읽기 3회 (4~5시간
예상)
 상금 12억원($1M) (승자? 5판 모두 승리?)
이세돌 9단 대국 계획
28
Agenda
 Alpha Go 사건
 바둑 프로그램의 한계
 Alpha Go 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 Alpha Go 시사점
 참고
29
이세돌9단 대국 관전 포인트 (1/3)
이세돌의 흔들기?
알파고는
이창호 스타일?
30
이세돌9단 대국 관전 포인트 (2/3)
중국 규칙
일곱집반 덤
2시간 60초 3번 초읽기
31
이세돌9단 대국 관전 포인트 (3/3)
알파고도 실수를 할까?초반에 승부를 봐야?
32
Agenda
 AlphaGo 사건
 바둑 프로그램의 한계
 AlphaGo 구성
 이세돌9단 대국 계획
 대국 관전 포인트
 AlphaGo 시사점
 참고
33
AlphaGo 시사점
성공한 기술 마케팅
34
개발팀 20명
David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian
Schrittwieser, Ioannis Antonoglou, Veda Panneershelvam, Marc Lanctot, Sander Dieleman, Dominik Grewe,
John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore
Graepel & Demis Hassabis
AlphaGo 시사점
35
AlphaGo 시사점
36
존 헨리
1872년
미국 웨스트버지니아
탤컷 터널 공사
증기 드릴과 터널 뚫기
경쟁후 탈진 사망
AlphaGo 시사점
37
References
 DeepMind, https://deepmind.com/alpha-go.html
 Why the Chess Computer Deep Blue Played Like a
Human, http://nautil.us/issue/18/genius/why-the-chess-
computer-deep-blue-played-like-a-human
 Monte Carlo Tree Search, http://mcts.ai/about/index.html
 David Silver, etc, “Mastering the game of Go with deep
neural networks and tree search”,” Nature, p.484-489,
Jan. 2016
 Volodymyr Mnih, etc,” Human-level control through
deep reinforcementlearning”, Nature, p.529-43, Feb.
2015
 김석원 외, “AlphaGo의 인공지능”, SPRi Issue Report,
2016.02
38
Thank you
Youngsung Son
ysson@etri.re.kr
Ad

Recommended

PDF
알파고 (바둑 인공지능)의 작동 원리
Shane (Seungwhan) Moon
PDF
바둑인을 위한 알파고
Donghun Lee
PDF
모두의 알파고
Donghun Lee
PPTX
알파고는 어떤 바둑을 둘까
이정원 JeongwonLee
PDF
AlphaGo 알고리즘 요약
Jooyoul Lee
PPTX
기계학습 / 딥러닝이란 무엇인가
Yongha Kim
PDF
인공지능개론 (머신러닝 중심)
SK(주) C&C - 강병호
PDF
Deep Learning Into Advance - 1. Image, ConvNet
Hyojun Kim
PDF
Google AlphaGo, 어떻게 동작할까요?
Lee Ji Eun
PDF
통찰의연결 학습자료 04
connect_foundation
PPTX
AlphaGo: An AI Go player based on deep neural networks and monte carlo tree s...
Michael Jongho Moon
PDF
알파고의 알고리즘
SeokWon Kim
PDF
왓슨컴퓨터의 인공지능
SeokWon Kim
PDF
알파고 해부하기 2부
Donghun Lee
PDF
AlphaGo: Mastering the Game of Go with Deep Neural Networks and Tree Search
Karel Ha
PDF
알파고 해부하기 1부
Donghun Lee
PDF
How AlphaGo Works
Shane (Seungwhan) Moon
PPTX
Ai 그까이거
도형 임
PPTX
인공지능, 기계학습 그리고 딥러닝
Jinwon Lee
PPTX
쫄지말자딥러닝2 - CNN RNN 포함버전
Modulabs
PPTX
딥러닝을 이용한 자연어처리의 연구동향
홍배 김
PPTX
Data as material
Duncan Wilson
PPTX
Bays club workshop sept 17th 2011
Angie Simmons
PPTX
IoT standardisation
Duncan Wilson
PPTX
Educ3313blogscaavengerhunt
Cassi jo
PPTX
ICRI Intro for NTU CCC
Duncan Wilson
PPT
Bullying 1
jls13
PDF
oneM2M overview
Young Sung Son
PDF
Big data computing overview
Young Sung Son
PDF
2015 car revolution
Young Sung Son

More Related Content

Viewers also liked (19)

PDF
Google AlphaGo, 어떻게 동작할까요?
Lee Ji Eun
PDF
통찰의연결 학습자료 04
connect_foundation
PPTX
AlphaGo: An AI Go player based on deep neural networks and monte carlo tree s...
Michael Jongho Moon
PDF
알파고의 알고리즘
SeokWon Kim
PDF
왓슨컴퓨터의 인공지능
SeokWon Kim
PDF
알파고 해부하기 2부
Donghun Lee
PDF
AlphaGo: Mastering the Game of Go with Deep Neural Networks and Tree Search
Karel Ha
PDF
알파고 해부하기 1부
Donghun Lee
PDF
How AlphaGo Works
Shane (Seungwhan) Moon
PPTX
Ai 그까이거
도형 임
PPTX
인공지능, 기계학습 그리고 딥러닝
Jinwon Lee
PPTX
쫄지말자딥러닝2 - CNN RNN 포함버전
Modulabs
PPTX
딥러닝을 이용한 자연어처리의 연구동향
홍배 김
PPTX
Data as material
Duncan Wilson
PPTX
Bays club workshop sept 17th 2011
Angie Simmons
PPTX
IoT standardisation
Duncan Wilson
PPTX
Educ3313blogscaavengerhunt
Cassi jo
PPTX
ICRI Intro for NTU CCC
Duncan Wilson
PPT
Bullying 1
jls13
Google AlphaGo, 어떻게 동작할까요?
Lee Ji Eun
통찰의연결 학습자료 04
connect_foundation
AlphaGo: An AI Go player based on deep neural networks and monte carlo tree s...
Michael Jongho Moon
알파고의 알고리즘
SeokWon Kim
왓슨컴퓨터의 인공지능
SeokWon Kim
알파고 해부하기 2부
Donghun Lee
AlphaGo: Mastering the Game of Go with Deep Neural Networks and Tree Search
Karel Ha
알파고 해부하기 1부
Donghun Lee
How AlphaGo Works
Shane (Seungwhan) Moon
Ai 그까이거
도형 임
인공지능, 기계학습 그리고 딥러닝
Jinwon Lee
쫄지말자딥러닝2 - CNN RNN 포함버전
Modulabs
딥러닝을 이용한 자연어처리의 연구동향
홍배 김
Data as material
Duncan Wilson
Bays club workshop sept 17th 2011
Angie Simmons
IoT standardisation
Duncan Wilson
Educ3313blogscaavengerhunt
Cassi jo
ICRI Intro for NTU CCC
Duncan Wilson
Bullying 1
jls13

More from Young Sung Son (6)

PDF
oneM2M overview
Young Sung Son
PDF
Big data computing overview
Young Sung Son
PDF
2015 car revolution
Young Sung Son
PDF
디지털 정리에 대하여
Young Sung Son
PDF
2013 이 시대의 인재란
Young Sung Son
PDF
우리에게 플랫폼이란 Print
Young Sung Son
oneM2M overview
Young Sung Son
Big data computing overview
Young Sung Son
2015 car revolution
Young Sung Son
디지털 정리에 대하여
Young Sung Son
2013 이 시대의 인재란
Young Sung Son
우리에게 플랫폼이란 Print
Young Sung Son
Ad

AlphaGo, 새로운 시대의 시작

Editor's Notes

  • #30: 알파고의 기풍 – 이창호 스타일? 평범한 수로 실수를 하지 않음 이세돌 9단의 기풍 불리한 경우 공격적인 (흔드는) 수 중국 규칙 – 일곱집 반 초읽기 - 60초 초반에 승부를 보지 못하면 승산이 있을까? 알파고에게 실수란?
  • #31: 알파고의 기풍 – 이창호 스타일? 평범한 수로 실수를 하지 않음 이세돌 9단의 기풍 불리한 경우 공격적인 (흔드는) 수 중국 규칙 – 일곱집 반 초읽기 - 60초 초반에 승부를 보지 못하면 승산이 있을까? 알파고에게 실수란?
  • #32: 알파고의 기풍 – 이창호 스타일? 평범한 수로 실수를 하지 않음 이세돌 9단의 기풍 불리한 경우 공격적인 (흔드는) 수 중국 규칙 – 일곱집 반 초읽기 - 60초 초반에 승부를 보지 못하면 승산이 있을까? 알파고에게 실수란?