狠狠撸

狠狠撸Share a Scribd company logo
将棋ニューラルネット
と
これからのゲームAI
Katsuki Ohto @ YuriCat
Machine Learning 15 minutes! Vol.
14
2017/7/29
About myself
大渡 勝己 (Katsuki Ohto)
東京大学大学院 修士2年
- ゲームAI 研究
これまで 12種類のゲームAI 大会(国内?海外)に参加
- 大富豪、カーリング、囲碁、将棋、ぷよぷよ
人狼、Trax、5五将棋、サイコロ将棋、
ターン制戦略ゲーム、Block Go 、Dots & Boxes
About myself
大渡 勝己 (Katsuki Ohto)
大富豪AIで人間(NEWS手越さん)
と対戦
← 大富豪AIについて話しました
http://nge.jp/2017/04/16/post-139377
近年のゲームAIの進歩
DQNに代表される、1つのドメインに特化しないシステムが進歩
Bellemare et al. (2016)
Unifying Count-Based Exploration
and Intrinsic Motivation
近年のゲームAIの進歩
その一方で、特化型のゲームAIはさらなる高みに上っている
Ponanza
AlphaGo Google Deepmind社が開発した囲碁プログラム。
2016年3月にLee Sedolに4勝1敗、
2017年5月にKe Jieに3勝
山本一成氏、下山晃氏らが開発した将棋プログラム。
2017年に佐藤天彦名人に2勝
将棋プログラムの進歩
2013?2014年頃に人間のト
ップと並んだと推測されてい
る
現在:コンピュータ
(家庭用デスクトップPC)が
「2秒思考すれば勝てない」
と若手プロが
発言しているという
これまでの将棋プログラム
- コンピュータはノートパソコンでも秒間 300 万局面 程度を探索
- 人間は当然そんなには読めないので、
コンピュータは力任せの方法と揶揄されてきた
- しかし、人間の脳の並列計算回路の方が
演算回数はずっと多いのでは??
- 「賢くない」が「力任せ」の演算こそニューラルネットの得意分野
「読みのゲーム」将棋においてもニューラルネットが使えるのか?
将棋におけるニューラルネットの実力
Ponanza Chainer アピール文章 (2017年5月)より
手の予測を行い、探索のオーダリング(どの手から読むか)に利用
参考 囲碁のニューラルネット
AlphaGo論文:全13層の Convolutional Neural Network
(狭い範囲のパターンマッチの積み重ね)
その後、
- Residual Network にして深くしたり
- Spatial Batch Normalization を使う
などの性能向上が多方から報告されている
(最新のAlphaGoの policy net は 40層という噂)
Silver et al. (2016)
Mastering the game of Go with Deep
Neural Networks and Tree Search
将棋ニューラルネットの構成(大渡案)
- 将棋の駒の移動に合わせた畳み込みフィルタの利用
1レイヤーの形状 (2017コンピュータ将棋選手権時点)
※ただし、遅いので、現在では Ponanza Chainer の NN と同じ手法を使用
PFNの人が論文出してくれるはず!!
将棋ニューラルネットの挙動
(ML15ではここで実際にプログラムを動かしてNN同士の試合を行いました)
ニューラルネットの構成(大渡案)
- インプット情報
特化型のゲームAIでは、入力チャネルはRGBではなくマスに対応した特徴量が使われる
- 盤上の駒 (14 × 2)
持ち駒 (歩は4枚、香桂銀金は2枚を限度とし、超過は無視) (16 × 2)
各マスに利いている駒の数 (自分と相手で別々、最大3つまで考慮) (3 × 2)
ニューラルネットの構成(大渡案)
- インプット情報
特化型のゲームAIでは、入力チャネルはRGBではなくマスに対応した特徴量が使われる
- 盤上の駒 (14 × 2)
持ち駒 (歩は4枚、香桂銀金は2枚を限度とし、超過は無視) (16 × 2)
各マスに利いている駒の数 (自分と相手で別々、最大3つまで考慮) (3 × 2)
盤面の位置に対応した特徴
= + + …
ニューラルネットの構成(大渡案)
- インプット情報
特化型のゲームAIでは、入力チャネルはRGBではなくマスに対応した特徴量が使われる
- 盤上の駒 (14 × 2)
持ち駒 (歩は4枚、香桂銀金は2枚を限度とし、超過は無視) (16 × 2)
各マスに利いている駒の数 (自分と相手で別々、最大3つまで考慮) (3 × 2)
盤面の位置に対応しない特徴
- 1チャネルを全て1で埋める
- 何チャネル埋めるかにより数を表す
将棋ニューラルネットの学習
Ponanza Chainer では1手1秒自己対戦棋譜 5億局面から教師あり学習
を行ったらしい
大渡個人で製作した結果、1700万局面で 51.8 % の一致
その後、レベルは低いが5億以上の中終盤局面を学習データに追加し
たところ、
棋譜との一致率は落ちたが強さは大分向上
将棋は初期局面が1つなので、序盤の学習は簡単。
強さの向上には、序盤で一致率を稼ぐより中終盤の汎化の方が重要http://ppp-
lab.sakura.ne.jp/ProgrammingPlacePlus/algorithm/data_str
uct/007.html
ニューラルネットの探索への利用の現在
ニューラルネットは
「読まないわりには」 そこそこの手を返せて そこそこの評価ができる
これまでの将棋プログラムと全く逆の特徴がある
→アンサンブル効果に期待できる
一部ではニューラルネットのみの遅い探索で、
プロに迫るレベルのプログラムが出てきている
近い将来、人間以下の思考局面数で人間を超えるでしょう!
ゲームAIは人間の上位互換になるか?
まずそんなことはない
20年前に人間を超えたチェスのプログラムであっても、
人間の方が正しい判断をできる局面は沢山ある (fortressと呼ばれる)
レベルが上がると
「人間にとって強く見える」ことと
「勝率が高い」ことが一致しなくなってくる
という問題がある
AIは人間の上位互換になるか?
AI開発者 : 数字を追い求める
AIに対する評価 : AIの尖った箇所を
見て判断されるかも?
どちらが「正しい」のか?
これからのAIに注目
ゲームAIのこれから
DQNなどのend-to-endな手法をベースとして何でもできるようになるのか?
→
ある程度はできるようになるが、特化型はそれ以上の計算効率を出せるはず
(何でもできるのであれば人間と同じ)
しかし、これまで12個のゲームAI大会に参加した人の弁
「全てのゲームで高レベルなAIを作るには
人生が何回あっても足りない」
https://www.youtube.com/watch?v=Q4gTV4r0z
ゲームAIのこれから
特化型AIといえども、人が全て作ることは難しくなってきた
評価パラメータを手で決定
→ 評価要素を手で決定して機械学習
→ 特徴抽出を機械学習に任せる
→ … いつかプログラム自体をプログラムが書けるようになるだ
ろうか?
特化型AIを作るためにも、より高度なAIの存在が求められている
ゲームAIは宇宙の限界への挑戦
人間に特化したビジネスAIとは違い、
数学で記述できるゲームのAIは人類の枠を超えた勝負
一つ一つのゲームでどれだけ成績を伸ばせるか?
この宇宙の最高到達点を押し上げていく戦い
思考の極北を一緒に目指しましょう!
背景
https://ja.wikipedia.org/wiki/%E
5%AE%87%E5%AE%99

More Related Content

Viewers also liked (11)

戦略を立てる机械学习
戦略を立てる机械学习戦略を立てる机械学习
戦略を立てる机械学习
Takashi Kato
?
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジーAI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
Atsushi Ishii
?
ml_15min_tobitate_tech_8th
ml_15min_tobitate_tech_8thml_15min_tobitate_tech_8th
ml_15min_tobitate_tech_8th
YumaMatsuoka
?
パーソナル人工知能 SENSY と機械学習技術
パーソナル人工知能 SENSY と機械学習技術パーソナル人工知能 SENSY と機械学習技術
パーソナル人工知能 SENSY と機械学習技術
Takashi Okamoto
?
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Masataka Sato
?
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
Takahiro Kubo
?
量子アニーリングの研究开発最前线
量子アニーリングの研究开発最前线量子アニーリングの研究开発最前线
量子アニーリングの研究开発最前线
Shu Tanaka
?
戦技研 ぷよぷよ础滨 学生讲义
戦技研 ぷよぷよ础滨 学生讲义戦技研 ぷよぷよ础滨 学生讲义
戦技研 ぷよぷよ础滨 学生讲义
hisyachu
?
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
Kanji Takahashi
?
量子アニーリング解説 1
量子アニーリング解説 1量子アニーリング解説 1
量子アニーリング解説 1
Kohta Ishikawa
?
ディープラーニングでラーメン二郎(全店舗)を识别してみた
ディープラーニングでラーメン二郎(全店舗)を识别してみたディープラーニングでラーメン二郎(全店舗)を识别してみた
ディープラーニングでラーメン二郎(全店舗)を识别してみた
knjcode
?
戦略を立てる机械学习
戦略を立てる机械学习戦略を立てる机械学习
戦略を立てる机械学习
Takashi Kato
?
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジーAI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
Atsushi Ishii
?
ml_15min_tobitate_tech_8th
ml_15min_tobitate_tech_8thml_15min_tobitate_tech_8th
ml_15min_tobitate_tech_8th
YumaMatsuoka
?
パーソナル人工知能 SENSY と機械学習技術
パーソナル人工知能 SENSY と機械学習技術パーソナル人工知能 SENSY と機械学習技術
パーソナル人工知能 SENSY と機械学習技術
Takashi Okamoto
?
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Findy を作ってわかった、機械学習エンジニアとその分析 - Machine Learning15minutes! 2017/07/29
Masataka Sato
?
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
Takahiro Kubo
?
量子アニーリングの研究开発最前线
量子アニーリングの研究开発最前线量子アニーリングの研究开発最前线
量子アニーリングの研究开発最前线
Shu Tanaka
?
戦技研 ぷよぷよ础滨 学生讲义
戦技研 ぷよぷよ础滨 学生讲义戦技研 ぷよぷよ础滨 学生讲义
戦技研 ぷよぷよ础滨 学生讲义
hisyachu
?
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する
Kanji Takahashi
?
量子アニーリング解説 1
量子アニーリング解説 1量子アニーリング解説 1
量子アニーリング解説 1
Kohta Ishikawa
?
ディープラーニングでラーメン二郎(全店舗)を识别してみた
ディープラーニングでラーメン二郎(全店舗)を识别してみたディープラーニングでラーメン二郎(全店舗)を识别してみた
ディープラーニングでラーメン二郎(全店舗)を识别してみた
knjcode
?

Similar to 将棋ニューラルネットとこれからのゲーム础滨 (20)

东方ゲーム础滨とその歴史
东方ゲーム础滨とその歴史东方ゲーム础滨とその歴史
东方ゲーム础滨とその歴史
ide_an
?
人工知能イベント
人工知能イベント人工知能イベント
人工知能イベント
Baku Momoki
?
Developers.IO 2016 | 疎結合で非同期なチーム開発
Developers.IO 2016 | 疎結合で非同期なチーム開発Developers.IO 2016 | 疎結合で非同期なチーム開発
Developers.IO 2016 | 疎結合で非同期なチーム開発
Motokatsu Matsui
?
ゲーム础滨と人工生命
ゲーム础滨と人工生命ゲーム础滨と人工生命
ゲーム础滨と人工生命
Youichiro Miyake
?
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
Youichiro Miyake
?
深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について
bleu48
?
ゲーム础滨とマルチエージェント(上)
ゲーム础滨とマルチエージェント(上)ゲーム础滨とマルチエージェント(上)
ゲーム础滨とマルチエージェント(上)
Youichiro Miyake
?
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
Unity Technologies Japan K.K.
?
ゲームの中の人工知能
ゲームの中の人工知能ゲームの中の人工知能
ゲームの中の人工知能
Youichiro Miyake
?
人工知能入门
人工知能入门人工知能入门
人工知能入门
Youichiro Miyake
?
人工知能 - イノベーションエンジン –
人工知能- イノベーションエンジン –人工知能- イノベーションエンジン –
人工知能 - イノベーションエンジン –
Youichiro Miyake
?
础滨界隈の最新动向2020
础滨界隈の最新动向2020础滨界隈の最新动向2020
础滨界隈の最新动向2020
bleu48
?
轴が异なる3つの组み合わせの考え方
轴が异なる3つの组み合わせの考え方轴が异なる3つの组み合わせの考え方
轴が异なる3つの组み合わせの考え方
俊文 黒澤
?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
Youichiro Miyake
?
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
Junichi Noda
?
ゲーム础滨から见る础滨の歴史
ゲーム础滨から见る础滨の歴史ゲーム础滨から见る础滨の歴史
ゲーム础滨から见る础滨の歴史
Youichiro Miyake
?
开催趣旨?00年代イントロ?パネルディスカッション资料
开催趣旨?00年代イントロ?パネルディスカッション资料开催趣旨?00年代イントロ?パネルディスカッション资料
开催趣旨?00年代イントロ?パネルディスカッション资料
IGDA Japan
?
About IGDA Japan 0906
About IGDA Japan 0906About IGDA Japan 0906
About IGDA Japan 0906
IGDA Japan
?
数字から読む信号机の倾向と精度
数字から読む信号机の倾向と精度数字から読む信号机の倾向と精度
数字から読む信号机の倾向と精度
Jun Sasaki
?
デジタルゲームにおける人工知能技术
デジタルゲームにおける人工知能技术デジタルゲームにおける人工知能技术
デジタルゲームにおける人工知能技术
Youichiro Miyake
?
东方ゲーム础滨とその歴史
东方ゲーム础滨とその歴史东方ゲーム础滨とその歴史
东方ゲーム础滨とその歴史
ide_an
?
人工知能イベント
人工知能イベント人工知能イベント
人工知能イベント
Baku Momoki
?
Developers.IO 2016 | 疎結合で非同期なチーム開発
Developers.IO 2016 | 疎結合で非同期なチーム開発Developers.IO 2016 | 疎結合で非同期なチーム開発
Developers.IO 2016 | 疎結合で非同期なチーム開発
Motokatsu Matsui
?
ゲーム础滨と人工生命
ゲーム础滨と人工生命ゲーム础滨と人工生命
ゲーム础滨と人工生命
Youichiro Miyake
?
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
黒川塾 三十九 (39)「誰にでもわかる!エンタメ的人工知能(AI)考察」(松原、伊藤、三宅)講演資料
Youichiro Miyake
?
深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について深层学习の将棋础颈への浸透について
深层学习の将棋础颈への浸透について
bleu48
?
ゲーム础滨とマルチエージェント(上)
ゲーム础滨とマルチエージェント(上)ゲーム础滨とマルチエージェント(上)
ゲーム础滨とマルチエージェント(上)
Youichiro Miyake
?
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
【Unite 2017 Tokyo】ゲームAI?ゲームデザインから考えるゲームの過去?現在?未来
Unity Technologies Japan K.K.
?
ゲームの中の人工知能
ゲームの中の人工知能ゲームの中の人工知能
ゲームの中の人工知能
Youichiro Miyake
?
人工知能 - イノベーションエンジン –
人工知能- イノベーションエンジン –人工知能- イノベーションエンジン –
人工知能 - イノベーションエンジン –
Youichiro Miyake
?
础滨界隈の最新动向2020
础滨界隈の最新动向2020础滨界隈の最新动向2020
础滨界隈の最新动向2020
bleu48
?
轴が异なる3つの组み合わせの考え方
轴が异なる3つの组み合わせの考え方轴が异なる3つの组み合わせの考え方
轴が异なる3つの组み合わせの考え方
俊文 黒澤
?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
『人工知能のための哲学塾』刊行记念イベント?「人工知能×ビジネス」?
Youichiro Miyake
?
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
秋叶原滨罢戦略研究所のこ?绍介(2016/05/04)
Junichi Noda
?
ゲーム础滨から见る础滨の歴史
ゲーム础滨から见る础滨の歴史ゲーム础滨から见る础滨の歴史
ゲーム础滨から见る础滨の歴史
Youichiro Miyake
?
开催趣旨?00年代イントロ?パネルディスカッション资料
开催趣旨?00年代イントロ?パネルディスカッション资料开催趣旨?00年代イントロ?パネルディスカッション资料
开催趣旨?00年代イントロ?パネルディスカッション资料
IGDA Japan
?
About IGDA Japan 0906
About IGDA Japan 0906About IGDA Japan 0906
About IGDA Japan 0906
IGDA Japan
?
数字から読む信号机の倾向と精度
数字から読む信号机の倾向と精度数字から読む信号机の倾向と精度
数字から読む信号机の倾向と精度
Jun Sasaki
?
デジタルゲームにおける人工知能技术
デジタルゲームにおける人工知能技术デジタルゲームにおける人工知能技术
デジタルゲームにおける人工知能技术
Youichiro Miyake
?

More from Katsuki Ohto (7)

論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
Katsuki Ohto
?
ゲーム础滨を学んで1000年生きた话
ゲーム础滨を学んで1000年生きた话ゲーム础滨を学んで1000年生きた话
ゲーム础滨を学んで1000年生きた话
Katsuki Ohto
?
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Katsuki Ohto
?
論文紹介: Value Prediction Network
論文紹介: Value Prediction Network論文紹介: Value Prediction Network
論文紹介: Value Prediction Network
Katsuki Ohto
?
Introduction of "TrailBlazer" algorithm
Introduction of "TrailBlazer" algorithmIntroduction of "TrailBlazer" algorithm
Introduction of "TrailBlazer" algorithm
Katsuki Ohto
?
論文紹介 : Unifying count based exploration and intrinsic motivation
論文紹介 : Unifying count based exploration and intrinsic motivation論文紹介 : Unifying count based exploration and intrinsic motivation
論文紹介 : Unifying count based exploration and intrinsic motivation
Katsuki Ohto
?
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
Katsuki Ohto
?
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
論文紹介 Anomaly Detection using One-Class Neural Networks (修正版
Katsuki Ohto
?
ゲーム础滨を学んで1000年生きた话
ゲーム础滨を学んで1000年生きた话ゲーム础滨を学んで1000年生きた话
ゲーム础滨を学んで1000年生きた话
Katsuki Ohto
?
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Tensorflowユーザから見た Alpha(Go)Zero, Ponanza (TFUG #7)
Katsuki Ohto
?
論文紹介: Value Prediction Network
論文紹介: Value Prediction Network論文紹介: Value Prediction Network
論文紹介: Value Prediction Network
Katsuki Ohto
?
Introduction of "TrailBlazer" algorithm
Introduction of "TrailBlazer" algorithmIntroduction of "TrailBlazer" algorithm
Introduction of "TrailBlazer" algorithm
Katsuki Ohto
?
論文紹介 : Unifying count based exploration and intrinsic motivation
論文紹介 : Unifying count based exploration and intrinsic motivation論文紹介 : Unifying count based exploration and intrinsic motivation
論文紹介 : Unifying count based exploration and intrinsic motivation
Katsuki Ohto
?
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
カーリングの局面評価関数を学習 WITH “TENSOR FLOW”
Katsuki Ohto
?

将棋ニューラルネットとこれからのゲーム础滨

Editor's Notes

  • #3: 中国で10种目出ている人がいた
  • #4: 去年の惭尝15では大富豪の话しました
  • #6: どれくらいの人がしているか?
  • #7: 藤井四段の登场で少しプロの最高レートが上がったかも
  • #9: 自分も狈狈作ってみた
  • #10: ただし将棋の方が一様なパターンマッチでは不足かも?
  • #18: ところで、人间と同じ方法に近くなる
  • #21: これまでは时间をかけてチューニングできる人、高速化できる人が重要だったが、これからはそれだけではだめ