18. 【AlphaGoにおけるCNN(SL Policy network)の構成】
? 入力は48チャネル(黒石/白石の位置、石の生き死に???)
? 中間層は13層構成
? 3,000万の盤面データをベースに50GPUで3.4億ステップ、3週間にわたり
学習を続けた結果、プロの指し手を57.0%の精度で予想することができる
ようになった。(Mastering the game of Go with deep neural networks
and tree search)
アルファー碁の畳み込みニューラルネット(CNN)