- 局部特征提取
- 特征图抽取
- 特征图-48通道
- 深度学习模型训练
- 策略网络
- 局部特征
- 线性模拟训练
- 快速走子
- 下一步走棋判断
- 采样走U-1步
- 自我对弈棋谱 [1,U-1]
- 策略网络(训练加强版)
- 第1轮策略网络
- 对弈
- 随机走第U步
- 自我对弈棋谱[1,U]
- 自我对弈[U+1,T ]
- 特征图抽取
- 提取当前下棋色
- 标记 胜 / 败
- 特征图
- 二元特征 (白/黑)
- 深度学习回归模型训练
- 估值网络
- 局势判断
- 自我对弈至终
- 评分
- 评分
- 混合评分
- 蒙特卡洛树搜索
- 权重更新
- AlphaGo在线对弈计算流程
- By XMind