AlphaZero问世：8小时完爆围棋、国际象棋、日本将棋

首页 > 文章资讯 > AlphaZero问世：8小时完爆围棋、国际象棋、日本将棋

科技 2019-03-25 14:11:59 字数：589

通用AI问世！AlphaZero强化学习算法8小时完爆人类围棋、国际象棋、日本将棋。日前，DeepMind团队发表了最新论文，提出了全新的强化学习算法AlphaZero，它是一种可以从零开始，通过自我对弈强化学习在多种任务上达到超越人类水平的新算法，堪称“通用棋类AI”。

AlphaZero问世：8小时完爆围棋、国际象棋、日本将棋

据了解，AlphaZero算法可以再8个小时训练击败李世石版本AlphaGo；12小时训练击败世界顶级的国际象棋程序Stockfish；14小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后，带给我们的又一全新算法，它是“更通用的版本”。

此外，我们看到这次的AlphaZero与AlphaGo Zero有几点不同，首先AlphaGo Zero是在假设结果为赢/输二元的情况下，对获胜概率进行估计和优化。而AlphaZero会将平局或其他潜在结果纳入考虑，对结果进行估计和优化。其次，AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强，而AlphaZero不会。第三，AlphaZero只维护单一的一个神经网络，这个神经网络不断更新，而不是等待迭代，四，AlphaZero中，所有对弈都重复使用相同的超参数，因此无需进行针对特定某种游戏的调整。

2898站长资源平台站长工具：http://www.2898.com/webtool.htm

上一篇：技术激活媒介与内容革新 AI赋能真实商业场景

下一篇：美的董事长兼总裁方洪波：未来家电人机交互

0人参与回答

未添加任何数据~~

热点相关推荐

快捷栏目

热点相关推荐

快捷栏目

提示信息