AlphaGo Zero是AlphaGo和AlphaZero的进一步改进版本。它不同于AlphaGo和AlphaZero,AlphaGo Zero完全是通过自我对弈和强化学习进行训练的,没有使用人类专家的棋局数据。通过自我学习,它在与AlphaGo和AlphaZero相同的硬件环境下,仅仅几天的训练时间就能够达到超越人类水平的水平。AlphaGo Zero的成功证明了自我对弈和强化学习在开发强大游戏AI方面的有效性,也进一步推动了人工智能领域的发展。
文章标题:AlphaGo和AlphaZero区别在哪里,发布者:E.Z,转载请注明出处: https://worktile.com/kb/p/63142