柯洁即将再次对战 Alpha Go，这场比赛是否能成功为人类“雪耻”？

2021-04-13 07:49:13

去年，Alpha Go 打败了来自韩国的世界顶级围棋棋手李世石。在那场对决过后，人工智能的所具有的潜力开始越来越多地为普通大众所熟知，同时也给围棋界带来了不少的震撼。转眼到了 2017 年，近日，DeepMind 团队又带着 Alpha Go 来到了围棋的发源地——中国，参加了由中国围棋协会、浙江省体育局以及谷歌联手举办的世界顶级围棋峰会。同时，谷歌还宣布，Alpha Go 将于下个月在无锡展开对柯洁的新一轮“人机围棋大战”。

据了解，在这场将于下个月到来的围棋大战中，将由对赛和团队赛两种比赛形式组成。在第一种形式——“Pair Go”比赛中，Alpha Go 将于人类棋手联手，对战另一方同样是由 Alpha Go 和人类棋手组成的队伍。之所以采用这种形式，是为了让人类更好地理解 Alpha Go 的机制，同时发挥人类棋手和机器决策过程中的最大优势；

而在团队赛中，Alpha Go 将对战由 5 名中国顶尖棋手组成的队伍。之所以采用这种“一对多”的形式，是为了建立起更加全面的“智囊团“，同时降低心理因素对棋手们的影响，使其发挥出最大的水平，做出更加客观的判断。

虽然柯洁也曾经在年前由 Alpha Go 化身的“Master“比赛中一度输给了后者，然而这场比赛依然值得期待。据 Alpha Go 背后的团队 DeepMind 介绍，新版的 Alpha Go 将会采用一种更新型的机器学习技术，能够充分利用监督学习以及强化学习的优势。

具体说来，搭载了监督学习以及强化学习技术的 Alpha Go 能够通过训练形成相应的“策略网络“，在输入当前棋盘上的局势信息之后，对所有可行的落子位置生成概率分布。完成这些之后，Alpha Go 还会通过训练出来的价值网络对各种下法进行自我对弈完成预测，以-1（对方完全胜利优势）到 1（Alpha Go 完全胜利优势）为区间，对各种下法进行判断。

将这两种网络结合起来使用的 Alpha Go 实力估计和以往相比会有非常大幅度的进步和跨越。不仅如此，Alpha Go 还将这两种网络整合进了其基于概率的蒙特卡罗树搜索（MCTS）中，发挥这两种网络的最大潜力。而且这种通过自我对弈进行计算的模式，将会为 Alpha Go 未来版本的训练提供更多的原始数据，从而让 Alpha Go 的每一代都“青出于蓝而胜于蓝”。

“人工智能实际上促使了人类玩家变得更加强大、更具创意。”DeepMind 的联合创始人兼首席执行官 Demis Hassabis 表示。“显然，Alpha Go 与人类的合作将会挖掘到更多的东西。”

长按二维码，即刻关注粹客网公众号

粹客网是国内首个关注前沿科技领域的科技新媒体和创业服务平台。我们提供最贴近商业化的前沿科技创业报道、最新最全的科技动态资讯以及深刻独到的行业观点。坚持挖掘有价值的创新创业项目，致力于成为创新创业者的前沿阵地。
每月精彩评论将有机会获得神秘礼品，线下活动 or 商业合作请私信微信公众号（cheekrnews）或发邮件到粹客网官方邮箱。