toppic
当前位置: 首页> 最新资讯> 柯洁即将再次对战 Alpha Go,这场比赛是否能成功为人类“雪耻”?

柯洁即将再次对战 Alpha Go,这场比赛是否能成功为人类“雪耻”?

2021-04-13 07:49:13

去年,Alpha Go 打败了来自韩国的世界顶级围棋棋手李世石。在那场对决过后,人工智能的所具有的潜力开始越来越多地为普通大众所熟知,同时也给围棋界带来了不少的震撼。转眼到了 2017 年,近日,DeepMind 团队又带着 Alpha Go 来到了围棋的发源地——中国,参加了由中国围棋协会、浙江省体育局以及谷歌联手举办的世界顶级围棋峰会。同时,谷歌还宣布,Alpha Go 将于下个月在无锡展开对柯洁的新一轮“人机围棋大战”。

据了解,在这场将于下个月到来的围棋大战中,将由对赛和团队赛两种比赛形式组成。在第一种形式——“Pair Go”比赛中,Alpha Go 将于人类棋手联手,对战另一方同样是由 Alpha Go 和人类棋手组成的队伍。之所以采用这种形式,是为了让人类更好地理解 Alpha Go 的机制,同时发挥人类棋手和机器决策过程中的最大优势;

而在团队赛中,Alpha Go 将对战由 5 名中国顶尖棋手组成的队伍。之所以采用这种“一对多”的形式,是为了建立起更加全面的“智囊团“,同时降低心理因素对棋手们的影响,使其发挥出最大的水平,做出更加客观的判断。

虽然柯洁也曾经在年前由 Alpha Go 化身的“Master“比赛中一度输给了后者,然而这场比赛依然值得期待。据 Alpha Go 背后的团队 DeepMind 介绍,新版的 Alpha Go 将会采用一种更新型的机器学习技术,能够充分利用监督学习以及强化学习的优势。

具体说来,搭载了监督学习以及强化学习技术的 Alpha Go 能够通过训练形成相应的“策略网络“,在输入当前棋盘上的局势信息之后,对所有可行的落子位置生成概率分布。完成这些之后,Alpha Go 还会通过训练出来的价值网络对各种下法进行自我对弈完成预测,以-1(对方完全胜利优势)到 1(Alpha Go 完全胜利优势)为区间,对各种下法进行判断。

将这两种网络结合起来使用的 Alpha Go 实力估计和以往相比会有非常大幅度的进步和跨越。不仅如此,Alpha Go 还将这两种网络整合进了其基于概率的蒙特卡罗树搜索(MCTS)中,发挥这两种网络的最大潜力。而且这种通过自我对弈进行计算的模式,将会为 Alpha Go 未来版本的训练提供更多的原始数据,从而让 Alpha Go 的每一代都“青出于蓝而胜于蓝”。

“人工智能实际上促使了人类玩家变得更加强大、更具创意。”DeepMind 的联合创始人兼首席执行官 Demis Hassabis 表示。“显然,Alpha Go 与人类的合作将会挖掘到更多的东西。”


长按二维码,即刻关注粹客网公众号



      粹客网是国内首个关注前沿科技领域的科技新媒体和创业服务平台。我们提供最贴近商业化的前沿科技创业报道、最新最全的科技动态资讯以及深刻独到的行业观点。坚持挖掘有价值的创新创业项目,致力于成为创新创业者的前沿阵地。
      每月精彩评论将有机会获得神秘礼品,线下活动 or 商业合作请私信微信公众号(cheekrnews)或发邮件到粹客网官方邮箱。



友情链接