唯一在比赛中战胜过“阿尔法狗”的人类棋手是谁

韩国职业棋手李世石(?)。

2016年3月,AlphaGo挑战世界冠军韩国职业棋手李世石(?)九段。AlphaGo使用谷歌位于美国的云计算服务器,并通过光缆网络连接到韩国。

比赛的地点为韩国首尔四季酒店;赛制为五番棋,分别于2016年3月9日、10日、12日、13日和15日进行;规则为中国围棋规则,黑棋贴3又3/4子;用时为每方2小时,3次1分钟读秒。

DeepMind团队在YouTube上全球直播并由美籍职业棋手迈克·雷蒙(Michael Redmond)九段担任英语解说,而中国很多视频网站也采用YouTube的直播信号进行直播,并加上自己的解说。DeepMind团队成员台湾业余6段围棋棋手黄士杰博士代表AlphaGo在棋盘上落子。

比赛获胜者将获得100万美元的奖金。如果AlphaGo获胜,奖金将捐赠给围棋组织和慈善机构,包括联合国儿童基金会。李世石有15万美元的出场费,且每赢一盘棋会再得2万美元的奖金。

2016年3月9日、10日和12日的三局对战均为AlphaGo获胜,而13日的对战则为李世石获胜,15日的最终局则又是AlphaGo获胜。因此对弈结果为AlphaGo 4:1战胜了李世石。这次比赛在网络上引发了人们对此次比赛和人工智能的广泛讨论。

扩展资料:

算法

AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助估值网络(value network)与走棋网络(policy network)这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。

AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。后来它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它。

围棋无法仅通过寻找最佳棋步来解决;游戏一盘平均约有150步,每一步平均约有200种可选的下法,这意味着有太多需要解决的可能性。