财新传媒

谷歌开发程序AlphaGo首次战胜人类围棋高手

2016年01月28日 08:40 来源于 财新网
计算机程序击败人类围棋专业高手,原本被认为是人工智能10年后才能达到的成就。AlphaGo将在2016年3月迎战世界冠军李世乭
2016年1月28日,《自然》杂志发表论文并以封面故事展示了计算机围棋程序“AlphaGo”,它在一项竞赛中以5比0战胜欧洲围棋冠军樊麾。

  【财新网】(实习记者 吕光一)近日,人工智能在同人类高手的的围棋对弈中取得历史性胜利。

  2016年1月28日,《自然》杂志发表论文,并以封面故事展示了由谷歌旗下人工智能公司DeepMind研发的计算机围棋程序“AlphaGo”,这项程序在一项竞赛中以5比0的成绩战胜了欧洲围棋冠军樊麾。这是有史以来第一次,计算机程序在不让子的情况下,在围棋游戏中击败人类专业高手,而这原本被认为是人工智能在10年后才能达到的成就。接下来,AlphaGo还将在2016年3月挑战世界冠军棋手李世乭。

  20多年来,人工智能在大众棋类领域同人类的较量一直存在。从上世纪90年代中期战胜全世界跳棋顶尖高手的Chinook程序,到战胜国际象棋大师卡斯帕罗夫的深蓝,通过一代代的更新发展,在这类以智力博弈著称的游戏中,人工智能刷新记录,打败人类,创下纪录。

  然而,一直以来,围棋却是个例外。在这次AlphaGo取得突破性胜利之前,计算机围棋程序虽屡次向人类高手发出挑战,但其博弈水平远远低于人类。在同职业高段位顶尖棋手的较量中往往只能在“让子”的情况下才能打个平手或是略胜一筹。2013年日本电脑围棋“Crazy Stone”让四子打败了围棋九段高手石田芳夫,2015年11月份韩国专家林宰范研发的“DolBaram”程序在让四子的情况下击败了前超一流棋手赵治勋九段。

  之所以出现这种情况,是因为比之于计算国际象棋,计算围棋要复杂得多。围棋最大有3^361 种局面,大致的体量是10^170。而国际象棋最大只有2^155种局面,体量大致是10^47。围棋一盘大约要下150步,每一步有250种可选的下法,那么一盘围棋需要计算250^150种情况,大致是10^360。这是一个过于庞大的数字,传统蛮力搜索在围棋这里并不可行。

  因此,AlphaGo战胜人类围棋高手尤为难得。开发者大卫·斯尔弗(David Silver), 黄世杰(Aja Huang) 和 戴密斯·哈萨比斯(Demis Hassabis)运用深层卷积神经网络来缩小传统蒙特卡洛树搜索的广度和深度,以挑选最佳招数。“Alpha Go”的核心也正是两种不同的深层神经网络:策略网络(policy network)和价值网络(value network)。利用“价值网络”去计算局面,根据局势对路线进行取舍;用“策略网络”选择下子,减少不必要的棋步,在配合中选出有希望的好棋步,抛弃明显差棋,从而将计算量控制在计算机可以完成的范围内。

  此外,开发者们还用两种方式同步训练AlphaGo,一是用许多专业棋局进行训练的监督式学习(supervised learning),然后让“Alpha Go”和自己对弈,这种方法称为强化式学习(reinforcement learning)。在这种不断的学习,反思和练习下,在同其他围棋程序进行的总计495局的较量中取得只输一局的辉煌战绩。它的对手也包括Crazy Stone、Zen和Pachi三个先进的计算机围棋程序。

  在自然发表的论文中,AlphaGo与樊麾对战五局,均取得了胜利。樊麾出生于中国,后入籍法国,曾获欧洲围棋冠军,目前是法国国家围棋队总教练。

  “我开始以为会是我赢,”樊麾接受《自然》采访时表示,在第一局落败之后,他改变策略并更积极地反击,但仍然失败。“因为我们是人类,所以我们会犯错误、会疲倦,求胜之心也会带来压力。而程序并非如此,它非常的强大稳定,像一堵墙。”樊麾表示,他觉得AlphaGo棋路略有些奇怪,但仍然像是一个强大的真人对手。

  “在观察棋局时,如果不是预先知道,我很难看出来哪一方是电脑下的,”英国围棋协会主席乔恩·戴蒙得(Jon Diamond)表示,在AlphaGo之前,最好的计算机程序也无法战胜人类的业余高手,因此他曾认为,计算机程序打败人类专业高手在5-10年之后才会发生。

  韩国专业旗手Hajin Lee则表示,从棋局记录上来看,AlphaGo明显强于樊麾,但它是否能够战胜世界顶尖选手仍然存疑 ,“也许,这个程序会遇强则强”。

  围棋界纷纷表示,AlphaGo对战李世乭,将是令人期待的标志性战役。韩国九段棋手李世乭是近10年中获得世界冠军头衔最多的棋手,他的旗风属于力战型,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手。

  面对挑战,李世乭回应称,这将是有史以来第一次计算机程序在不让子的条件下挑战人类最顶尖的专业高手,他将很荣幸地应战。 “我听说DeepMind的人工智能很强,并且越来越强,但我有信心,至少这次能够赢得比赛。”。

  韩国围棋协会对这场未来的人机围棋大战表示欢迎,关于比赛结果,他们认为,“也许由于李世乭之前没有跟计算机对弈的经验,所以AlphaGo有可能赢个一两局,但是难以获得最终胜利。”

  如果对这场比赛下赌注,英国围棋协会成员、此前AlphaGo与樊麾战局的裁判托比·曼宁(Toby Manning)笑称,自己会押李世乭获胜,“但我可能不敢赌上很多钱。”■

责任编辑:崔筝 | 版面编辑:杜春艳
财新传媒版权所有。如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
  • 收藏
  • 打印
  • 放大
  • 缩小
  • 苹果客户端
  • 安卓客户端
推广

财新微信

热词推荐:
刘小华 内黄高堤杀人案女受害人照片 蔡英文 盲井 上海浦东机场爆炸 检方约见雷洋律师 钱芳莉 深圳警察 落马中央委员 韩春雨 雷洋 邢副所长 程博明最新消息 2016年6月国家大事 2016亚洲大学排名榜 昌平公安第二次通报