聊聊大伙儿(包括某些职业围棋手)对 AlphaGo 的误解

2016-03-11科普 IT

★引子


  最近2-3天的新闻,大伙儿想必也知道了——AlphaGo 基于【公平规则】对阵人类第一流的围棋手,已经先胜两局,而且都是完胜。
  俺也算是一个围棋的业余爱好者,而且俺也比较关注 AI(人工智能)的发展,今天冒昧写一篇点评。
  所谓的“冒昧”,因为这两方面都只是俺的爱好,而【不是】擅长。说得不对之处,欢迎大伙儿拍砖。

★AlphaGo 的背景介绍


  本来想先写一段背景介绍,让大伙儿稍微了解一下 Alpha Go(俗称“阿尔法狗”)的原理。后来发现知乎上有一篇现成的,写得挺详细,而且比较通俗易懂。链接如下:
https://www.zhihu.com/question/39905662
(如果你不希望让知乎看到你是从俺博客跳转过去的,可以把这个网址复制,然后新开一个浏览器标签页,再粘贴到地址栏)
该问题下面有好几个回答,参见其中的《左右互搏,青出于蓝而胜于蓝?—阿尔法狗原理解析》
  这篇文章通俗介绍了“深度卷积神经网络”、“蒙特卡洛搜索树/MCTS”、“通过强化学习自我进化”。这几项是 AlphaGO 战胜人类的法宝。

★误解之1:围棋 AI 仅仅是依靠棋谱(历史对局)


  很多人误以为:围棋程序【仅仅】依靠大量的历史对局来作为参考。一旦出现全新的下法就不知所措。
  至少 AlphaGo 这两局的表现,表面这是一种误解。下面俺来聊一下。
  实际上,李世石一开始也抱有这种错觉,所以第一局的开局,李世石采用了一个罕见的开局。据说在职业比赛中,从来没人用过这个开局(棋谱如下)。
不见图 请翻墙

  李世石估计是想调戏一下电脑,看看电脑如何应对一个从来没出现过的开局
  (请注意:首局是“猜先定黑白”,李世石猜中之后,主动选黑。如果是职业比赛,通常是选白。说明李世石想要主导布局)
  但是 Alpha Go 对这个开局应对自如(以下是 AI 在后续几手的应对)。
不见图 请翻墙
不见图 请翻墙

  职业棋手李喆的评价是(粗体是俺标注滴):
白8挂角正常,黑9二间高夹最为激烈。白10,这一手……非常出色。
通常情况下,在右上白8遭遇二间高夹的时候,白10是“不存在”的一手,它不在任何定式之中。面对黑9,白棋有诸多定式选择,却没有白10这一手。
然而,我认为白10是好手。白10的好处在于使黑7变成效率低下的一手,虽然在右上局部白棋稍稍亏损,但加上黑7的低效,白棋一点也不吃亏。

★误解之2:围棋 AI 不擅长“布局”


  还有一种常见的误解是:围棋程序不擅长布局。
  为啥会有这种误解捏?确实在早期的围棋程序中,布局都比较烂。因为电脑擅长的是【计算】,而布局阶段凭的是【感觉】。“棋感”这种东西,是很难用程序来进行量化的。
  但是 AlphaGo 就不同了——这个家伙的布局很牛。请看第2局的布局阶段,电脑下出了布局的妙手。
不见图 请翻墙
  这是 AlphaGo 的又一个妙手。对这一手,职业棋手评价非常高:
聂卫平说“对狗的下法脱帽致敬”
现场的英语解说员雷德蒙德和加洛克点评说“黑37手具有围棋名宿吴清源的风范”(雷德蒙德是目前唯一的非东亚裔的职业九段)。
曹大元说“这是特别意外的情况,在此之前没人这么下过。职业棋坛对这一手棋褒贬不一,有人特别赞赏,有人特别业余。但是这一手棋是超出职业棋手想象的,对棋手有很大的启发。”

★误解之3:围棋 AI 缺乏“大局观”


  其实在前面第1个例子,AlphaGo 已经体现出很好的大局观了。它没有按照定式去走右上角,是为了消解右下方的“黑7”子。
不见图 请翻墙
不见图 请翻墙

  另外,同样在第1局,电脑下出了“白102”。在当天的评论中,有职业棋手认为:这一手可以载入史册。
不见图 请翻墙
  面对这一手,李世石长考很久,后来依然吃了大亏。
  大多数职业棋手都没有想到 102 这一手,即使少数人想到了,也未必敢在实战中使用——因为后续的变化分支太多太复杂。

★误解之4:围棋 AI 缺乏“创造性”


  之前很多人都觉得——只有人类棋手才有创造性,围棋程序是不可能创造性的。
  但是你看这两天的对局,AlphaGo 下出了很多职业比赛从来没有出现过的下法。并且这些全新下法,对它而言是有利的。但是从来没有人类棋手这么下过。
  这当然就是创造性!
  比如第一局的“白86”,韩国金成龙九段的评价是:成为职业棋手27年来,第一次看到白断这手棋!
不见图 请翻墙

★误解之5:关于 AlphaGo 的“缓手”


  这两局比赛,AlphaGo 出现了好几个奇怪的下法,被某些职业棋手认为是“缓手”(比如下面几例)。
不见图 请翻墙

不见图 请翻墙

  但实际上他们不了解 AlphaGo 与人的差异。AI 追求的是【获胜的概率大小】,而不在乎赢多少目。当电脑面临 X Y 两个选择。有可能 X 比 Y 会多赢很多目,但 X 比 Y 的获胜概率略小。那么电脑还是会选择 Y 而不是 X。
  或许可以这么说:当 AlphaGo 开始下出所谓的“缓手”,就意味着——它认为自己胜券在握了。
  从这两天的对战情况,也大体是如此。

★误解之6:关于 AlphaGo“不擅长打劫”


  因为这两局比赛都没有出现劫争,于是又冒出一种说法——“AlphaGo 不擅长打劫”。甚至还有小道消息称:Google 与李世石之间有保密协议,约定不得使用打劫。
  俺觉得:AlphaGo 在两天之内能下出这么多妙手,不至于连打劫都不擅长。它的“深度神经网络”既然如此优秀,评价“劫争”的局面优劣,应该不在话下。
  很多人都希望——后续的对局中,能看到 AlphaGo 下出精彩的打劫。
  补充:
  本文发出后,某热心读者在评论区4楼1单元贴出了 AlphaGo 作者的【辟谣】——没有所谓的“保密协议”,Google 团队也希望 AlphaGo 能下出劫争。
  继续补充:
  本文发出的次日,俺在晚上看到某个职业棋手的辟谣——早在5个月前,AlphaGo 对战樊麾的时候,已经有两盘棋【出现了劫争】。
  所谓“AlphaGo 不擅长劫争”的言论,可以休矣!

★误解之7:关于 AlphaGo 的棋力


  比赛前,几乎所有职业棋手都看好李世石,大部分职业棋手断定李世石能以5:0全胜。李世石赛前也说——自己的目标是一盘都不输。
  如今的局面,很多人已经大跌眼镜。
  为啥大多职业棋手出现如此严重的误判,有如下两个原因:
1、长期以来,围棋软件的水平都很烂,连业余选手都无法战胜
2、虽然 AlphaGo 已经在5个月前,战胜了欧洲冠军樊麾(职业二段)。不过捏,很多人都认为樊麾的棋力太弱,而 AlphaGo 赢得也不够漂亮。
(殊不知,AlphaGo 可以通过不断自学习来自我提升,5个月的时间,AlphaGo 已经今非昔比了)

  第一天(3月9日)的比赛结束后,柯洁九段在个人微博上称:“就算阿尔法狗(AlphaGo)战胜了李世石,但它赢不了我。”
  俺不清楚他这句话是真实想法,还是为了替自己造势。如果这是柯洁的真实想法,很可能柯洁严重低估了 AlphaGo。
  在第二天(3月10日)的比赛中,小李明显是全力以赴的。曹大元九段评价说:如果昨天李世石的发挥只有70到75分的话,那么今天是90到95分。
  结果捏,小李再次完败。英文发布会上的翻译是“clear loss”。整个比赛都是 AlphaGo 在主导,小李貌似没啥机会。
  某些职业棋手称——看第2局的中盘,AlphaGo 已经超过全盛时期的李昌镐。
  前面俺说了——电脑在乎的是【获胜的概率】,而不是赢多少目。所以,千万不能以胜负目数来衡量 AlphaGo 的棋力。你让它跟业余选手下,它或许也是赢这么多目。
  俺觉得:如果真的要进一步衡量 AlphaGo 的棋力,没准应该安排 AlphaGo 与人类顶尖旗手下“让子棋”(让人先下N子)

★结尾


  在本文的结尾,俺引用国际围棋联盟秘书长李夏辰(韩国棋手、职业3段)的一段话:
第一次听说电脑要挑战顶级棋手李世乭时,我非常惊讶。我觉得挑战者一定对顶级棋手有多强毫无概念;
但事实上,是我对电脑有多强没有概念。
  俺觉得:大部分职业棋手对 AlphaGo 有多强,依然缺乏足够的认识。

俺博客上,和本文相关的帖子(需翻墙)
每周转载:关于人工智能对人类的影响(网文3篇)