留给李世石的时间已经不多了...我已经出了4W包辣条,赌阿尔法狗赢!
2016/3/9 酷玩实验室
无论如何,公元2016年3月9日都将会是载入史册的一天。
这一天,人类围棋界的精英,捍卫人类智慧的韩国棋手——李世石,与以科技巨擘谷歌为靠山,坐拥顶尖人工智能的围棋引擎——AlphaGO决一死战。
无论哪一方胜利,这都是人类的胜利。
从12点多开始,我们和弹幕直播一起看比赛
虽然全程我都没有看懂,解说也没有听懂,但是我还是赌了1800W瓜子李世石会赢——

然而结果…………
李世石在赛前说:我一盘都不能输。
然而结果…………
不过,无论如何,这只是划时代的五番棋的第一战。虽然接下去的几战,对李世石来说会更艰难。
不过对于我们来说,无论是棋手、码农、攻城狮、学生……又或许任何身份,都已不再重要。只要你身为一个人类,我们便关注这场人机世界大战。

此战以后,我们要如何看待人工智能?
此战以后,我们要如何看待人类自身?
如果深蓝战胜卡斯帕罗夫时你还小,如果谷歌公开AlphaGO战胜樊麾时你后知后觉……
那么好吧,这一次,别再做个碌碌无为的看客了。本文会将二位对手的资料和内幕一一奉上,你大可以凭借自己的人类智能,来一个胜负大预测!

决战对手之一:
李世石到底有多强?
李世石,1983年3月2日生于韩国全罗南道。1995年初次入段, 2003年时,因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接升为九段。

李世石的棋风力量感十足,他善于敏锐地抓住对手的弱处主动出击,以摧古拉朽的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。

李世石是围棋领域曾经的世界第一人。
其职业生涯获得的重要冠军有:第8届春兰杯冠军,第15届、16届、18届富士通杯冠军,第9届、12届、13届、17届三星杯冠军,第7届、第12届LG杯冠军,第2届、第3届丰田杯冠军。


截止至2015年底,李世石世界排名第四,Elo等级分3532
李世石的四大武器
作为顶尖棋手,李世石所拥有的是人类围棋界的四大法宝,也是人类围棋一直以来战胜计算机的不二法门。
1. 常识:所谓常识,是对常见棋形的熟悉,理解和掌握。虽然千古无同局,但实战中无论多复杂多新颖的棋形,都是由简单而反复出现的基本棋形组合而来的。
2. 棋感:即所谓“第一感”。当棋手积累了大量的常识和对局经验之后,在看到每个局部的棋形组合后,都会对下一步产生感觉性的猜测,这种猜测将成为计算的入手点。
3. 计算:计算过程,是对于未来棋局在脑海的预演,这种预演能力是围棋的核心能力。无论任何高妙棋感,都需要接受计算的考验和证实。
4. 判断:对计算出的不同预演结果进行优劣判断,从中选择最优解。这是思维过程的最后一步,也是最难的一步。随着棋力的提高,这一步之难将愈加凸显。
对上述内容分析之后,我们不难看出,常识和计算将是人机双方对弈时火力集中的攻击点。而棋感和判断,相对较虚,难以捉摸和把握,也是人工智能一直以来渴望攻克的难关。

李世石是怎样下棋的?
正如每个人类棋手一样,从总体而论,李世石的下棋思路也无非是以下三个步骤:
Step 1:对全局的形势进行通盘分析。
Step 2:判断棋局的局部,寻找出几个相对有利的落子点。
Step 3:预测接下来数步的棋局变化,判断并选择最佳的落子点。
然而,李世石最为人称道,或者说人神共愤的,则是他的“僵尸流”棋风。
所谓僵尸流,是指利用弃子战术,需找敌方弱点作战。李世石对死活、厚薄的理解往往异于常人,能从死棋中找出死而不僵的棋形,从中发现反击手段,控制节奏把握棋局。

李世石的胜利宣言
李世石在赛前提到,自己看过AlphaGO的对局,也会做一些针对性的准备。他认为AI的棋力相当于职业三段的水平,并不是自己的对手。同时他也表示,希望人类都支持自己,争取让对手赢不到两盘。
然而,现在已经被打了一半脸了……

决战对手之二:
AlphaGO到底有多强?
AlphaGO是由谷歌旗下的GoogleDeepMind公司所研发的,一套专为围棋而优化的深度学习引擎。
这家英国公司创立于2010年,本名为DeepMind Technologies,以研究人工智能为主要目标,2014年被谷歌收购。他们尝试通过合并各种机器学习的方法,搭配神经网络科技,来构建强大的通用学习算法。
这套算法的最初目的,居然是为了实现人工智能玩游戏。而且他们研究的游戏范围还很广,从策略型游戏围棋到网络电竞,再到单机电玩,无所不包。

AlphaGO的主要开发人员为:大卫·西尔弗(DavidSilver)、黄士杰(Aja Huang)和戴密斯·哈萨比斯(Demis Hassabis)
大卫·西尔弗(David Silver):围棋人工智能和强化学习的顶级专家,业余围棋爱好者。毕业于剑桥大学,在加拿大阿尔伯塔大学获得PhD学位。英国皇家社会成员,现为伦敦大学学院计算机系助理教授。

黄士杰(Aja Huang):围棋业余六段,台湾师范大学资讯工程研究所PhD,曾设计过围棋人工智能Erica,荣获了TAAI 2009年计算机围棋竞赛19路银牌及9路铜牌等战绩。

戴密斯·哈萨比斯(Demis Hassabis):人工智能研究人员,神经科学家,电脑游戏设计者,毕业于剑桥大学,并获得伦敦大学PhD学位,其研究兴趣包括机器学习和神经科学。

截止至2015年底,AlphaGO的围棋等级分Elo是3168。AlphaGO即使让此前其他顶级围棋AI(如CrazyStone、Zen等)四子,依然能够取得80%以上的胜率。而在与职业二段棋手樊麾的对战中,取得5:0获胜的绝对优势。

AlphaGO和其他围棋AI的Elo等级分以及对应职业水平对比图
AlphaGO的三大武器
AlphaGO拥有两个深度神经网络:基于谷歌云计算巨量数据的策略网络(Policy Network)和估值网络(Value Network),再结合传统人工智能方法蒙特卡洛树搜索(MCTS),构成了人工智能的三大武器。

1.策略网络Policy Network,其实是一个落子选择机制,它着眼于每一步弈棋的下法。
它又细分为三个部分:
突破策略网络(RolloutPolicy Network),通过对盘面的初步判断,得出一个准确率较低的落子选择。

国际象棋的AI落子思路

围棋的AI落子思路
模仿策略网络(SLPolicy Network),通过调用谷歌云存储中上百万的人类对弈棋谱,模仿人类的下棋走法,预测人类的下一步落子位置。
学习策略网络(RLPolicy Network),通过两个AI之间互相自对弈,不断地学习和提高棋力。在学习期间,AlphaGO每天可以自对弈一百万盘之多,而人类一辈子也下不到一万盘棋。
2.估值网络Value Network,则是一个局面评估机制,它注重于对全局形势的判断。
估值网络通过对全局位置的判断,分析出局面形势,并进行一个价值评估,准确率可达80%以上。
虽然AlphaGo评估的位置只有深蓝的几千分之一,但这正是由于它使用了策略网络,可以更智能地选择位置;再加上估值网络,可以实现更精准的局面评估。
这才是更接近人脑下棋的方式,而不是简单粗暴的穷举法。

3.蒙特卡洛树搜索 Monte-Carlo Tree Search,则是实现围棋这样超高复杂博弈机制的一种随机算法。
蒙特卡洛算法,是由乌拉姆最早提出,再经数学天才冯·诺伊曼发展和完善,以赌城蒙特卡洛命名的一种算法。
在过于复杂的局面中,人工智能由于硬件缺陷,无法实现穷举级别的采样,而蒙特卡洛算法正是在采样不足的情况下,通过尽可能多次的随机采样,一步一步接近最优解。
举个简单例子你就可以理解。比如有一堆钻石,每次随机选一枚,选中更大的就留下。那么经过越来越多次随机选择,最终留下的那枚钻石,就必然越来越接近这堆钻石中最大的。但是由于随机的缘故,在不遍历每一枚钻石的情况下,只能接近最大,而不能确认最大。

与之对应的是另一个以赌城之名命名的算法——拉斯维加斯算法,则是为了一步一步确认最优解。
它的例子是,比如有一堆钥匙,只有一个能打开锁。每次随机选一把,打不开则再选。那么经过越来越多次随机选择,找到正确钥匙的几率也就越来越大。但是由于随机的缘故,在不遍历每一把钥匙的情况下,并不能确定一定可以找到。

在围棋这样的博弈游戏中,并不存在绝对正确的下法,所以自然应当运用前者。并且,正是由于蒙特卡洛算法的运用,围棋的人工智能才得到了突飞猛进。
AlphaGO是怎样下棋的?
身为集结多种尖端技术于一身的人工智能,AlphaGO的下棋思路可以简化为以下四个步骤:
Step 1:通过突破策略网络和模仿策略网络,找出下一步棋的数个备选走法。
Step 2:利用蒙特卡洛树搜索,从数个备选走法中找出接近最优的走法。
Step3:利用估值网络对这一走法产生的局面进行评估,将评估结果作为当前棋局下的下一步走法的估值。
Step 4 :结合下一步走法的估值和模仿策略网络进行反复的模拟,根据选择次数最多的下法,确定最终的走法。

AlphaGO的下棋思路和步骤
在和樊麾的对弈中,AlphaGO表现得并不仅仅纠结于局部的得失,而更注重通盘大局的考虑。这也恰恰是人类围棋智慧的体现。说AlphaGO真的像人类一样下棋,并不为过。
AlphaGO的胜利宣言
AlphaGO的开发者之一哈萨比斯认为,AlphaGo有拟人的围棋思维,却不会有人的情绪波动。人类互相对弈露出破绽时,彼此都有无数机会;然而与AI下棋,露出破绽说不定就结束了。他最后说,绝大多数职业棋手认为AlphaGo会输给李世石,但我们的内部测试结果可不是这样。

有了以上的信息,
我们来预测一下谁会赢吧!
今天作为弹幕的我们,
都是围棋十段!
别忘了到时候来结算哦!

酷玩实验室原创作品
作者/眠眠,编辑/蛋蛋姐
如需转载,请联系授权
说到好玩的新玩意儿
我们正打算组团
去台湾看新发明
欢迎戳“阅读原文”了解详情!

▼ 点 击 阅 读 原 文
▼ 查 看 台 湾 行 详 细 介 绍
http://www.duyihua.cn
返回 酷玩实验室 返回首页 返回百拇医药