世界围棋普及(为什么从深蓝到阿尔法狗)

1996年春晚,郭冬临在小品《有事您说话》爆红后的第二年,又推出了新作《路口》。小品讽刺了专门给外地司机指路赚钱的一些人,播出后立刻制造了当年的流行语,“指路收费,缺德啊!”

世界围棋普及(为什么从深蓝到阿尔法狗)(1)

10年后,2006年,高德公司与一汽大众签订供货合约,正式成为一汽大众电子地图导航供应商,从此吹响了机器替代人指路的序曲。

20年后,2016年,每台智能手机都可以进行详细导航,我国自主研发的北斗卫星导航系统更是已经全球领先,精确度达到了0.5米。

可能郭冬临当年也不会想到,指路收费这个行当,没有因为他的小品绝迹于道德的审判,却伴随着科技的进步,无声地消失在了历史的涓涓细流中。

不仅仅是导航,无人驾驶、智慧城市、智能家居这些前所未有的新业态、新形式越来越成为现代生活的一部分,而隐身其后的人工智能也正在逐步把科学幻想变成现实。

世界围棋普及(为什么从深蓝到阿尔法狗)(2)

作为第四次工业革命中最具有根本性变革的前沿技术,人工智能当之无愧成为了未来国际竞争的关键战场。

据悉,日本文部科学省上个月底公布,2020年将把编程引入全国小学的必修课。

而我国,早在2017年国务院就在《新一代人工智能发展规划》中指出,实施全民智能教育项目,在幼儿园、小学、初高中到大学,设置人工智能相关课程,培养人工智能人才。

同时,全球咨询公司巨头麦肯锡更是宣布: 2030年,全球将有8亿人的工作岗位或被智能机器人取代,人数相当于现在全球劳动力的1/5。

既然人工智能将越来越深度影响到孩子的发展,今天就给各位介绍一下到底什么是人工智能,我们又该如何面对。

前方高能,即将进入硬核科普烧脑阶段,提醒没有时间或者是想看故事的朋友可以退出了。

我们继续。其实,“智能”的定义本身就颇有争议性,即使是专业研究人员也大都是从各自的专业角度进行阐述。

至于人工智能,就更是没有明确的说法。你可以把它理解成能够通过对环境的感知,做出合理行动的计算机程序,比如苹果产品中的siri助手;也可以是建构机器人或者是智能机器的科学技术领域。

世界围棋普及(为什么从深蓝到阿尔法狗)(3)

在《你一定爱读的人工智能简史》一书中,智能被定义为“搜索 评估”。我觉得这个解释相对来说比较接近本质,也好理解。搜索,大家都不陌生,指的是大量占有信息;评估,指的是在搜索的基础上对信息进行判断,从而指导行动。

人和动物其实无时无刻不在进行着搜索和评估,比如人在过马路时的观察和判断。而现阶段的人工智能追求的目标也基本上处于最大限度实现模仿人类智能的水平。

世界围棋普及(为什么从深蓝到阿尔法狗)(4)

这本书的作者山本一成是世界人工智能领域的代表人物之一。可能你对这个名字不太熟悉,但你一定听说过IBM公司的“深蓝”和谷歌公司的“阿尔法狗”。

山本一成开发的“PONANZA”程序与“深蓝”和“阿尔法狗”并称为人工智能史上的三大标杆。之所以大家不熟悉,可能是因为与前两个明星程序不同,“PONANZA”是一款针对日本传统棋类“将棋”研发的程序。

因为下面会举一些将棋的例子,先说两句关于将棋的题外话。

将棋位列世界4大棋类(围棋、世界象棋、中国象棋、将棋)之一。有一种说法,将棋是由唐朝时中国象棋演变而来;另一种说法是将棋和中国象棋都是从印度的“恰图兰卡”中演变出的不同分支。总之,在下文中可以把“将棋”类比成中国象棋。

世界围棋普及(为什么从深蓝到阿尔法狗)(5)

提人工智能,我们就不得不提到两次标志性事件,一是1997年在国际象棋领域,计算机“深蓝”第一次战胜了人类世界冠军卡斯帕罗夫;二是2016年,阿尔法狗人工智能机器人首次战胜围棋世界冠军、职业九段棋手李世石,并于2017年,战胜世界排名第一的围棋冠军柯洁。

这两次事件在当时都很出名,但大家有没有想过一个问题,同样是棋类比赛,在电脑软硬件都飞速提升的今天,为什么从国际象棋到围棋,战胜人类,计算机竟然用了20年的时间?

借用这个问题,正好可以把人工智能的三个发展阶段串起来。

一、人工智能的小学阶段,突破程序员的限制

我们先从计算机“深蓝”是怎样战胜人类的棋手说起。

计算机在我们生活中早已司空见惯,小到手机、大到飞机的操控系统,电脑的身影无处不在。但从本质来讲,看似无所不能的电脑其实只有两个功能——计算和存储。

除了不断重复单纯的计算和存储外,它基本上就没有别的功能了。之所以我们会感到电脑无所不能,是因为程序员用计算机语言提前写好了程序,也就是先给电脑下达了如何计算的命令,从而让电脑能够解决更多的问题。

那么,在国际象棋比赛中,计算机是因为存储了所有的棋局,然后根据对手的行动调用能获胜的那一盘来应对吗?

刚开始时,程序员们也是这个思路。但是很快就发现这样做根本行不通,因为可能出现的棋局实在是太多了。

就拿变化数最少的国际象棋来说,理论上它产生的所有棋局数将达到 〖10〗^120个,也就是1后边有120个零。

这是什么概念呢?谷歌公司大家都很熟悉,其实这个名字来源于一个数学单位古戈尔(Googol),表示的数量是1后面有100个零。据推测,宇宙内可观测的所有原子数量尚不足1古戈尔,而国际象棋的全部可能棋局数比1古戈尔还多出来20个零。

我本来想用多少倍来描述这个感觉,2个零是100倍,20个零到底是多少倍呢?国际象棋变化数比全宇宙可观测的原子数多多少,竟然用文字很难说清楚。所以,这都不是天文数字能够形容的了,虽然计算机与人脑相比擅长计算和存储,但是对于这个量级的计算也只能是望洋兴叹。

而我们古老的围棋所有的棋局数为 〖10〗^360个,以现在的计算机水平,从宇宙大爆炸一直计算到今天也计算不完。

世界围棋普及(为什么从深蓝到阿尔法狗)(6)

既然没法得到全部可能的棋局,那该怎么办呢?还记得我们开始说到的智能等于搜索加评估吗?程序员开始从这个思路寻找办法,并提出了机器学习的概念。

当对方落子后,电脑首先会搜索所有可能的落子点,但与以往不同,计算机不会对每个落点都展开推测,而是推测那些相对来说赢率比较大的落点。

那怎么确定谁的赢率大呢?这就涉及到了评估。山本一成介绍说,开始时,程序员对每个棋子手动设置不同的权重。以将棋为例,如飞车值1500分、桂马值500分,同时棋子的分布距离也一一设定好分数。就好比中国象棋里车、马、炮本身和他们之间的位置都设定了不同的价值,计算机通过最后的求和,得出一个最优解,然后移动棋子。

虽然其中涉及了很多具体的高等数学运算,但深蓝大体上就是基于这种思路取得的胜利。之所以首先在国际象棋领域取得了成功,是因为国际象棋的棋子机动性非常强,因此棋子数量的多少与胜负直接相关,这就使评估分数的设定相对容易了很多。这也是20年前就能取胜的主要原因。

但是,大家可能已经发现,这种设计过于机械,对于将棋或者中国象棋并不适用。因为在象棋中不可能因为谁的棋子多谁就明显有优势,也不可能因为车的权重比卒子大,就一直要移动车,事实上这两种棋类棋子的位置和分布更加重要,而且每个棋子的重要性都会因为形势的不同而发生变化,如果想要得到最佳的评估值,以将棋为例,需要考虑的因素目前已经在1亿左右,也就是说,仅凭人力,根本无法对这些项目逐一调整赋值。

世界围棋普及(为什么从深蓝到阿尔法狗)(7)

为了解决这个问题,程序员们又想出来第二个办法,就是借鉴人类的学习方法,让电脑跟人类的高手学习,努力下出与冠军一样品质的棋局。

具体的方法是,将已有人类比赛的棋局全部数据化,然后输入电脑,同时,以这些冠军棋谱为标准,让机器自己调整评估的权重。

比如,在相同的局面下,不再机械地为每一个棋子固定打分,而是以冠军棋局为标准进行赋值。也就是说,车再也不是固定的1500分,如果以前的人这时选择移动了卒子,那计算机就会据此为卒子赋值1500分。

这种脱离程序员的设定,尝试让电脑自动调整评估数据的思路被称为机器学习。从机器学习开始,人们的主要任务不再是教给电脑知识,而是教给电脑学习的方法。

这就像是我们不再让电脑记住所有的棋谱,而是让他学会人类的思路。

当电脑能够模仿出人类冠军的棋路后,我们又要求它不断调整参数,进行试错,从而找出更好的可能性,这被称为强化学习。后来,在将棋比赛中电脑凭借机器学习和强化学习的成果,取得了良好的战绩,并从2012年开始逐渐能够战胜人类的专业棋手。

二、人工智能的中学阶段,突破自然科学的还原主义限制

利用机器学习,电脑终于开启了向人类一样思考的可能,现在的无人驾驶等技术都是这种思路的反应。而在机器学习的道路上,深度学习成为人工智能进一步快速发展的强劲引擎,同时,也让人类开始越来越无法理解人工智能内部到底是如何运转的。

我们继续从人工智能在棋类的表现中观察它的发展。上面大家已经知道了通过机器学习解决了将棋的评估指标赋值问题,从而让电脑的下棋水平得到大幅度飞跃,那么围棋是不是也可以采用同样的方法呢?

世界围棋普及(为什么从深蓝到阿尔法狗)(8)

答案是否定的。无愧于“人类智力皇冠上的明珠”称号,这套方法对围棋来说竟然完全无效。

在将棋中,我们可以为不同的棋子和棋子间的位置关系赋予不同的分数,从而完成评估,选出该移动的棋子。虽然这需要考虑1亿多个不同的影响因素,但是对于电脑的计算量来说还能够负担。

然而,在围棋中我们该以什么作为评分的标准呢?是棋子的重要性吗?不同于象棋的车、马、炮,围棋的每个棋子都是一样的。是棋子之间的位置关系吗?不同于象棋中“帅”的中心位置,围棋中我们根本就不知道重点该关注哪些棋子的位置关系。

也就是说,将棋等棋类是难在给出一个准确的评估分数,而围棋却难在根本就不知道该去评估谁。

世界围棋普及(为什么从深蓝到阿尔法狗)(9)

为了解决这个问题,人们找到了深度学习的办法。所谓的深度学习是一种模拟人脑构造,利用神经元技术的学习方法。神经元就是人类大脑中最基本的神经细胞,仅大脑皮层就分布着140亿个神经元,我们常说的大脑灰质或白质就是因为神经元不同部位聚集呈现出的不同颜色。

世界围棋普及(为什么从深蓝到阿尔法狗)(10)

大脑之所以能够进行识别和判断,神经元发挥着重要的作用,大致的流程是信息从感觉器官流入神经元,经过神经元的加工,得出一个结论,再进行输出指挥行动。虽然这个过程很好理解,但其中神经元到底是如何进行辨别的,对于我们来说仍然是一个迷。

世界围棋普及(为什么从深蓝到阿尔法狗)(11)

而深度学习也是模仿了大脑的运行方式,如下图,让信息流过一层层的函数程序,最终得出一个结论。

世界围棋普及(为什么从深蓝到阿尔法狗)(12)

所谓的“深度”是指神经网络的层数被深度叠加,可以简单的理解成层数越多,精度越高。

对于神经元网络的具体计算函数,限于篇幅本文就不过多介绍了,总体来说,这是一种抓住事物特征,利用统计学思路来迂回认识事物的方法。

世界围棋普及(为什么从深蓝到阿尔法狗)(13)

给大家举个例子:假如我们要判断一个隧道会不会塌陷,传统的方法是先从土壤、地质条件、隧道尺寸等方面进行分析,将得到的各种参数带入力学公式进行计算。

而利用神经网络来判断是先大量输入已经塌方隧道的各种位移数据,训练出一个成熟的神经网络。然后再把现在要判断的隧道位移输入进去,计算机就会根据以前的经验给出结论。

其实,就算我把神经网络的知识从头介绍一遍,我们还是没法理解计算机用神经网络到底做了什么。

这种思维方式不容易让人接受,通常我们都会在科学上用一种还原主义的角度看待事物,比如看到一个钟表,我们会试图从齿轮开始理解,然后把握住所有的组合构造原理,最后理解整个钟表。

但是就如大脑一样,在人工智能的网络里,即便我们能够设计每个神经元,但是当他们开始组合运转后,我们还是无法知道里面到底发生了什么。

回到围棋。正是因为采用了神经网络的深度学习方法,计算机才最终解决了围棋无法评估的难题。

因为这种学习方式已经完全绕开了传统的评估思路,正如判断隧道塌方不是靠的力学推理,阿尔法狗下围棋也不是靠的围棋规则,而是靠的图像识别。

具体的过程为,首先阿尔法狗仍然要大量研究人类顶尖棋手的棋谱。但他会将每一盘棋分成三种组合,即只有黑子的棋盘、只有白子的棋盘和空白区域的棋盘。

然后,将三种棋谱作为三个特征输入神经元网络,根据人类棋手的下棋顺序,利用神经元网络不断叠加出与人类棋手靠拢的画面,并存储。

只是因为这一种方法的改变,阿尔法狗就可以成功预测出职业棋手57%的棋路,达到业余3段的水平。

世界围棋普及(为什么从深蓝到阿尔法狗)(14)

另外,人工智能和人的最大不同就在于,一旦人工智能找到突破的正确方法,他改进的速度是呈指数级上升的。

我们经常听说在李世石比赛的当晚,阿尔法狗还在不知疲倦的自己与自己下棋就是这个道理。

有了深度学习的初步成果,利用强化学习不断试错,加上一些其他类似蒙特卡洛法的胜率预测策略,人工智能终于抛下了人类的模板和不解,独自迈上了自己新的高峰。

三、人工智能的大学阶段,突破人类智慧的限制

人工智能在智能领域正在努力赶超人类,甚至在像围棋这样的领域已经完全超过了人类。那么,人工智能的下一个目标又是什么呢?它终将超越人类的智慧吗?

我们一直都在讨论人工智能的智能问题,山本一成认为,人类和人工智能目前最大的区别就在于人类有智慧,而人工智能没有。二者的区别在于:

智慧=设定目标的能力

智能=寻找通往目标途径的能力

人类除了能够设定终极目标,还能不断分解成中间目标,而目前的程序还没有证据表明能够实现这个能力。

程序都是由人类编写,迎合人类的需求,暂时还不可能超越人类思想的界限。

但是,随着深度学习和强化学习的发展,计算机也许终究有一天会在复杂的迁移和融合中产生自己设定目标的能力。尤其是对中间目标的设定将会产生巨大的影响。

拿阿尔法狗设想一下,它的终极目标是要赢得围棋的比赛,这是人类为其设定的,但是如果真的有一天阿尔法狗产生了自己的中间目标,他很可能会将中间目标设定为自己更加容易实现的“灭绝人类”,因为只要消灭了人类,对手弃赛那自然它会赢得比赛。

虽然这是一个看起来荒谬的科学幻想,但是怎么才能防止这种情况在未来真的出现呢?

为人工智能树立良好的伦理观是一个值得考虑的方案。与阿西莫夫的机器人学三大法则不同,简单为机器人设定不许伤害人类的法则也许根本行不通。

世界围棋普及(为什么从深蓝到阿尔法狗)(15)

事实上,在人工智能的深度学习之初,它需要大量的人类经验作为模板。而为了得到大量的数据,活用网络图片及相关对应的文章进行训练是常用的一个手段。

这会带来一个问题,计算机会学习到大量人类充满恶意的标签。谷歌相册曾经就出现将黑人的照片识别成大猩猩的事件。

同样,微软的AI聊天机器人也出现过在网络吸收了大量歧视性色彩言行后,开始不断重复不当言论的案例。

从这个角度来说,人工智能确实十分危险,但是这个问题归根结底可以归结为“人类自身的问题”。

人工智能更像是人类的孩子,它会从我们身上得到经验,变得更加聪明和强大,同时,也会继承我们的伦理观。

前几天,软银的孙正义在MWC上发表演讲预测说,30年后,超级人工智能将全面实现。山本一成也认为,至少在21世纪结束,人工智能就将自人类毕业。那么,如何让人工智能像孩子一样仍然能保持对人类的尊敬和喜爱,也许我们只有一条路可以走,那就是像对待自己的孩子一样,在网络世界里尽可能地做一个“好人”。

「关于我」二孩爸爸,父母与孩子共同成长理念践行者,今日头条等多平台签约作者,深度阅读爱好者。关注我,为你介绍育儿书籍,精选最新育儿理念。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页