二代水遁大师漫画（人工智能下象棋）

你傻妞而已 2022-12-12 23:40:14

收藏赞分享

图文原创：谭婧

二代水遁大师漫画（人工智能下象棋）(1)

谭婧老师爱下象棋，就是谁也赢不了。

去公园下了一盘棋，第一步我就走了一个当头炮，剩下的都是大爷们帮我走的。

结果，我输了。

经过他们的总结研究，我第一步走错了。

二代水遁大师漫画（人工智能下象棋）(2)

2022年，象棋AI下棋机器人，问世了。

我和它对弈了一盘，结果，我赢了。

很有自知之明的我，严重怀疑设计者增加了噪音，降低了棋力。让我赢得很舒服。

但我没有证据。

怎么说呢，我就喜欢高情商的AI象棋机器人。

低情商的机器人只会冷漠地碾压我：“下不过我，就别废话。”

仿佛不仅嫌弃我棋臭，还嫌弃我话多。

二代水遁大师漫画（人工智能下象棋）(3)

而高情商的AI象棋机器人，大为不同。

它伸出胳膊，温柔地摆出“请”的姿势，它居然有机械臂。

二代水遁大师漫画（人工智能下象棋）(4)

情商和机械臂都不是重点，聊聊它的智商从何而来。

AI象棋机器人是人工智能技术中深度学习与强化学习的成果，击杀四方。

任何人工智能都离不开数学基础原理，在此，首先得感谢尊敬的贝尔曼（Bellman）教授。

二代水遁大师漫画（人工智能下象棋）(5)

以他名字命名的贝尔曼方程，在绝大多数强化学习的成果中都会用到，比如象棋AI下棋机器人的远方表哥，自动驾驶。

它们是亲戚，“血缘关系”是“最优决策”。

二代水遁大师漫画（人工智能下象棋）(6)

强化学习是要在多种决策中评价，找出好的决策。

强化学习在象棋中，就是在多种走法中找到最好的走法。

围观数学公式的人少，围观下象棋的人多。

我们抛开公式，用决策树表示每一步的输赢，非常直观。

一盘三十步的象棋比赛，会是一颗很大的决策树，有很多枝叶。

二代水遁大师漫画（人工智能下象棋）(7)

计算机下象棋的棋力，早就超越了绝大多数的人。然而，至今没有任何一款计算机软件达到全知全能的“棋神”状态，连AI也不行。

那在下象棋这件事情上，AI这几年在忙活啥？

二代水遁大师漫画（人工智能下象棋）(8)

那要从几十年前讲起了。

1980到1990年代，深蓝计算机是大公司的，小霸王游戏机是大家的。

假如一个人类象棋高手下一步棋，能看未来八步棋。就好比一下能想到决策树上的第八层。

传统象棋软件说，这我也行。

二代水遁大师漫画（人工智能下象棋）(9)

话是没有吹牛，传统象棋软件确实可以做到。

可是，再往前多算几步，所耗时间和计算存储可能都要翻倍。或者说，情况急转直下。

二代水遁大师漫画（人工智能下象棋）(10)

在旧式象棋软件的时代，得想办法减少计算量。所以，有了阿法贝塔剪枝。

这虽然有“偷懒”的嫌疑，但我也没有证据。

阿法贝塔剪枝的方法，相当于提前知道哪些搜索是没有意义的，排除错误答案，用巧思“偷懒”，相当于省略做题过程。

二代水遁大师漫画（人工智能下象棋）(11)

旧思路在象棋上还能支撑，用在围棋上力有不逮。

（因为围棋是19×19的一个矩阵，每步可选择的走法要比象棋多一个数量级。）

从旧式象棋软件时代，人们就为棋力算分。这是一个起源很早的好办法。

那么得分是怎么来呢？

用一个数学函数把有利赢棋的因素都考虑进去。

以至于，中国象棋协会也有象棋大师用此来构思好棋。

二代水遁大师漫画（人工智能下象棋）(12)

有了分数，僵化的下象棋，就是“哪步得分高，就走哪步”。

然而，象棋是一个非常讲究全局观的游戏。

追求最终取胜，不追求每一步占尽优势。

比如，战术性丢车保帅。

深度学习模型在象棋面前暴露了“缺点”，它算出当下局面的胜率，但是，并不能估算出后续局面的胜率。

所以，需要一个重要的动作来加持：搜索。

从决策树上理解，就是考虑的越多越好。

如今，能搜索到决策树里非常深的层数，这就意味着，招数更多，棋路更多，对胜利的把握就越大。

二代水遁大师漫画（人工智能下象棋）(13)

谈到如何处理搜索量大，就谈到了蒙特卡洛树搜索是学霸特供技能，对大多数人来说，都很难。

甚至可以这样说，就是题目很困难，算不出来，只好求助于概率，求助于实验。

一顿猛如虎的严谨分析算不出来。来吧，学霸直接撸起袖子做实验。

二代水遁大师漫画（人工智能下象棋）(14)

蒙特卡洛方法的做法虽然看起来比较随意，但却有着坚实的理论基础：大数定律。

在计算机眼里，棋子挪动一步，都算一个新的棋局，所以棋局数量何其之多。

一个厮杀正酣的棋局，往后走，可能衍生出10000种棋局。

借助蒙特卡洛树搜索这一方法，看未来几步怎么走。或者说，当AI象棋机器人，有了强化学习，就有了“大局观”。

我们马上进入学霸区特供：《AI象棋机器人所用的蒙特卡洛树搜索》。

二代水遁大师漫画（人工智能下象棋）(15)

这就是深度强化学习，模型收敛的目标是，把胜率估计越准越好。经过多轮训练，胜率会越来越准。

胜率是AI象棋机器人的KPI，每下一步都估算胜率。每一步，尽量把胜率提高。

常识是，高手胜率高，低手胜率低。

问题来了，高到多少，低到多少。每一步的胜率很难准确估算，只能估大致范围。

而且，把胜率提高的前提是，得把胜率算准确。

二代水遁大师漫画（人工智能下象棋）(16)

在如此模糊的情况下，数据里会有误差。因为有误差，所以AI象棋机器人只能知道“棋神”的方向是什么，它想方设法逼近这个方向。

象棋AI机器人的棋力水平的训练方法是，AI，加上蒙特卡洛树搜索，然后再教导AI本身。

这个过程类似总结经验，这样使得它的棋力飙升。

可以说，AI象棋机器人强大之处得益于蒙特卡洛树搜索。

超越人类是很早以前的本事了，现在追求棋力丝滑上升，情商在线。

让棋力水平菜，还有棋瘾的人，也能玩得开心（请不要在我下象棋的时候安装监控）。

好了，

这回就聊到这吧。

二代水遁大师漫画（人工智能下象棋）(17)

看在象棋AI下棋机器人输给我的份上，我不妨透露两个消息。

第一，有一版的AI象棋机器人初级棋力就打败了全公司的挑战者。

大胜之际，算法设计工程师们哀嚎遍野：“大事不妙”。

第二，我下赢AI象棋机器人那一局的时候，旁边有三个AI工程师帮忙出主意。

（哦，第二点是在凡尔赛科技新媒体的日常）

最后隆重介绍一下我们的全文审核专家：

二代水遁大师漫画（人工智能下象棋）(18)

最后，再介绍一下主编自己吧，

我是谭婧，科技和科普题材作者。

为了在时代中发现故事，

我围追科技大神，堵截科技公司。

偶尔写小说，画漫画。

生命短暂，不走捷径。

原创不易，多谢转发

还想看我的文章，就关注“亲爱的数据”。

二代水遁大师漫画（人工智能下象棋）(19)

二代水遁大师漫画（人工智能下象棋）(20)

二代水遁大师漫画（人工智能下象棋）(21)

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

猜您喜欢

富光宝宝保温杯（让小朋友也爱不释手的保温杯）

爷忍精不射
眼影的搭配颜色和正确画法（5种不同场合眼影的画法和颜色选择）

博花佩
欺负老实人的人都是什么心理（老实人不改掉这四个特征）

尒给徳庝嬡
venus marble12色眼影试色（22款眼影盘点VENUSMARBLE颜色实用性不高）

另一种帅气
红萝卜和西瓜（番茄和西瓜）

滚好不远送
怎样画出来的眼影又干净又好看（新手画眼影如何选色）

千人斬
金庸小说关于易筋经的描述（金庸笔下内功排名）

傀儡不会哭

秒懂生活

二代水遁大师漫画（人工智能下象棋）

猜您喜欢

富光宝宝保温杯（让小朋友也爱不释手的保温杯）

眼影的搭配颜色和正确画法（5种不同场合眼影的画法和颜色选择）

欺负老实人的人都是什么心理（老实人不改掉这四个特征）

venus marble12色眼影试色（22款眼影盘点VENUSMARBLE颜色实用性不高）

红萝卜和西瓜（番茄和西瓜）

怎样画出来的眼影又干净又好看（新手画眼影如何选色）

金庸小说关于易筋经的描述（金庸笔下内功排名）

热门推荐

排行榜