博弈论的正确方法(博弈论11真正的诡道)

博弈论的正确方法(博弈论11真正的诡道)(1)

我们说了《三十六计》很不靠谱,有读者就问我,那《孙子兵法》如何呢?《孙子兵法》确实是一本实实在在的用兵战略总结。但《孙子兵法》并不神秘,它的思想,比如像“知己知彼”、“国之大事”、“多算胜,少算不胜”、“君命有所不受”,在今天都已经是常识性的东西。《孙子兵法》中包含了一些朴素的博弈思想,比如说像“围师必阙”,就是我们前面说过的增加敌人的选项。

那为什么说它是朴素的呢?因为现代博弈论比《孙子兵法》要高级得多。

我给你举个例子。《孙子兵法》里有一句叫“兵者,诡道也。故能而示之不能,用而示之不用……”,你看这句话有没有什么问题?

这句话的意思很简单,就是说不能让敌人知道你的战术意图,你得迷惑对手。这个道理固然没错,但迷惑对手,就得是说反话吗?

1.诡道的悖论

我上中学的时候喜欢踢足球,我是一个守门员。我的技术不怎么样,但是我知道一些理论。我知道罚点球的时候,球到达球门只需要不到0.3秒,守门员不可能在这么短的时间内反应过来,所以只能事先赌一个方向。点球,是守门员和射手之间的博弈。我还听说,守门员可以通过射手的眼神来判断他射门的方向。

有一次踢球,我们队被判了点球。罚球的那个人长什么样、这个球最后踢向了哪里、有没有罚进,现在我都忘了,但我清楚地记得他的眼神。他的眼睛不停地瞄我右侧的方向。按理说他是想朝右边踢,可是我突然多想了一步。

我知道守门员应该看眼神来判断方向,那他是不是也知道?他会不会是故意往右边看,实际上是想往左边踢呢?

又或者说,他会不会也想到了我能想到他的诡计,然后给我来个将计就计,还是会往右边踢呢?

我参加了一次真正的博弈。罚点球是一个可以欺骗对手的游戏。这种博弈也是博弈论的祖师爷冯·诺依曼当年研究的东西,不过他研究的是打扑克。

在德州扑克最基本的操作,如果你手里的牌好,你就应该加注;如果你的牌不好,那你就应该不跟了,合上牌退出。对吧?

但打牌这么老实可不行。牌好就加注,牌不好就退出,那对手一看你加注,不就知道你手里拿着好牌了吗?那他不就不跟了吗?那你又怎么能赢很多钱呢?你必须得迷惑对手才行。

打牌,一定要善于虚张声势。中文大概叫“诈”,英文术语叫“bluff”。有时候你手中的牌明明不好,也要假装牌好,选择加注。可能对手被你吓住就不跟了,你就赢了。但更重要的是,只有让对手知道你在牌不好的情况下也会加注,他才会不知道你加注代表牌好还是牌不好,他才可能在你因为牌好加注的时候也跟。有时候你的牌特别好,还得假装牌一般,谨慎地加个小注。

想踢左边,故意往右边看;明明不能,但是让对手以为你能,这不就是“能而示之不能”的《孙子兵法》吗?

但是冯·诺依曼比《孙子兵法》多了一个洞见。冯·诺依曼说,你既不能有好牌就加注,也不能有坏牌就加注。你既不能往左边踢就往左边看,也不能往左边踢就往右边看。

只说谎话就等于只说实话,对手只要反着听就行了!

冯·诺依曼说,想要真的迷惑对手,你必须把谎话和实话混合起来。

2.混合策略

我们前面讲的各种博弈,你最终总是选择确定的一招,这种情况叫做“纯策略(pure strategies)”。我们讲过纯策略的纳什均衡。

但是现在咱们考察一下这个点球博弈。比如说,你往守门员的左侧踢,守门员也往左侧扑,这个局面是纳什均衡吗?不是。在这个情况下你会想改变策略,往右侧踢。同样道理,如果你往左踢,他往右扑,他又会想要改变策略。不论是哪一个组合,你们两个之中总有一个人想要单方面改变自己的策略……所以点球博弈里没有纳什均衡。

严格地说,是“没有纯策略的纳什均衡”。因为没有纯策略的纳什均衡,所以博弈论不能告诉你应该怎么踢才能赢这一把。但是,如果你要参加很多次罚点球,博弈论就可以给你一个指导,帮助你用一个*系统*取胜。博弈论要求你使用“混合策略(mixed strategies)”。

所谓混合策略,就是说你不能一直都往一个方向踢,你应该按照一定的概率,有时候往左边踢,有时候往右边踢。

那你说这不是显然的吗?这还用得着博弈论吗?但是请注意,这里面有个大学问。

请问,你应该以多大的概率往左踢,多大的概率往右踢呢?

咱们假设你往守门员的左侧踢有时候容易打偏,你更喜欢往右踢。那你能不能以一半的几率往右踢,以一半的几率往左踢呢?不行。如果你这么踢,守门员就会坚决扑向右侧!因为左边更值得交给运气。一半一半这么踢,虽然你的每一脚都不可预测,但是你有一个非常明显的统计趋势可以被对手利用。

那到底应该怎么办呢?首先你要考察自己往左踢和往右踢进球的概率分别是多少,然后你应该合理搭配往左踢和往右踢的几率,以至于让守门员不管是扑左边还是扑右边,你进球的概率都是一样的。

也就是说,你的混合概率选择,应该把对手能得到的最大报偿给最小化。在这种情况下,因为守门员往左往右都一样,他就没有什么确定的好办法。冯·诺依曼证明,这是对你最有利的混合策略。这个结论,叫做“最小最大值定理(Minimax theorem)”。

这是博弈论的一个基本定理,它涉及到非常复杂的数学,咱们就不细说了。但是这个精神是容易理解的 ——

第一,你要按照一定的概率,混合自己的打法。

第二,你混合打法的这个规律,必须是让对手无法利用的。

只说实话不行,只说谎话也不行。在90%的情况下说实话,10%的情况下说谎话,也不一定行,因为对手还是可能根据听实话和听谎话的实际报偿,决定一个最佳应对策略。你必须用最小最大值定理计算出来一个实话和谎话的最佳配比才行。

后来约翰·纳什进一步证明,所有的博弈,不管有多少参与者,都至少存在一个纳什均衡 —— 或者是纯策略纳什均衡,或者是混合策略纳什均衡。不管你玩的是什么游戏,博弈论总能给你帮助。

一个理性的守门员和一个理性的射手玩的点球游戏,必定是双方各自使用自己的最佳混合策略。谁不用这个混合策略,谁就会被对手抓住破绽。

《三国演义》里的“煮酒论英雄”这一段,曹操给刘备说了一番“龙之变化”。曹操说“龙能大能小,能升能隐;大则兴云吐雾,小则隐介藏形;升则飞腾于宇宙之间,隐则潜伏于波涛之内……龙之为物,可比世之英雄。”

我感觉曹操说的有点像最小最大值定理。英雄做事,必须完全没有可以被敌人利用的规律。

3.真随机的好处

那你说这要求也太高了,难道罚点球之前还要做个计算不成?是的。如果你要罚的这些点球都价值千金,计算就是值得的。事实上有人统计了1995到2012年间的职业足球比赛中的9017个点球,发现这些真实比赛中的点球结果,和最小最大值定理要求的混合策略纳什均衡,高度一致 [1]。

我们大约可以说,职业球员有一种很好的比赛感觉,他们知道怎么样才能最大限度地迷惑对手。而且近年以来,有很多球队已经在使用专门的软件工具来分析对手和计算自己的策略。比如我们在世界杯期间经常听到这样的报道,点球决胜的时候守门员手里有个纸条,上面写着对方射手最可能的射门方向。我敢打赌纸条上的建议绝对不是对方射手最擅长的方向 —— 而是一个全面考虑的混合策略。

更了不起的是,同样的研究还表明,职业球员还执行了相当不错的随机性。

人类非常不擅长执行随机性。比如我要求你以左、右分别是40%和60%的概率踢点球,你会怎么安排呢?

先踢4个左再踢6个右吗?还是按照“左右左右左右”交替,再给中间多几个右吗?从统计角度看,这些安排都太整齐了,非常容易被人利用。一般人想到随机性,会强烈地以为应该交替进行。比如你前两次罚点球都踢向了左侧,这一次就可能非常想踢右边 —— 而如果你有这个心理,对手就可能会利用,他就可能会重点防守右边。

唯一正确的做法,是执行真的随机性。比如你可以随身带一本书,每次罚点球之前随便翻开一页,如果页码的个位数是0到3之间你就踢左边,如果是4到9之间你就踢右边。

有人考察了都是业余选手参加的“石头剪子布”比赛 —— 真有这样的比赛 —— 发现业余选手的特点恰恰就是出手不够随机 [2]。他们在原则上可以被人用概率论系统性地打败。

不是真随机,就会被破解,这个道理和密码学是一样的。卓克老师在得到有个课程叫《密码学30讲》,其中专门说过这个道理 [3]。

随机性,才是真正的“诡道”。这个原理有很多应用。

比如打网球。如果你知道对方的反手比较弱,是不是就应该一直给他回反手呢?不行,那样的话他就能预测你的回球了。就算你知道他喜欢正手,也得按一定的比例给他回正手,你必须使用混合策略。而职业网球选手真的做到了随机性非常好的混合策略。他们当然不会随身携带一个随机数发生器,但是他们比业余选手更随机。

再比如足球和篮球中,如果你们队中有个球星特别能得分,那是不是应该一到前场就把球交给球星呢?不行,那样的话你的战术就是可预测的,对方防守球员就会重点盯住你们的球星。球星再好使,你也必须以一定的概率传球给别的球员。事实上球星在前场很大程度上是起到一个牵制对方防守兵力的作用。

工商局检查产品质量也好,交警查违章停车也好,一般都是抽查。而你这个抽查可不能有规律。你要是固定在每天下午两点查停车,别人就会躲过你这个点。最好的办法是随机抽查。

我听说慈禧太后吃饭从来都不是可着一盘菜猛吃,都是面对几百盘菜随机地选择,每样大概只吃一口,以至于那么多年人们愣是不知道她爱吃什么 —— 这样别人就不容易在她的饭菜里下毒了。

还有,在“田忌赛马”中,想要避免被田忌坑,齐威王的最佳策略,也是随机安排出场顺序。

混合策略不是阴谋而是阳谋。专门说谎话是搞阴谋,可是阴谋是能够被识破的。使用混合策略,你就算把决策方式告诉对手他也没办法。阳谋不怕被识破……归根结底,大家都是纳什均衡的奴隶。

参考文献

[1] Ignacio Palacios-Huerta, Beautiful Game Theory: How Soccer Can Help Economics (2014).

[2] Avinash K. Dixit and Barry J. Nalebuff, The Art of Strategy: A Game Theorist's Guide to Success in Business and Life (2008).

[3] 卓克,07|改进钥匙:你以为的“随机”都是“伪随机”,《密码学30讲》,2018.

博弈论的正确方法(博弈论11真正的诡道)(2)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页