博弈论的四种基础方法(极简博弈论学习之后)
极简博弈论对于博弈论最重要的思想,你可以通过6种典型的博弈局面、和6种实用的博弈方策略来掌握,当然,无论学习多少理论和技艺,随时留心、举一反三才能从掌握达到熟练,希望这期总结也能帮到你祝你每天都有收获,下面我们就来说一说关于博弈论的四种基础方法?我们一起去了解并探讨一下这个问题吧!
博弈论的四种基础方法
极简博弈论
对于博弈论最重要的思想,你可以通过6种典型的博弈局面、和6种实用的博弈方策略来掌握,当然,无论学习多少理论和技艺,随时留心、举一反三才能从掌握达到熟练,希望这期总结也能帮到你。祝你每天都有收获。
一个终极目标
博弈的终极目标,是达到纳什均衡,纳什均衡是谋略计算的终点。
七个重要概念
【纳什均衡】如果博弈各方都是足够聪明的人,大家最终的策略选择一定是这么一个局面:在这个局面里大家都认命了,谁也无法单方面改变策略去谋求一个对自己更好的结局。 如果一个现象能够在社会中长期稳定地存在,它对参与的各方来说就一定是个纳什均衡。纳什均衡告诉我们评价一个局面不能只看它是不是对整体最好,它必须得让每个参与者都不愿意单方面改变才行。
【帕累托最优】帕累托是一位意大利经济学家,帕累托改进的意思是这个改进能在不伤害任何一个人利益的同时,使得至少一个人的境遇变得更好。如果一个局面已经好到没有帕累托改进的余地了,这个局面就叫“帕累托最优”。
【压倒性策略】(Dominant Strategy)。在博弈局面中,你有一个策略压倒其他一切策略,不管对手怎么做,这个策略对你来说都是最好的。反之,“被压倒性策略(Dominated Strategy)”,就是不管别人怎么做,你这么做对你都是不好的。
【囚徒困境】合作则两利、背叛则两伤。经济学中所谓“负的外部性”、“公地悲剧”、价格战,国际政治中的军备竞赛,动物世界中的互助行为,体育比赛中的使用禁药,医学中的抗生素滥用,包括心理学中的上瘾现象,其实都是囚徒困境。
【博弈演化论】专门研究策略的流行规律的学问。博弈的演化,是策略的竞争。如果使用一个策略能带来好的报偿,人们就会模仿这个策略,这个策略就会流行开来。
【KMRW定理】用四个经济学家名字的首字母命名。在不完全信息博弈中,参与者不知道对方是好人还是理性人,那么只要博弈重复的次数足够多,合作能带来足够的好处,双方都会愿意维护自己是好人的这样一个声誉,前期尽可能地保持合作,到最后才选择背叛。
【Player】在游戏中叫玩家,在体育比赛中叫选手,在博弈论中叫参与者 —— 其实都是一个意思,博弈论(Game Theory)说的都是 game。有一点参与游戏的精神,你就有权在规则范围内采取对自己最有利的行动,你就是积极主动的,你就会平等对待对手 —— 你就既不是一个浑浑噩噩整天根据别人设定做事的人,也不会有整个世界绕着自己转的幻觉。
六个博弈局面
博弈局面一:各方有强烈的合作意愿,而博弈有不止一个纳什均衡。
采取策略:找到“聚焦点”
1.一个博弈中会有多个纳什均衡。比如交通规则中“右侧通行”和“左侧通行”,都是纳什均衡。
2.聚焦点就是在众多可能的纳什均衡中最显眼的那一个,人们会自动在这一点上达成合作。聚焦点的作用是协调。
3.聚焦点举例:度量衡、键盘、限速牌、指导价、平均年薪……可以是生活习惯,可以是历史传承,可以是传统文化,可以是先下手为强,可以是政府指导,可以是随便找到的什么借口,实在不行还可以抽签。
博弈局面二:囚徒困境——合作对所有人都有好处,但背叛对背叛者有直接的好处。
采取策略:如果博弈是可重复的,应该寻求对背叛者进行惩罚。防止背叛,最直观的办法就是把单次博弈变成重复博弈。重复博弈之所以有效,是因为背叛者会受到惩罚。如果博弈是可重复的,应该寻求对背叛者进行惩罚。*以牙还牙*是最经典的做法,但适当的宽容更能促成合作。
1.有效的惩罚必须得满足3个条件:你得能发现背叛行为;惩罚必须得是可信的,对方知道他一定会受到惩罚;惩罚的力度得足够。
2.“以牙还牙”是个保守的策略:1)不管跟谁,第一轮我都选择合作;2)第一轮过后,我就复制对手上一轮的做法。你上一轮要是跟我合作,我下一轮也跟你合作。你要是背叛了我,我下一轮也背叛你。如果你在哪一轮又选择合作了,那我还继续和你合作。我合作,我报复,我原谅,我只是模仿你上一轮的动作。
3.“以牙还牙”其实是个脆弱的策略:对错误不够友好,它不够宽容。改进版的以牙还牙策略是:对方背叛我一次,我继续合作;只有当对方连续背叛我两次,我再报复。
博弈局面三:参加博弈的人数比较少,合作的利益比较大,各方就会形成串通和*合谋*,尽管这么做不一定对社会有好处。
1.戴比尔斯公司的钻石垄断、美国商店的价格匹配、商家之间通过比价网站价格协调、包括大型募捐活动,都是这样的局面。
2.合作的利益大就不会竞争,背叛的成本低才会背叛。
3.打破这个局面的一个办法就是扩大市场准入,让更多的参与者进来,让商家的协调没那么容易。另外一个办法就是依靠政府的力量反垄断,相当于全体消费者联合起来去对付那些巨头。
博弈局面四:信息不对称
采取策略:传达信息最好的办法是*发信号*,这意味着你要用行动去证明自己。
1.一种常见的博弈局面是有一方参与者知道一个关键信息,而另外一方不知道。一方强烈地想让另一方知道他的信息,但是又怕对方不信。一方强烈地想知道对方的信息,但是又怕对方说谎。这就叫“信息不对称”。
2.花钱、花时间、或者花的是脸面,但又都没什么直接的用处——在博弈论看来,人们做这样的事情,都是为了解决信息不对称。
博弈局面五:最高级的应用:设计博弈
1.学习博弈论的确有一个比做 player 更高级的视角。那就是做为规则的制定者,去给人设计博弈局面。
2.房产经纪人薪酬设计、竞拍规则设计,都可以改变局面。但用于真实世界的制度设计,它未必有实用价值。
3.一般人遵守规则,少数人违反规则,有的人制定规则。设计一个博弈,比参加一个博弈要难得多,这是管理者的学问。
博弈局面六:纳什均衡是博弈的结局,可是真实世界从来都没有结局 —— 这是因为博弈局面总在变化,我们甚至可以主动改变博弈。
六个博弈策略
博弈策略一:(装)做好人
1.在残酷世界里选择做好人表面上看是非理性的 —— 但KMRW定理告诉我们,只要博弈有比较多、哪怕只是*有限次的重复*,做好人其实是有利的。
2.但博弈论专家绝对不会建议你去做真正的好人。好人经常对世界有一厢情愿的期待。博弈论专家会说这种想法非常危险。事实上,如果你身处一个比较险恶的社会环境,那你不但不应该做好人,而且应该装坏人。
3.但好人跟好人之间形成了一个想象的共同体。这其实是一个幻觉,但是没办法,想象的共同体是最强大的社会力量。这其实也是理性的。
博弈策略二:寻求监管
1.一个破解囚徒困境的直观解决方案:让第三方监管。
2.监管的本质是改变了博弈的报偿(payoff)。有了有效的监管,不合作就不但没有好处,而且还会受到惩罚,不合作的行为自然就会大大减少。
3.比自己管、私有化和政府管这三种监管方法更新颖的是让博弈各方之外的“第四方”监管。更高级的监管是监管者和被监管者的合作。
4.你应该把政府也当做一个 player。而且政府也应该把自己视为一个 player。既然是参加博弈的 player,政府也需要博弈论。
博弈策略三:先下手为强+后发者优势
1.动态博弈
2.小鸡博弈:只要你能确定对手的底线,那么先发制人,造成既成事实,就能逼迫对手就范。
3.悬崖策略是动态进行的小鸡游戏。双方每一步都在推动危机升级,这是一个危险的边缘游戏。
4.最好的办法给对方一个威慑,让他根本不敢出手。威慑有三个要素:实力、决心和让对手知道。
5.先发者暴露信息,后发者利用信息。
6.后发优势 = 先发者的信息 后发者的出手权。信息是模仿机会,出手权是创新机会。
博弈策略四:威胁和承诺
1.威胁和承诺都是在博弈双方都没有采取实质性行动之前,一方通知另一方的声明。所谓威胁,就是我要求你不要去做某件事 —— 我说如果你做了,我就会对你进行惩罚。所谓承诺,就是我要求你去做某件事 —— 如果你做了,我就会给你一个奖励。
2.只有可信的威胁和承诺才有意义。
3.可信 = 别无选择。发出可信的威胁或者承诺有三个办法:给别人惩罚你的权力;主动取消自己的选项;建立声望。
博弈策略五:随机选择策略
1.只说谎话就等于只说实话。想要真的迷惑对手,你必须把谎话和实话混合起来。
2.你的混合概率选择,应该把对手能得到的最大报偿给最小化。你要按照一定的概率,混合自己的打法。你混合打法的这个规律,必须是让对手无法利用的。
3.不是真随机,就会被破解。随机性,才是真正的“诡道”。
博弈策略六:最高视角:观察不同博弈策略在人群中的演化。博弈永无休止。
1.即便纳什均衡并不只有一种,冥冥之中仍然存在着一些规律,在限制我们选择策略的自由。这些规律决定了社会的演化。
2.如果使用一个策略能带来好的报偿,人们就会模仿这个策略,这个策略就会流行开来。
3.策略的优劣不是永恒的。你必须考虑当前社会的博弈格局,特别是其他人都在使用什么策略,才知道自己的最佳策略是什么。到底要在什么比例的情况下随大流,甚至要不要随大流,都取决于具体的博弈格局。
若干金句
*计谋要是太多,愚蠢的人就不够用了。博弈论研究的是*理性人*之间的博弈。
*研究博弈论就好像下棋一样,你要考虑你的每一个行动都是有后果的,你要事先想好对方会有什么反应,然后你再怎么应对,然后对方再反应……一直到最后是个什么结果。
*理想青年喜欢帕累托最优,理性青年寻找纳什均衡。
*博弈论是人类理性行为的第一性原理。
*有一种困境叫自由,有一种解放叫禁止。
*我们年轻时候的雄心壮志变成了对社会的低头,我们感慨世风日下人心不古,我们嘱咐子女不要锋芒毕露,可我们又暗自期望他们能走一条少有人走的路。一切都仿佛是个性和现实之间的对抗,殊不知一切的背后……都是数学。
*所有人都意识不到博弈的时候,可能你诗情画意都能赢。少数人意识到博弈的时候,谁意识到博弈谁赢。大家都意识到博弈了,那就只能比执行力 —— 或者看谁能意识到新的博弈。
*一个合格的 player,应该拥有四个作风 —— 有限、务实、慎重、客观。万维钢
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com