第16章 猜谜博弈:散户如何赢庄家(1 / 1)

猜谜博弈

我们来玩一个这样的游戏,在一张白纸上写上一个字,这个字可以写的是“黑”,也可以写的是“白”,我写好后,你来猜这个字。如果我写“黑”被你猜对了,我给你15元。如果我写“白”被你猜对了,我给你5元。如果我写“黑”你猜“白”或我写“白”你猜“黑”(总之只要是你猜错了),你都给我10元(见表16.1)。你觉得你猜对的可能性是大于50%、等于50%还是小于50%?我想,你的答案一般会是等于50%。但正确答案却是你猜对的可能性大于50%。这是为什么呢?原因后续揭晓。

表16.1 猜谜游戏

既然你猜对的可能性会大于50%,那么这个游戏对你我来说公平吗?所谓的公平游戏,就是指双方在博弈中各自的期望收益都是0。也就是说,我们一起玩了100次或1000次以后,理论上两个人应该是不输不赢的。如果你觉得这是一个公平的游戏,或者是对你更有利的游戏(因为你猜对的概率大于50%)。那么,我现在就告诉你,这个游戏对你是不公平的,你会吃亏,并且玩的次数越多,你会亏得越多。此时的你,内心是不是充满了疑惑?那就让我们来揭示猜谜博弈背后的玄机。

纯策略和混合策略

首先介绍两个非常重要的概念:纯策略和混合策略。

如果一个策略规定参与者在每一个给定信息情况下只选择一种特定的行动,我们称该策略为“纯策略”。

如果一个策略规定参与者在给定信息情况下,以某种概率分布随机地选择不同的行动,我们称该策略为“混合策略”。

比如“人不犯我,我不犯人;人若犯我,我必犯人”是一个纯策略。“人不犯我,我80%的可能性不犯人;人若犯我,我90%的可能性会犯人”就是一个混合策略。

当然,每个纯策略其实都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。完全的混合策略对每个纯策略都分配了一个不为零的概率。

举一个复杂一点的混合策略案例。在前面“万元陷阱”那一章中,我提到竞技体育就是一个典型的“万元陷阱”。很多运动员为了拿冠军,不惜使用兴奋剂。为了竞赛的公平性和出于保护运动员身体的考虑,国际奥委会在体育比赛过程中会进行兴奋剂检测(doping control)。

兴奋剂检测是指赛前、赛后甚至平时,各级体育组织派专门的检测人员对运动员进行检测,以确定其是否使用了违禁物质或违禁方法。兴奋剂检测有尿液和血液两种取样方式。尿检是主要方式,而血检只是作为一种辅助手段,被用来对付那些在尿样中难于检测的违禁物质和违禁方法。

在体育竞赛开始前,检测机构与有关单项体育联合会和竞赛组委会进行磋商,确定接受检查运动员的数量及挑选受检运动员的方法。选定受检运动员一般以比赛名次、是否破纪录或抽签结果作为取舍标准,也可根据特殊情况任意指定运动员接受检测。

通常采用的办法有以下几种:

1. 获得各项目第一名或前几名的运动员必须受检;

2. 获得各项目第一名的必须受检,第二至第八名抽检;

3. 从各项目的优胜者(如决赛前八名)中以抽签方式决定抽检几人;

4. 从各项目的全体参赛者中,以抽签方式决定抽检几人;

5. 在集体项目中,从各队中以抽签方式决定各抽检几人;

6. 在有纪录的竞赛项目中,凡破世界纪录、洲纪录、全国纪录或运动会纪录者必须受检。

兴奋剂检测除了在比赛时期进行随机抽检以外,还在非比赛时期进行随机抽检,这就是所谓的“飞行检查”。“飞行检查”主要是针对著名运动员和在短期内成绩大幅提高的运动员。由于“飞行检查”的突然性,它已成为当前国际反兴奋剂斗争的“撒手锏”。

例如,国际田联在1993年对27个国家或地区进入世界前20名的优秀运动员进行了476人次的“飞行检查”,其中20人使用了违规药物,占比4.2%。而同年国际田联在比赛期间检查的违规比例仅为0.6%。(1)不难看出,“飞行检查”更能如实反映运动员使用兴奋剂的情况。

随机抽检也会带来一个问题,即一些服药的运动员幸运地“逃脱”了。这会带来事实上的不公平。例如,张三骑车闯红灯,被警察逮了个正着,罚款50元。张三振振有词地争辩道:“那么多人都在闯红灯,为什么你只罚我一个?”警察问:“会钓鱼吗?”张三答:“会。”警察说:“池塘里那么多条鱼,为什么你只钓那几条?”

鉴于随机抽检所带来的不公平问题,经常有人建议,应该对所有参赛的运动员进行兴奋剂检测。我认为,现在还没这么做的原因主要是出于检测成本方面的考虑。在后续有关税收检查的博弈分析中,我们就会发现检查成本严重影响抽查的概率。当然,如果以后兴奋剂的检测成本能够大幅度下降的话,也可能真的会对每位参赛运动员(至少是每位进入决赛的运动员)进行兴奋剂检测。

如果你已经认真学习完前面的内容,你一定会发现,在完全没有兴奋剂检测的情况下,每个运动员都服用兴奋剂是一个占优策略纳什均衡,并且是一个典型的“囚犯困境”。对任何一位运动员来说,只要他想在比赛中获胜,无论其他运动员是否服用兴奋剂,自己服用兴奋剂一定是占优策略。

进一步看,如果兴奋剂检测不是百分之百进行,这必然会给运动员带来侥幸心理,即希望自己成为一个通过服用兴奋剂获胜的幸运儿。当然,运动员也不会每次都服用兴奋剂,那样被抓住的可能性就太大了。因此,国际奥委会和运动员之间博弈的必然结果是,奥委会以某种概率进行随机检测,运动员以某种概率服用兴奋剂,并由此形成一个混合策略纳什均衡。

如果一个混合策略组合使任何一个参与人的混合策略都是相对于其他参与人的混合策略的最佳策略,这组混合策略就构成一个混合策略纳什均衡。

求解猜谜游戏

当我们理解了混合策略和混合策略纳什均衡以后,就可以具体求解一开始提到的那个猜谜游戏了。

这是一个对我有利,对你不利的游戏。在这个游戏中,我们两个人每玩一次,我的期望收益是0.625元,你的期望收益是-0.625元。具体的分析和计算过程分以下6点展开。

1. 在猜谜游戏中,我不可能每次都写“黑”或写“白”。如果我每次都写“黑”,你肯定会每次都猜“黑”;如果你每次都猜“黑”,我肯定会每次都写“白”;如果我每次都写“白”,你肯定每次都猜“白”;如果你每次都猜“白”,那我肯定每次都写“黑”。我们绕了一圈后不难看出,在这个猜谜游戏中,我们双方都不会只采取一种纯策略,而是会采取混合策略。我有时写“黑”,有时写“白”;你有时猜“黑”,有时猜“白”。

2. 进一步看,我写“黑”或写“白”不可能是随机的。也就是说,我不会50%的概率写“黑”,50%的概率写“白”。因为,同样是被你猜中,我的损失不一样(写“黑”被你猜中,我损失15元;写“白”被你猜中,我只损失5元)。所以,你一定会想到我写“黑”的次数会比写“白”的次数要少。

3. 接下来我们需要把我写“黑”的概率计算出来,把你猜“黑”的概率也计算出来。具体的计算过程是先计算期望收益,再计算出在期望收益最大化的情况下,我会选择写“黑”的概率,以及你会选择猜“黑”的概率。

4. 计算双方的期望收益。先假设我选择写“黑”的概率是α,选择写“白”的概率是1-α,你猜“黑”的概率是β,你猜“白”的概率是1-β。我的期望收益(用Π我表示)是:

Π我=(-15)αβ+10α(1-β)+10(1-α)β+(-5)(1-α)(1-β)

你的期望收益(用Π你表示)是:

Π你=15αβ+(-10) α (1-β)+(-10)(1-α)β+5 (1-α)(1-β)

5. 求解α和β。对于我来说,所能决定的是我写“黑”的概率α,对于你来说,所能决定的是你猜“白”的概率β。双方的期望收益对各自的决策变量求一阶导数为0,就是各自期望收益最大化所要满足的必要条件。

dΠ我/dα=0

dΠ你/dβ=0

求导后,就可以分别计算出α和β的具体数值了。你不妨亲自拿笔算一下。在这个猜谜游戏中,α和β都等于3/8。也就是说,我会选择8次里面3次写“黑”,5次写“白”;你也会选择8次里面3次猜“黑”,5次猜“白”。这就是这个猜谜博弈的混合策略纳什均衡解。

6. 最后一步是求出均衡情况下双方的期望收益。把α和β都等于3/8的计算结果代入期望收益的计算公式中去,分别求出双方的期望收益。具体的数值是我的期望收益等于0.625,你的期望收益等于-0.625。由此看来,这是一个对你极其不公平的游戏。

对于求导不熟悉的读者,可以用另外一种更便捷的方式来求解混合策略纳什均衡,只要你充分理解纳什均衡的概念就可以。在之前的内容中,提到纳什均衡的含义是:给定你的策略,我的策略就是对我而言的最好策略(或之一);给定我的策略,你的策略也是对你来说最好的策略(或之一),即双方在对方给定的策略下已经没有积极性调整自己已选的策略。换言之,这是一种“没有人愿意偏离”的状态,因为缺乏偏离的激励。既然均衡是一个大家都没有积极性改变的策略,那么,我们就从这个思想出发,来求解混合策略的纳什均衡。

在纳什均衡的情况下,给定你猜“黑”的概率是β,你猜“白”的概率是1-β。对我来说写“黑”和写“白”的期望收益是一样的。如果不一样,我自然会选择收益高的那个选项,比如都写“黑”或都写“白”,你也会只猜“黑”或只猜“白”。这个结果不符合我们对纳什均衡的设定,因为,彼此都有改变选择的积极性。而均衡就意味着没有人愿意改变自己的选择。

回到刚才的分析,既然在给定你的策略,对我来说写什么都是一样的,那么我们就有了下面的两个公式。先分别计算出我写“黑”的期望收益和写“白”的期望收益。

Π我写“黑”=(-15)β+10(1-β)

Π我写“白”=10β+(-5)(1-β)

让两个期望收益相等(Π我写“黑”=Π我写“白”),就可以计算出β=3/8。这个答案的意思是,如果你猜黑的概率是3/8的话,对我来说写“黑”和写“白”的期望收益是相等的。

用同样的方法,我们也可以计算出α=3/8,公式如下:

Π你猜“黑”=15α+(-10)(1-α)

Π你猜“白”=(-10)α+5(1-α)

然后让Π你猜“黑”=Π你猜“白”

α=3/8的意思是,如果我写“黑”的概率是3/8的话,那么对你来说猜什么都一样,两种策略的期望收益相等。

从刚才的计算过程中,你可以发现这么一个规律,一个参与者选择不同的纯策略的概率分布不是由他的损益决定的,而是由他对手的损益决定的。

如果以后再碰到求解混合策略纳什均衡,建议你用后面这种不需要求导的方式来求解。这种方法算得又快又不容易出错。

猜谜博弈的应用:你想赢过庄家吗?

当我们学会了猜谜博弈的求解后,你可能会问,这个博弈与股市中的散户和庄家的博弈又有什么关系呢?当然有关系。

在股市中,庄家就是那个写“黑”或写“白”的我,散户就是那个猜“黑”或猜“白”的你。庄家和散户的区别就在于庄家有能力影响股价,而散户只能被动地接受股价。因此,庄家通过改变股价而获利,散户通过猜测股价而获利。

当庄家做多的时候,散户跟着做多就赚了;当庄家做空的时候,散户跟着做空也赚了。但两者的盈利数量会不一样。反之,当庄家做多的时候,散户做空就亏了;当庄家做空的时候,散户做多就亏了。当然,两者的亏损数量也可能会不一样。

从我们一开始给出的猜谜博弈中,如果双方每次输赢都是10元的话,那么,我写“黑”和写“白”的概率各占50%,你猜“黑”和猜“白”的概率也各占50%,双方各自的期望收益都是0。如果输赢不一样,但总数相加是一样的,这游戏看起来是公平的,实际上却对我有利。正如股市里庄家和散户的博弈中,散户就算猜对庄家的概率超过50%(具体的数值是34/64。具体的计算方法是我写“黑”你猜“黑”的概率是9÷64=3÷83÷8,加上我写“白”你猜“白”的概率是25÷64=5÷85÷8),博弈到最后散户依然是亏的。

我们一旦明白了猜谜博弈背后的道理,就容易知道一个散户如何才能赢庄家了。在此,我给出四条具体的建议。

1. 不要期望赢庄家。如果你想赢过庄家,劝你死了这条心吧。你可以去网上看看韩寒写的一篇广为流传的文章《别用你的业余爱好,去挑战别人吃饭的本事》。在我们前面的分析中,猜谜博弈的前提是我写好字以后,就不能更改了。但实际的博弈中,往往是等你猜完后,我是可以重新写的。这样一来,无论你猜什么,都是输的。

2. 不要去和庄家博弈,并不意味着你一定不能买股票。而是说,你买股票和庄家怎么做无关,你只关心用某个价格购买某只股票是否合算,也就是说,你只看重一只股票的投资价值。这意味着你买股票只是为了分享这个公司未来的价值增长,这就要求你在买一只股票之前必须对这个公司有比较充分的了解。

3. 如果庄家对股价的控制和操作导致股价大幅度上涨或下跌,这恰恰是你卖出或买入的机会。换句话说,散户所能做的一定是在股价大幅度上涨的过程中卖出,在大幅度下跌的过程中买入。不要预测股价的涨跌,而是要做好股价涨跌后的准备。

4. 请随时做好退出博弈的准备。如果你一定要告诉我说,我既没有能力判断一只股票的投资价值,又没有能力不受股价涨跌的**,导致这些年炒股的结果是亏多盈少。那么,只能说明你不适合这个市场。在这种情况下,你应该毫不犹豫地退出这个市场。一个证券公司营业部的老总曾经很认真地告诉我,证券公司给员工们的最大福利其实是不允许员工炒股。

本章小结

1. 学会求解混合策略是提高博弈能力的有效途径。

2. 很多看似公平的游戏隐含着对你不利的结果。

3. 懂得了混合策略的道理,我们会相对看淡博弈的输赢,而看重如何在重复博弈中最终胜出。

4. 散户在证券市场中博弈的目的不是指望战胜庄家,而是通过购买股票来分享上市公司的成长。

考考你

相对于表16.1中的猜谜博弈,我们对游戏规则进行简单调整:如果我写“白”你猜对了,我不是给你5元,而是X元(见表16.2)。请问,当X为几时,这是一个对双方来说都公平的游戏?等你算出了X以后,你就知道该怎么和我博弈了。如果你猜“白”的收益大于X,你就大胆地和我博弈,如果你猜“白”的收益小于X,你就坚决拒绝和我博弈。

表16.2 猜谜游戏

(1) 《资料:检测运动员兴奋剂的方法 尿检血检和飞检》,http://roll.sohu.com/20120715/n348192964.shtml。