警察与小偷的博弈(1 / 1)

是不是所有博弈都存在一个纯策略(指参与者在其策略空间中选取的唯一确定的策略)的纳什均衡点呢?答案是否定的。除了上面叙说多次的、大家比较熟悉的纯策略均衡点外,有的博弈并没有一个确定的、唯一的策略,而是存在一个混合策略(指参与者采取的不是确定的唯一的策略,而是在其策略空间中以概率来选择不同策略)均衡点。下面我们将以警察与小偷的博弈为例,对混合策略均衡点进行说明。

某小镇只有一名巡逻警察,他一个人要负责整个镇的治安。假定该小镇主要分为A、B两区,A区有一家建设银行,B区有一家金银首饰店。再假定这个小镇有一个小偷,要对该镇实施偷盗行为。因为没有分身术,警察一次只能在一个区巡逻;而对于小偷来说,一次也只能去一个地方行窃。

假定A区建设银行需要保护的财产为2万元,B区首饰店的财产价值1万元。若警察在A区巡逻,而小偷也恰巧选择去了该地,小偷就会被警察当场抓住,该区建设银行的2万元财产就不会损失;若警察在A区巡逻,而小偷却选择去了B区,因没有警察的保护,小偷偷盗成功,B区首饰店的1万元财产将分文不剩,全落进小偷的腰包。

在这种情况下,警察要怎样巡逻才能使效果最好呢?

如果按照先前的思路——只能选取一个确定的唯一的策略,那么明显的做法是:警察在A区巡逻,可以保护该区建设银行的2万元财产不被偷窃。而小偷去B区,偷窃一定成功,B区首饰店的1万元财产尽归小偷所有。也就是说警察的收益是2万元,而小偷的收益是1万元。

但是,这种做法是警察的最佳策略吗?存不存在一种更好的策略或者说能不能对这种策略进行改进呢?

若警察在A区或B区巡逻,而小偷也正好选择去A区或B区,则小偷无法实施偷盗,此时警察的收益为3(保住A区建设银行和B区首饰店共3万元财产),小偷的收益为0(没有收益),记作(3,0)。

若警察在A区巡逻,而小偷去B区偷盗,此时,警察的收益为2(保住A区建设银行2万元财产),小偷的收益为1(成功偷盗B区首饰店1万元财产),记作(2,1)。

若警察在B区巡逻,而小偷去A区偷盗,此时,警察的收益为1(保住B区首饰店1万元财产),小偷的收益为2(成功偷盗A区建设银行2万元财产),记作(1,2)。

警察与小偷的收益可写成如下的收益矩阵:

警察与小偷博弈

小偷

盗窃A区

盗窃B区

警察巡逻A区 3,0 2,1巡逻B区 1,2 3,0

由上面分析,我们可以得出这个博弈没有纯策略纳什均衡点,只有混合策略均衡点。在混合策略均衡点下,双方的策略选择是其最优策略选择。

此时,警察的一个最佳选择是:用抽签的方法决定去A区巡逻还是去B区巡逻。因为A区建设银行的财产价值是B区首饰店的两倍,所以用两个签(比如1、2)代表去A区巡逻,一个签(比如3)代表去B区巡逻。如果抽到1、2号签,就去A区巡逻;如果抽到3号签,就去B区巡逻。这样警察就有2/3的概率去A区巡逻,1/3的概率去B区巡逻,其概率的大小与巡逻地的财产价值成正比。

而小偷的最优选择也是同样以抽签的办法决定去A区行窃还是去B区偷盗,只是与警察相反:小偷抽到1、2号签去B区行窃,抽到3号签去A区行窃。那么,小偷就有1/3的概率去A区偷盗,2/3的概率去B区偷盗。

上面所说的警察与小偷所采取的策略便是混合策略。

按上述混合策略,警察的总期望收益是7/3万元,与只巡逻A区得2万元的收益的策略相比,明显得到了提高。

原因如下:

当警察去A区巡逻时,小偷有1/3的概率去A区偷盗,2/3的概率去B区偷盗,此时,警察巡逻A区的期望收益为7/3(1/3×3+2/3×2=7/3)万元;当警察去B区巡逻时,小偷同样有1/3的概率去A区偷盗,2/3的概率去B区偷盗,此时,警察巡逻B区的期望收益为7/3(1/3×1+2/3×3=7/3)万元。警察的总期望收益为7/3(2/3×7/3+1/3×7/3=7/3)万元。

同理,我们也可知小偷采取混合策略的总期望收益是2/3万元,比得1万元收益的只偷盗B区的策略(前提是警察只巡逻A区)要差。

当博弈一方所得为另一方所失时,对于博弈的任何一方而言,此时只有混合策略均衡点,而不可能有纯策略的纳什均衡点。