本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 K T% H% H O- |2 z8 N: A; {
, t7 A( J5 q. Z严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 D( |$ u1 b4 Q: U 以下三个定义:
% b2 k1 U4 Z( ~& ?! [/ S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 w7 ?. n5 c2 S# q) C8 P0 J O6 q
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# \2 v1 b; O- x1 I5 m# x/ z 所谓的双方优势策略则是指双方利益总和最大的策略。
/ r+ Q6 T$ a' F4 Y# X" W[编辑本段]严格优势策略举例分析
6 y, f$ t% G" w" G 一、经典的囚徒困境 u5 a$ z: H7 @0 s+ V1 n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ L+ R+ C; `! D3 I+ _2 k 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. G- {' }6 ?9 B7 ^- i 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 e& t, z1 w0 W
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 r$ I+ t' ]0 ^5 V: C1 _ 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 W8 C4 ^+ C2 p3 u) m, R
2 B: r, ~, Z6 ]; }9 b/ ~用表格概述如下:" b( e3 n7 T0 E7 M: H5 W; s
J, H# ]( e6 G* |5 m
甲沉默(合作) 甲认罪(背叛) ' \9 `4 j1 X1 X0 `9 r; d, C' ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, u q3 l4 e$ Y3 x; O: K+ t9 \: b乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
6 ]/ C; b0 V$ J" n' m2 e. |) c( @
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - i1 P6 c/ H# ?2 i+ g3 Z C
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ [4 P2 h) g- _6 ` D 若对方沉默、背叛会让我获释,所以会选择背叛。
$ D) J M/ g9 K 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 r, W; X$ K9 R& s. y% l. a" a9 c 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 n& s" I. L. t3 Z: W% h 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# ?- ? V o4 p5 S) N8 B0 _ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
{2 g& J' Y3 w( t, h2 K7 ~[编辑本段]二、智猪博弈理论/ ?4 U' p4 w3 W, e
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , v4 L! Q& U" _7 }1 t' S
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; O% q+ r( t8 {/ [* V" H 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 O' u3 c S2 \+ P$ h# z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# b' U. S1 I8 M( @! O* ] “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 g ?1 ` M, @2 D) n 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" C6 J% H9 L3 m5 P; {8 t3 M" {6 V9 } 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 z$ W; W) T8 Z0 e4 e$ `) R
q! ?$ {: Y( n' m. B
三、关于企业价格策略: n5 y# o9 U$ M( W$ U: L
/ i0 ^' r$ L1 F$ q8 c 5 d& d. Y) [/ k
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 d2 ]- x4 p2 |$ C+ ]/ i- e' y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy); p; K' j9 e( z& c' j" ]
以下三个定义:0 L# a% @3 T, ~/ x+ b
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 p' T# V7 Z" ^- n, u$ U$ P
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; D9 b# c# l' H A* F3 Y 所谓的双方优势策略则是指双方利益总和最大的策略。
) c) A! Q; P6 D. i1 v[编辑本段]严格优势策略举例分析3 W! y i% B5 D0 x P$ V `
一、经典的囚徒困境
2 J* Y8 g0 C/ F" O' P) r$ U( j 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 p7 E' T1 T* s( E n e
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * m* u Y! C/ |: a) i- N
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 o R8 v9 x4 B+ |% P" \1 G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " N1 H6 P% r# ~/ G
若二人都互相检举(互相“背叛”),则二人同样判监2年。
! G( I- n6 Y, N' J# G) _: U
$ e) K7 R0 @7 y% [用表格概述如下:+ V8 L1 G3 k0 ?3 `
* E, R4 y5 [ \5 A4 o2 T# p2 a 甲沉默(合作) 甲认罪(背叛)
" H7 R; D# r. S3 `, P9 ]1 P \乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 2 }) [) z6 l, Z5 L1 w! P* L8 G) |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 7 J" s4 c: r Y' W8 b
. }2 T# ?4 N# W1 z. X* G9 [0 W) }! Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 C0 _ @* Y( s( p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 D* Y2 L# w- m- m
若对方沉默、背叛会让我获释,所以会选择背叛。 , x }, f' Q1 k" O" `& n
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 Y8 A" N8 j5 m 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ t3 e9 e, f2 t$ K4 f 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * |) V( ~7 S* N, j& `# d
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 R# S/ |' L) p- g/ @/ y* J* Q: _3 J[编辑本段]二、智猪博弈理论
4 y/ z/ U* _5 F4 O" L) {2 ? 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 O c/ B) Z8 Q; @: s" b; o- d2 B 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; Z# K. |; A' f/ p% Z% K3 Q- D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 q; E& T2 L5 G+ ]5 b 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. M7 y$ `3 D2 d) l+ U/ l “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 h% ]. P& k7 h! @# D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 B7 A9 W! f7 z" f 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& T2 p: j# e! e' E+ k5 \8 K3 I d
! O4 R7 j8 G" H8 a+ \# \ `$ y三、关于企业价格策略( ?/ D% C3 U! q. M8 C! i
: ?1 }5 G- M" x . B/ e% J! z5 \* }
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: x& ^! r' U8 r: D5 x 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" C0 ^ P! W5 B* i
以下三个定义:
. i% E5 G* i) ^) F4 x7 k1 F 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * g( i! n. i6 [8 j, w9 G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 d& |! | d: N1 @% [ 所谓的双方优势策略则是指双方利益总和最大的策略。
* J0 @* r- q* f1 U& ?/ X[编辑本段]严格优势策略举例分析
# Q! N2 }" w2 H4 {! i 一、经典的囚徒困境 & ]# g3 R6 G6 D+ n
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( P0 R% B: T1 q' K; z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / v M2 T5 J' T
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 p% P4 X n. w( r1 L) V( z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 m b1 A( e6 I
若二人都互相检举(互相“背叛”),则二人同样判监2年。4 L2 C$ a* d5 d* V; m
$ T+ f! Q- |& |+ w
用表格概述如下:
1 R7 r/ S8 ]5 a6 V2 X/ `/ T' k4 e* Q1 r g+ y. B
甲沉默(合作) 甲认罪(背叛)
7 w# [% N5 p6 A, b9 a+ ], ^) W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 4 p8 g/ x$ T7 E1 [) l
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 " H( h) x8 } ?8 R- l% _' f2 O! S$ S
- g6 \3 C9 J* t/ s# w
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: X1 U% O' i3 m+ R 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ g" J1 Y* u, A, U0 a7 X3 a 若对方沉默、背叛会让我获释,所以会选择背叛。
$ u: |# `8 }5 }# u2 u. X 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 w4 ?4 H# F4 f5 [. c# ~2 | 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 [7 B! q8 ]. ]* Z* i0 B( m! f! h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 x: a( G" O! | 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ r+ v, D" P( S2 k: p( w+ D& Z[编辑本段]二、智猪博弈理论5 B! E9 i" s. U1 @% Q& }8 u5 T
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 ?' z8 c9 i% A5 @% l- V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& c3 N5 N+ J. q9 n3 [ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 K" }9 v# {" Q5 s( w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # N/ c! D: D& y7 l+ e2 } P/ @3 q
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 h) [+ z) J6 A: {/ d( ]
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " u# P! y3 y: `7 P5 }& H
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. J& j, @' A6 Z
% I1 f2 G9 a8 h& a0 B三、关于企业价格策略* }4 o! d/ F# {$ j
( c. {' P5 [# O3 ?9 `: ^8 S8 C ' X- a; n/ n8 Y1 k2 S6 a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 e% M' h/ Q: K8 z4 h 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 O* L- N" B- X7 h* w 以下三个定义:
) s; X" ~1 d' r- r! J: i; l 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( q- Z* S; \7 G+ Z6 c$ R1 `# d 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( F( `" P' L ^0 Q 所谓的双方优势策略则是指双方利益总和最大的策略。 ( {+ i8 ^1 L' S; S/ l, j5 E _
[编辑本段]严格优势策略举例分析! f/ z( O! Y2 d" V, E
一、经典的囚徒困境
- C: ~1 H: M4 U# s5 d* v/ Q" A6 O 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, u: l$ C$ I+ ?/ i- Z- g# ^ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* ?- `- t- s5 A4 E+ J: B 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 X% d$ U5 d* R+ r/ p% \
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! L0 j/ |+ j! Y) h2 O, }; Y. o
若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 Y, P) k4 G G, p( {7 P" i
" ^. [. U3 f, e6 a/ r/ {- ?8 f# `用表格概述如下:
" K; M9 A' T: m5 A) |2 [5 f& p! }
甲沉默(合作) 甲认罪(背叛) ) p* f8 X5 \1 }. p# L% _, f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 & T7 I6 ^0 j! b9 Z
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* a$ m! i+ T( N3 @. T7 B
7 ]: }( q; K7 G+ C9 I- M 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 v4 n+ R1 \4 F3 J/ [; y! J! u& @& f
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 O) g- {7 Z) F/ y# b3 a& ? 若对方沉默、背叛会让我获释,所以会选择背叛。
9 _9 j. f) C( G/ I. B 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " d0 m4 X2 s2 P& ^8 a4 z% s: r: P
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # ^' R$ _/ |" f
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" U8 a( W8 Q5 u' K r" G 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( j/ ^6 X$ P/ Y! z5 ^2 u2 t: y) h
[编辑本段]二、智猪博弈理论
4 p: N. n; \1 K7 M0 P 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - _' L5 n2 Y) |0 d& Q$ R
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 p( B1 \4 \0 f$ x$ [
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* K. J& Z) ]- h; k 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) y+ S# q4 ?. a; A “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 h2 T' S3 c9 ~ D% K" J6 B9 b& A4 @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 m! V4 ^4 G' U/ S" J& Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 U0 j' `9 l; V" V {9 O: f
% x. `2 H3 `* _ [三、关于企业价格策略
0 c9 L3 w, q) O( d$ h5 k( i c. B/ ?% `( u4 W% ?4 s
2 A5 T" W/ i' r) O6 g) u! N 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 H' t# ], `) Z% j) q3 H" k" \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |