本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 : E& [1 y. N3 ]6 b' x7 k
& V9 i( h) ?. L! a5 Q严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! g1 l4 b7 o* k4 W1 Z
以下三个定义:$ k, N8 ?0 f& a1 g- S" C) s% H
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ f5 w1 D) E' y) G 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ n$ q" A7 O4 w2 L7 a
所谓的双方优势策略则是指双方利益总和最大的策略。
* ]5 U$ J. K4 G0 g `[编辑本段]严格优势策略举例分析
, Z1 \6 D3 s9 s/ W! L 一、经典的囚徒困境
6 p& R8 |9 V$ X! [0 r# {: u$ c, V; u 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 5 d+ \7 S! O. ^2 f
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 i# h6 U' P3 V1 \* @1 _
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ W0 T: k% n# ^ ]/ g
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & F0 p+ n$ {* L( y2 U& M0 c
若二人都互相检举(互相“背叛”),则二人同样判监2年。
; B/ P' d s8 }& i3 M
2 @/ _/ `% c3 \3 Z: G" H用表格概述如下:
1 K3 E3 \1 _7 B4 Y7 @5 v# g- m4 m6 W. Z3 `: f* @
甲沉默(合作) 甲认罪(背叛)
6 v" e# ?9 e& K" y) B$ T乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # n% \" x: Y7 K
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
( E( y' B' I8 P$ r$ b+ Z0 y+ W* _" z$ o# {. S; k
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 g. P, t, C$ a @1 d3 w* n4 U
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
1 D! o5 G1 Y1 p" j9 j 若对方沉默、背叛会让我获释,所以会选择背叛。
" r9 Q/ v- K9 T0 X# h/ ~ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 / k" Z$ P7 ~8 C: M. x
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 X% G; @" d8 r6 ]" z2 w
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* m) a# G0 \$ m. g3 q' [ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& @/ g1 S! Z! V1 U[编辑本段]二、智猪博弈理论
. \& f1 G7 M8 F K( N* v% h 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 0 o. i9 c' m: O( h# n a
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 }. ^; s' D1 `0 q. o" q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" j; j! B/ o0 f0 f. S 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " k" K; S( e" L* T" J9 N& Y7 z
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 8 B2 Z1 K) l5 z/ N
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 }. }8 E- U4 N( M; `1 h
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 R% V6 c" c9 ~# |. L 7 j& E# J# d- A* i
三、关于企业价格策略
, _7 Q8 U* z# B+ g. V6 x* Y7 ^7 ?% j/ ?) k3 r
7 C, n" N! y8 y) d
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - f: m+ P( |2 q0 l0 `8 Z8 @8 S- D# p
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, P4 q: b5 C" x: {/ {$ p 以下三个定义:+ l) \/ O! \; j; E d9 k
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : {7 A: z# s% ^9 \- M
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 ?7 Z" x2 X, g& p1 n8 `& V 所谓的双方优势策略则是指双方利益总和最大的策略。 3 `/ Q" I' S: [1 h
[编辑本段]严格优势策略举例分析
' T. h5 v: y, p0 E% L& |+ b! Y9 ~9 h 一、经典的囚徒困境 8 H* J/ @5 n; z2 N9 k6 m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 I) y5 C" l- b ~ k) m2 ?, G% B$ _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: & M( @; d) M/ l% n! H" B1 D
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% x7 J' c: O0 v9 ~3 l3 j: O 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 # }! O6 t Q/ V( ~3 ~1 C8 N. q
若二人都互相检举(互相“背叛”),则二人同样判监2年。! f& X; S3 @# Q, v* i
7 U, ]5 ]1 t/ H; a C用表格概述如下:
+ K% q% M e' C0 s' J* H+ E! V
$ F7 z; a& v3 [5 T2 Y( t3 ^ 甲沉默(合作) 甲认罪(背叛) ' _ o4 U* ]& d$ s1 h
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : ?: |% _& B3 s6 b& g
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . z; p; `" }2 s+ [
. V% w: ?* r( d6 _ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 % W" N# V1 j; Q5 y3 n) y
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - j- q! z$ k1 r# }
若对方沉默、背叛会让我获释,所以会选择背叛。
' [" N' r# }2 E4 M, }+ K 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
4 |6 o" N/ _1 Y2 V' T1 ^5 w# E 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' Q+ }; T q A1 ?! E0 h" q, h m 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % b6 |: E9 q4 _& F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ S" X1 z" d+ U! w[编辑本段]二、智猪博弈理论
( W% Z0 g- A% _: z 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 8 J3 |( v6 Z- P( j& X8 k1 ~7 h4 Y! c
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- [5 @, f! `. p2 t7 z3 Q 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 z7 K' p3 F& |/ I/ N* h 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 G4 v% L8 P" b' l
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # B4 D, u/ P" J7 ~6 j' ~
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 A5 N4 U( ?8 a, l! k
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 ?8 `. k8 f0 E3 C: j # z4 H" u; Q' A
三、关于企业价格策略$ h6 ~ ~( ?+ ?8 w7 V0 i7 Q5 I0 Z+ t1 P; ~/ _
- g6 l5 w3 `) V# [! J# O
$ s9 P$ S' O' K0 ? 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
+ m/ p6 V' W# D6 ~" [4 P 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 a7 O$ ?/ Q. V- y( y! G" h1 X
以下三个定义:0 i* L) o3 t1 Q& A9 A9 t! t/ G
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
0 f6 c0 g. c0 X7 k- v" b7 k 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) n8 ]% ~7 ?! B. p3 S0 {( M3 k
所谓的双方优势策略则是指双方利益总和最大的策略。 , P2 ~0 ~, ~2 K2 R6 `. h
[编辑本段]严格优势策略举例分析8 j. X- c1 \+ R% ^9 I' k& m
一、经典的囚徒困境 / J) V& J2 A& F) h
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 D& _' ]- R1 O: V( w0 g( X4 o& Z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" F# W S3 _2 s: A 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
! R: {% X# c: _, Q7 l: a% o 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 R' Q7 b& v( Z0 J
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% \5 O4 ~ P( j1 Q! O! ~. m) X$ m3 d; r
/ N9 R+ X9 O2 J用表格概述如下:: d' u& F! w) F+ O2 U
4 L! |4 E8 p# b: n 甲沉默(合作) 甲认罪(背叛)
( R+ [: v- m+ Q乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
; {5 h$ B+ |( ^: Z0 \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
F- i' |3 [' x5 h, P: G
; I% v5 Q8 |& d" _1 d8 y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
. \' h+ o* k% M }) N( M# Q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 2 d! o4 C3 G% H- ]; K; M. V `
若对方沉默、背叛会让我获释,所以会选择背叛。 7 d, X- R1 `. b
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " w" ?1 O1 F% m5 m% p6 d( d
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# g8 x. q- x' Q/ ~& V$ t* B 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 . D2 b, D7 [/ j& a
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 R2 e5 s' p" X; ^- `[编辑本段]二、智猪博弈理论; g t1 q* q% L
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
: Y% a3 H- B+ R$ a3 E7 | 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 |/ G5 P4 @( J+ r z8 W) Z e+ B
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 ~8 p8 x( Z( T+ B! ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " `! {3 @2 p% W
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 E! a9 _" @: u" f2 K 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , {0 r$ Y; N+ n; z6 ?1 n
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% A2 y, n6 r, L& |
" @& L9 ~- k5 V& G! ~9 D; D; f* |三、关于企业价格策略
; s6 j0 k* Y5 T& e6 W- w _% p8 O& A9 y7 ^7 W$ P, g
; w0 `0 Y7 A( d7 ~* ? 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; G4 y1 p$ p1 Z2 h7 q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" H' U8 @$ Z C& W% {8 a" ^( S
以下三个定义:
8 {: x/ X& \( d R 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , J3 Z1 f4 w1 `& b( |8 F
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ z4 x- D6 x. U2 {
所谓的双方优势策略则是指双方利益总和最大的策略。
' J/ G Q5 Q( R$ s$ q! ^[编辑本段]严格优势策略举例分析
/ l+ }& D1 `* H5 j 一、经典的囚徒困境
" D7 H% r: }: x; m, O 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" D; s( k' M7 d" F0 p6 D 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' T! P7 n3 K. u* U" A9 t 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ) Y& F/ a& x# V# B0 G: P l2 Z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 L% f9 P% [- I+ M, U$ p
若二人都互相检举(互相“背叛”),则二人同样判监2年。( F0 a j) E9 U4 b
4 H8 A1 B- ]5 [
用表格概述如下:
0 S* |+ p" i& F) N) p; r
2 C {0 Q( @3 I S' s" B0 \* T 甲沉默(合作) 甲认罪(背叛) 1 L4 V5 P& J+ ]! s5 }3 D( U
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 2 {; a. ]; h, C3 W1 V
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ' _, n! Q* E3 R! @' D# H" X6 [# d, m
# g) z* X9 X$ B! s! A+ l4 { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* P- R- R& ^. ^; {6 d 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 8 ^$ X4 {2 F) T* Y3 U
若对方沉默、背叛会让我获释,所以会选择背叛。
/ _2 x1 j* \+ d( ]% x 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ E( }$ ?* Q$ h( B0 R3 G5 n 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 ?: x! k. k) _! P4 o 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 v: o- _9 q8 o; S# K N
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 T; E- l% ^- Z: K6 n
[编辑本段]二、智猪博弈理论
9 L/ R, s0 x# [# T& n( [1 x O 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 h/ w& p" M# O5 |% ?. A9 r1 y( G
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 b% B" |' g% N 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 4 V& K. \1 M2 @+ b V
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 $ _1 C @% b3 L5 q* \- v! O' l; B* ~
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 N7 G! E: x2 A2 {$ f9 Z0 l7 U 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % Z1 G' L) L, t+ v$ Z: Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 q" f. n4 N9 U7 C, J( f( e% p( q
/ J0 O9 g, v. [三、关于企业价格策略
! h2 ~: B0 C0 H& i
1 l! D! K }% d8 q( c- t. ` # Z- m/ T. n/ x5 O: }5 N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" ]9 |* _7 H1 [* f 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |