本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 & [" ^9 T! B3 B3 F
" O) ]; D& \' o
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 a6 d, [; A% [( S
以下三个定义:- h* @& `) {& P$ ^# M0 u
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' O+ k* j1 n2 h8 p* a' n" O 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 % [( T8 C, _' @/ H3 p- m) x" {' A
所谓的双方优势策略则是指双方利益总和最大的策略。
$ |3 u9 |: r8 N5 c7 y i[编辑本段]严格优势策略举例分析
5 {8 n* \+ ^; S* Z5 |. |/ ~! o# } 一、经典的囚徒困境 6 ?' p; A: }/ `6 E' P
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# P* I3 M6 K# e# H1 `9 e 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 | I; k# N0 c& o0 r
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% c5 u; q; S! q) I( x I) v 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 6 x! q8 Y! G: b6 Z: d/ o& D$ e
若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 K/ z5 z# l0 ?# r2 B j& h5 c4 H% O X& Y
用表格概述如下:- {6 d5 n! t* h) w( x7 j! {. c1 T
' Q* G6 l% C% y; D, H6 b 甲沉默(合作) 甲认罪(背叛) / {) |2 r$ _( b3 u$ Z9 m. U; c
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 ]" _# r# s) c8 z% R2 I
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; b2 r/ \7 k/ p# N+ j$ F. S+ W2 C( p6 h# _
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 & b, j% T4 I- x' P3 e
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
2 Z2 ?) Q1 L, `3 ]+ K# `7 m 若对方沉默、背叛会让我获释,所以会选择背叛。 ( s& Y' _' H" y% {- l. e
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 \/ E- j8 J+ j 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; ?, `# t% h& y, w/ U 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 _6 u: q( I$ I& h5 s$ g5 N8 l 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* M& @: A/ v( A M) T! p
[编辑本段]二、智猪博弈理论
! K, D8 {* [/ U9 g3 W8 W( A 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 ~% C! Z, K+ L* q) i 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. F9 Z [& e5 I5 N 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" }# j& E5 ?$ Q! @& ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 M0 ^1 f, y' X
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* X3 K5 S# @ u. s8 R& F h 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: x2 X3 s6 [4 w1 x, ~( f 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 k( B; p3 \8 P
1 I" c. A% s" e, C三、关于企业价格策略4 h2 z* o# t, @, p$ l7 V
, L' l- u- ~, e! d. s' u : ?0 K* I& @& R" y7 h' L
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( ^6 J5 w) ` P5 ~) U* O! {8 V/ S 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ p) c: W: K2 l2 |- E 以下三个定义:2 t W: q: ~5 A8 [% C7 @7 ]
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 u' e8 u) ^$ A, K) D* ] 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 N% e% S5 K9 h. e1 H- c( y4 @) G9 n 所谓的双方优势策略则是指双方利益总和最大的策略。 $ g8 F z% N# W1 {! Z& P9 [
[编辑本段]严格优势策略举例分析' F5 Y" y2 p) p1 L8 U, _% e1 N
一、经典的囚徒困境 $ A. z& Z# e4 Y6 L" J6 y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
. s! O/ t8 W0 i4 o* A 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 h1 [' t( {2 {+ [
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; k9 ~! g0 N7 `* U' L2 I1 | 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " q0 e' u) y1 P2 ^/ n: @7 y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 g( i& N4 ]- f , _& u/ a9 Y P b- B8 [( K" u
用表格概述如下:
" B) ^$ R* W5 y& v$ S/ j: ^* ~8 f. {
甲沉默(合作) 甲认罪(背叛) % D- u, r8 ~7 N
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 , |1 [" N j j) c, {. ]
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 @" V& y# [3 W7 a
" Y# i* n5 L* Y: S U, H! p2 V( e- [ 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
2 W5 m+ J- T1 L% L 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 P+ s" K; [0 C8 H! r. ]# Q& y 若对方沉默、背叛会让我获释,所以会选择背叛。 ; R$ e3 n/ J; V: B% m9 r5 I
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 Z, @! q$ ~/ _1 b) N+ Z/ U
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 R. L$ S1 p' A; s' p n) K
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 ^ k4 H$ ] @! z. N( {9 m) M
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 _0 p2 s5 y7 b" ]
[编辑本段]二、智猪博弈理论- `7 e& Z& q- e* j. k9 h
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ' h, T4 i. R6 d3 e4 T+ E
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ @! `% p8 C' L$ j% c 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! y y1 e, S l3 u 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
9 I. `( ?: e9 H1 }+ o5 L “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
. P# h+ q1 Z: {8 V) [% E. A7 H6 b' i 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
. t3 ]* x2 X6 v+ ^6 b( D% w 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 j" c6 y4 H8 o$ r9 a* d ! z& z8 r, Q3 ?1 }2 B, B
三、关于企业价格策略$ e) X% m) W s; k) \# o
% H$ u6 D% _0 c* e % I; W4 e) I3 T) s& r
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 `7 U2 K4 I8 r6 r3 N 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ Y U* f, q* L- o6 V0 g 以下三个定义:
* l! `, a! U. A% A/ W# q 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ z' l! r6 w2 Q* T* ] 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- W* |* ` a4 d7 ^$ C' C* I 所谓的双方优势策略则是指双方利益总和最大的策略。 5 Y* y: _' T* Z2 ?/ T6 H
[编辑本段]严格优势策略举例分析 ]$ X' d! K. Z' g7 Y' M2 O
一、经典的囚徒困境
& t! C/ S: F- D8 q; B8 o 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: * t5 f% ^' |) C, |
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 d: R# x1 Y: a* X3 z& d0 P- x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( P3 q7 F8 r6 X 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * D6 d8 @- j( j
若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ a4 y; l, c; d0 M t; a3 ~
4 M: m% T) s6 U5 x用表格概述如下:
0 \( C% m5 E) H' P6 Y
" n: Y& s1 @' f9 S, `( b 甲沉默(合作) 甲认罪(背叛) 0 w+ t9 ^2 A% R B
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: x r* }" `+ h5 C+ _5 A! u* F. i+ \乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 o6 F( `! [% H8 `% v
" g4 {, U9 K3 G6 e3 d" ^" x8 _- [* f0 ^
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 O# J9 S' J! _4 X 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 I- j" ^& I4 v1 {, N
若对方沉默、背叛会让我获释,所以会选择背叛。
* N1 e2 V3 f0 M 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: D" W) i6 C4 D0 X% X' s; D 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 _( c3 E" ]% e: x
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- u' q: z" \8 u8 s) d* u- N 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 }0 Y, b* E; d' `7 X[编辑本段]二、智猪博弈理论
/ B2 N. ^2 _+ [, w/ G3 ^! d! g 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 " _- E# W- x) r0 a3 M4 Q- _* P) O( B
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
9 _# b# f; f1 i 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 Y) u9 C' I5 [9 N
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
- H, \- g/ p4 D! x# Y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( ^6 k8 ^7 C$ d {6 N
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ~$ i' \5 N, Y- _3 @( v, i) Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" a9 }) z+ ?* @/ P8 e1 }2 x
5 [5 a- t s H, B三、关于企业价格策略8 h/ K$ H6 p7 D+ r ]
- N$ I' o+ e% |
0 x0 p0 D2 v; x9 y* u4 F 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 V) B6 p' `& e8 F2 ?6 S
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 S& G4 K- h! s
以下三个定义:
+ D3 X' u* q3 _ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 }0 L8 j, ]2 D/ B
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * j" q+ j4 D1 J) r6 f3 F
所谓的双方优势策略则是指双方利益总和最大的策略。
) K) t$ L& K0 q; m[编辑本段]严格优势策略举例分析
$ L' l5 Q$ S) w/ Z& M' e 一、经典的囚徒困境 ! B; N8 E1 M; A7 |/ |- f1 j
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . P- b% T5 n9 y
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* F( K3 r4 ^/ i* m/ u, ]' J 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
/ P. B; ~# v8 t0 D( E 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 f' z: u7 Z- s1 M2 I0 g3 Q 若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ E! f$ W- R. H: Q : [; H" Q0 s' G+ P8 w- ^8 r/ s" `
用表格概述如下:
6 O! G b% Q8 `; s4 ~2 T- n+ v* ]; ]9 R) \5 q2 T# E9 F
甲沉默(合作) 甲认罪(背叛)
, D7 }+ [0 A9 D1 m/ n3 D* d0 K$ D乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
! B1 c/ A5 A* ?# n C/ h乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! h! X! H- y5 l6 k- V
+ }4 k# \7 w5 C" P; e- R 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 E+ o, A9 M6 ~9 _0 y1 |6 N
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + @( y9 Q3 j" D
若对方沉默、背叛会让我获释,所以会选择背叛。
* y- g* @0 d% D 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# y; ?' k% J: Y Z& P9 m 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) ^" O8 p. T6 Z- ~! ? 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 3 k( d! D1 G& N" l% j0 X
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- ?" L: }2 P8 @( C[编辑本段]二、智猪博弈理论
" V0 A- t1 V4 h* ?2 E! f, k% g 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 U( z6 I4 W0 a' r2 U. r
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' b; N L$ g4 c1 L& W
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" e. X8 v8 F! ~0 m 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " O( j- w+ z0 V; e
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' C1 v# M! l7 H5 k' _ y 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " C# k2 M6 i. I: W% b: Y2 w
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, A$ }8 T, y' g/ D
, U' H; P7 ?% [5 O; O& Z
三、关于企业价格策略4 U7 D# @( v% Q! D
% y) a4 T" ?. G7 G
- u8 [2 n- |# R* W
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % w' k; t9 i* H' |$ [" O/ x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |