关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 + B0 G6 s) P" _' A* z. \$ k

5 F0 b3 R0 {' K严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  x+ Q8 g" i5 s; r' ]+ [  以下三个定义:
9 R0 U  H- ?  i, M1 g. B! }  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 ?# S) O1 U) s7 [$ j% b  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( _3 u9 K" |, t, d0 q0 o  所谓的双方优势策略则是指双方利益总和最大的策略。  . {8 N; Q* T& Y9 `/ r$ n0 w
[编辑本段]严格优势策略举例分析: T  _' p9 A2 J6 p( s- m
  一、经典的囚徒困境
7 D% i; h1 j% _% Y& e" J  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ U$ I) G" j& n" K3 u, R: [  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& l6 u0 j. {; a  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 , [; m9 {% A4 F0 `
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
0 {2 t$ z5 H3 {6 Q  若二人都互相检举(互相“背叛”),则二人同样判监2年。* v. r- ~) V/ x4 l; [* g7 P8 h5 X8 q
  ( Q! j- e7 N3 w5 a. j4 {7 D
用表格概述如下:
" K8 X' [, O% i- I. \
: s9 P5 Q5 K) R3 f  ^    甲沉默(合作)  甲认罪(背叛)  ! x8 J. G5 p  L( j$ W
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * q4 |% {4 F6 s( s
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  * \4 ?/ Y6 n1 W( a) V( L

: ?! S, \; n% |* Q  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 " ^4 _% ^- z5 E
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ C- Y, F* U+ q9 |0 ]0 v, M! X) g  若对方沉默、背叛会让我获释,所以会选择背叛。 . G$ ^  ~& [. N( O$ F3 n0 I# F
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " u) t# D1 z- Y& _3 }5 Z2 h
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 t0 V" ]8 f4 l* L& ~: B; C; ?  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) S. E4 C! _' w9 f8 J6 Y; \' @+ D  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 |4 k8 Y( ~0 T9 _4 e1 z8 Q+ s" @[编辑本段]二、智猪博弈理论
+ P4 v3 f* m! @5 |* f4 t8 B  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% z) r3 n; r- N4 G- f  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' p+ e$ T8 x  W( P" \+ k  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' {6 o$ z' {& A. E  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " A$ L5 P3 Q5 d; h4 X( W8 J* x* c
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
; i- v0 M3 \: {# D) N' r  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , z* i" k* s. a# Y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" D5 M& p4 N6 [* o# N, [2 k  8 Q8 }4 O/ F$ Y
三、关于企业价格策略8 ]1 p7 H5 @% j: U4 G/ W9 I

! e, J4 v5 ^4 M% Q& ]  
* \. ^" u& O& B9 b( J  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
4 t$ Q  Z+ b3 X3 s: x. X  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 w) \6 u9 @1 `0 e
  以下三个定义:
7 j; \( g! M; Q4 Q  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ A+ f% c# E4 B. A6 f% I7 P" F  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 9 p  _% N# s, x5 |* O! q) V
  所谓的双方优势策略则是指双方利益总和最大的策略。  ' G& s; W8 t- }- {9 v
[编辑本段]严格优势策略举例分析
0 z; T+ c6 ~& E+ I  一、经典的囚徒困境 , y' f, n! X; L% s7 [, |) N) }
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 W8 q' f3 A  O/ E) p' H1 s8 ~  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ }) P* N3 x7 q+ d5 ?# D  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 \' [% w8 d/ M" o' X
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
/ N  @+ o2 ~% b  若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ G( b: J2 k$ {8 X" y  ) `3 M- O7 x1 ^. z" p
用表格概述如下:
4 V" q' c; i( B/ }
1 W- V2 K5 d  ]+ e+ I9 S& k    甲沉默(合作)  甲认罪(背叛)  8 [+ u+ l2 O8 z' [3 a
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ! W! E# [3 D% X  p( B  D1 q
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  4 t. I! l  t3 j& P3 j+ m
/ p% I; u/ |1 \# G, O& M
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 o9 a: d. F0 N: B  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' w# [; n) a' S
  若对方沉默、背叛会让我获释,所以会选择背叛。 3 L- T, v4 y& s
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* G. w, S* A0 m! B" j- D; O1 u0 |  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
9 `# M8 N6 p( a) ?- o* o5 H! T  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" _6 X( |; R/ p5 s" _3 f' _/ |  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* R, Q' u1 ~3 v2 x
[编辑本段]二、智猪博弈理论' a  N3 Q9 F4 p& w
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 A  ?5 b  a  `  R; ?+ c7 f2 @  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; J  A0 b- ~) S$ u
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % _6 W1 Z8 Q  r7 D
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
6 A& L7 [, }- p9 K' Q8 i; J  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 a4 p, }- p- c% u" v
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
' o# y9 o- x3 r  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
- i3 D2 |/ C8 I1 D, J2 f2 p  
# V1 }$ o/ z! F1 o: m: v# W+ l三、关于企业价格策略
- Z: x* x& h* ^) D) n) G; r" T+ i6 _% x- M- N
  $ O. U( M* @2 x4 S& Y% y, K) n' o
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; F9 Y, x. }- _$ Z, x. A  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; |- k9 T/ _. r; E, Z$ y; r
  以下三个定义:8 p. Z9 w" e; q8 D+ Y, S/ n1 i
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' a, ^; N+ r/ S, L4 o2 y8 |
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # b# j6 d! b& I# _% b9 s# o
  所谓的双方优势策略则是指双方利益总和最大的策略。  7 `: G5 T+ g3 f$ x3 a- V8 _
[编辑本段]严格优势策略举例分析
: u5 n7 @* J7 o* R, q& {5 W) ]5 `0 M  一、经典的囚徒困境 & j" b' {* O  s2 g/ `: ]
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
7 `/ r4 @" V. t. [  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 ~$ p# T( C, _1 g) U! j
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ' ?, }  l: n9 ~* {5 v& z
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / a/ o) y; ?- D) h2 W( w
  若二人都互相检举(互相“背叛”),则二人同样判监2年。. J5 z# w3 Y/ w/ h6 G. {
  
0 M+ Q9 m' i' B/ _用表格概述如下:
6 q/ D0 W0 \5 A: m5 R5 N# J: s1 \! c* P
    甲沉默(合作)  甲认罪(背叛)  * h' X4 z# d5 c3 m2 F' ?! b, g3 M
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 g6 ~) O* s' C0 y1 c乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  7 L4 p0 S: k) r
" G4 S! G2 u9 m* g5 f2 o
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 / B7 s" U, z( c+ {2 n
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. @. ~: |, D& }  若对方沉默、背叛会让我获释,所以会选择背叛。
! T/ u! G' A. r  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + b" m, C* [2 x& |1 y( C
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* y$ n; E8 A& `7 P/ m# r% g  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" g, Q( u  g' a2 o7 R# O! h  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。1 s% B/ T6 q% b5 l* B
[编辑本段]二、智猪博弈理论' a. M7 C8 S8 J9 G) n
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 t3 S3 ~0 d' c3 P1 t7 j9 r3 l  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. k4 s* r( P; g$ l  Q3 _" ]  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% _+ R+ T" j) |) y1 C+ d- V  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - o1 R1 j/ D) B0 }9 t. t8 V" S
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 h2 u2 ?4 D: `' V& R6 b$ j" J. ?5 d
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 w  G2 J* c- i8 L
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" U7 y$ g) a2 ]8 E" c+ I+ ^
  # q  k5 C" g% C6 G8 P5 {: q
三、关于企业价格策略
! Y( \& p# Z: ]! y0 h0 Y2 z3 P) T/ a; ]) f+ d+ A  A+ |. t
  
; K! i$ u4 U% y2 m  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 N# {+ g: l8 K  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) w0 Z# p' w  s  以下三个定义:/ H5 i% f; `' S8 ]& P6 I# v0 @
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 8 o- R% f9 h- ^1 i) @  @/ t
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 \7 v( M/ q( i# S" d* J* L* X1 v  所谓的双方优势策略则是指双方利益总和最大的策略。  $ [* R  Z$ P/ T8 C# x3 T2 S6 a
[编辑本段]严格优势策略举例分析
. u. l- t7 ?) F1 V& H8 o1 ^  一、经典的囚徒困境 % F" O6 U# Y' m3 g6 p
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: $ D4 |) N( E6 b
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 l& B8 p; w7 \9 [4 s
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 X2 D+ d$ P: p  c  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  b7 [6 \$ |5 D# _  若二人都互相检举(互相“背叛”),则二人同样判监2年。
+ R6 u2 w. h5 `' b  ( i& k7 t) ~8 g9 J4 M. [. q- g
用表格概述如下:
& d( y: N. q6 r( ?  N) x& p% s  ?
% V3 \! f/ m2 w( [. ?6 T6 x    甲沉默(合作)  甲认罪(背叛)  
2 y1 d. C2 q0 N; V/ l) \/ A, h9 z乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
. ?7 A+ t4 T% i, P9 R, j乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  " }5 P5 g3 P! B3 p1 {+ B

9 h$ U2 n! ~" K9 \* [4 y  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; Z/ `. c6 A/ \5 ]
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  C7 ~4 t# q7 N( p  若对方沉默、背叛会让我获释,所以会选择背叛。
& w% X3 D/ {3 T1 a1 Q$ i* y  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, G1 J7 D; {6 F0 J% R. o  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
1 Y7 Q3 a3 J4 f7 u) |& ^  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
' l2 ^" [; S# _$ o, O5 V  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 L# D# @+ ?/ K4 u% B
[编辑本段]二、智猪博弈理论4 h5 e, p& T" @) S7 e
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 W8 I; T. Q7 Y+ E6 h2 z! N  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ `3 z# k; i' V% I% l" _  x: @& S$ j( u  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! T; w1 T4 H% r7 H4 [3 c  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 F( r' t9 _% M# N+ |
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : ^( H/ Z1 I; ?- L( K
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ w& T& [) [1 L5 W# h; V9 M  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; d  J( O7 ~5 P8 x2 g4 t  , D2 {9 ~# H% p3 x5 m
三、关于企业价格策略
" w9 A' I9 u& X7 g( l( G/ T
( B/ U: a9 s% V, _$ W+ Q( `9 @( t  
8 `! s% E" i3 @- e) J, J3 q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 a& [- S) M& o8 M+ Q3 y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )