关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑   K  T% H% H  O- |2 z8 N: A; {

, t7 A( J5 q. Z严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 D( |$ u1 b4 Q: U  以下三个定义:
% b2 k1 U4 Z( ~& ?! [/ S  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 w7 ?. n5 c2 S# q) C8 P0 J  O6 q
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# \2 v1 b; O- x1 I5 m# x/ z  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ r+ Q6 T$ a' F4 Y# X" W[编辑本段]严格优势策略举例分析
6 y, f$ t% G" w" G  一、经典的囚徒困境   u5 a$ z: H7 @0 s+ V1 n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ L+ R+ C; `! D3 I+ _2 k  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. G- {' }6 ?9 B7 ^- i  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 e& t, z1 w0 W
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 r$ I+ t' ]0 ^5 V: C1 _  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 W8 C4 ^+ C2 p3 u) m, R  
2 B: r, ~, Z6 ]; }9 b/ ~用表格概述如下:" b( e3 n7 T0 E7 M: H5 W; s
  J, H# ]( e6 G* |5 m
    甲沉默(合作)  甲认罪(背叛)  ' \9 `4 j1 X1 X0 `9 r; d, C' ]
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
, u  q3 l4 e$ Y3 x; O: K+ t9 \: b乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
6 ]/ C; b0 V$ J" n' m2 e. |) c( @
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - i1 P6 c/ H# ?2 i+ g3 Z  C
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ [4 P2 h) g- _6 `  D  若对方沉默、背叛会让我获释,所以会选择背叛。
$ D) J  M/ g9 K  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 r, W; X$ K9 R& s. y% l. a" a9 c  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 n& s" I. L. t3 Z: W% h  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# ?- ?  V  o4 p5 S) N8 B0 _  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  {2 g& J' Y3 w( t, h2 K7 ~[编辑本段]二、智猪博弈理论/ ?4 U' p4 w3 W, e
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , v4 L! Q& U" _7 }1 t' S
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; O% q+ r( t8 {/ [* V" H  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
7 O' u3 c  S2 \+ P$ h# z  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# b' U. S1 I8 M( @! O* ]  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 g  ?1 `  M, @2 D) n  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" C6 J% H9 L3 m5 P; {8 t3 M" {6 V9 }  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 z$ W; W) T8 Z0 e4 e$ `) R
    q! ?$ {: Y( n' m. B
三、关于企业价格策略: n5 y# o9 U$ M( W$ U: L

/ i0 ^' r$ L1 F$ q8 c  5 d& d. Y) [/ k
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 d2 ]- x4 p2 |$ C+ ]/ i- e' y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);  p; K' j9 e( z& c' j" ]
  以下三个定义:0 L# a% @3 T, ~/ x+ b
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 p' T# V7 Z" ^- n, u$ U$ P
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; D9 b# c# l' H  A* F3 Y  所谓的双方优势策略则是指双方利益总和最大的策略。  
) c) A! Q; P6 D. i1 v[编辑本段]严格优势策略举例分析3 W! y  i% B5 D0 x  P$ V  `
  一、经典的囚徒困境
2 J* Y8 g0 C/ F" O' P) r$ U( j  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 p7 E' T1 T* s( E  n  e
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: * m* u  Y! C/ |: a) i- N
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 0 o  R8 v9 x4 B+ |% P" \1 G
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " N1 H6 P% r# ~/ G
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
! G( I- n6 Y, N' J# G) _: U  
$ e) K7 R0 @7 y% [用表格概述如下:+ V8 L1 G3 k0 ?3 `

* E, R4 y5 [  \5 A4 o2 T# p2 a    甲沉默(合作)  甲认罪(背叛)  
" H7 R; D# r. S3 `, P9 ]1 P  \乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  2 }) [) z6 l, Z5 L1 w! P* L8 G) |
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  7 J" s4 c: r  Y' W8 b

. }2 T# ?4 N# W1 z. X* G9 [0 W) }! Z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。   C0 _  @* Y( s( p
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 D* Y2 L# w- m- m
  若对方沉默、背叛会让我获释,所以会选择背叛。 , x  }, f' Q1 k" O" `& n
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
8 Y8 A" N8 j5 m  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
$ t3 e9 e, f2 t$ K4 f  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * |) V( ~7 S* N, j& `# d
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
7 R# S/ |' L) p- g/ @/ y* J* Q: _3 J[编辑本段]二、智猪博弈理论
4 y/ z/ U* _5 F4 O" L) {2 ?  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 O  c/ B) Z8 Q; @: s" b; o- d2 B  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; Z# K. |; A' f/ p% Z% K3 Q- D  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 q; E& T2 L5 G+ ]5 b  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
. M7 y$ `3 D2 d) l+ U/ l  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 h% ]. P& k7 h! @# D
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 B7 A9 W! f7 z" f  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& T2 p: j# e! e' E+ k5 \8 K3 I  d  
! O4 R7 j8 G" H8 a+ \# \  `$ y三、关于企业价格策略( ?/ D% C3 U! q. M8 C! i

: ?1 }5 G- M" x  . B/ e% J! z5 \* }
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
: x& ^! r' U8 r: D5 x  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);" C0 ^  P! W5 B* i
  以下三个定义:
. i% E5 G* i) ^) F4 x7 k1 F  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * g( i! n. i6 [8 j, w9 G
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
4 d& |! |  d: N1 @% [  所谓的双方优势策略则是指双方利益总和最大的策略。  
* J0 @* r- q* f1 U& ?/ X[编辑本段]严格优势策略举例分析
# Q! N2 }" w2 H4 {! i  一、经典的囚徒困境 & ]# g3 R6 G6 D+ n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( P0 R% B: T1 q' K; z  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / v  M2 T5 J' T
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 4 p% P4 X  n. w( r1 L) V( z
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 m  b1 A( e6 I
  若二人都互相检举(互相“背叛”),则二人同样判监2年。4 L2 C$ a* d5 d* V; m
  $ T+ f! Q- |& |+ w
用表格概述如下:
1 R7 r/ S8 ]5 a6 V2 X/ `/ T' k4 e* Q1 r  g+ y. B
    甲沉默(合作)  甲认罪(背叛)  
7 w# [% N5 p6 A, b9 a+ ], ^) W乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  4 p8 g/ x$ T7 E1 [) l
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  " H( h) x8 }  ?8 R- l% _' f2 O! S$ S
- g6 \3 C9 J* t/ s# w
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: X1 U% O' i3 m+ R  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ g" J1 Y* u, A, U0 a7 X3 a  若对方沉默、背叛会让我获释,所以会选择背叛。
$ u: |# `8 }5 }# u2 u. X  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
6 w4 ?4 H# F4 f5 [. c# ~2 |  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 [7 B! q8 ]. ]* Z* i0 B( m! f! h
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 x: a( G" O! |  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ r+ v, D" P( S2 k: p( w+ D& Z[编辑本段]二、智猪博弈理论5 B! E9 i" s. U1 @% Q& }8 u5 T
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 ?' z8 c9 i% A5 @% l- V  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& c3 N5 N+ J. q9 n3 [  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 K" }9 v# {" Q5 s( w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # N/ c! D: D& y7 l+ e2 }  P/ @3 q
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 h) [+ z) J6 A: {/ d( ]
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 " u# P! y3 y: `7 P5 }& H
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. J& j, @' A6 Z
  
% I1 f2 G9 a8 h& a0 B三、关于企业价格策略* }4 o! d/ F# {$ j

( c. {' P5 [# O3 ?9 `: ^8 S8 C  ' X- a; n/ n8 Y1 k2 S6 a
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 e% M' h/ Q: K8 z4 h  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 O* L- N" B- X7 h* w  以下三个定义:
) s; X" ~1 d' r- r! J: i; l  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( q- Z* S; \7 G+ Z6 c$ R1 `# d  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( F( `" P' L  ^0 Q  所谓的双方优势策略则是指双方利益总和最大的策略。  ( {+ i8 ^1 L' S; S/ l, j5 E  _
[编辑本段]严格优势策略举例分析! f/ z( O! Y2 d" V, E
  一、经典的囚徒困境
- C: ~1 H: M4 U# s5 d* v/ Q" A6 O  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, u: l$ C$ I+ ?/ i- Z- g# ^  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* ?- `- t- s5 A4 E+ J: B  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 X% d$ U5 d* R+ r/ p% \
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! L0 j/ |+ j! Y) h2 O, }; Y. o
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
4 Y, P) k4 G  G, p( {7 P" i  
" ^. [. U3 f, e6 a/ r/ {- ?8 f# `用表格概述如下:
" K; M9 A' T: m5 A) |2 [5 f& p! }
    甲沉默(合作)  甲认罪(背叛)  ) p* f8 X5 \1 }. p# L% _, f
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  & T7 I6 ^0 j! b9 Z
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
* a$ m! i+ T( N3 @. T7 B
7 ]: }( q; K7 G+ C9 I- M  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 v4 n+ R1 \4 F3 J/ [; y! J! u& @& f
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 O) g- {7 Z) F/ y# b3 a& ?  若对方沉默、背叛会让我获释,所以会选择背叛。
9 _9 j. f) C( G/ I. B  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " d0 m4 X2 s2 P& ^8 a4 z% s: r: P
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # ^' R$ _/ |" f
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
" U8 a( W8 Q5 u' K  r" G  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( j/ ^6 X$ P/ Y! z5 ^2 u2 t: y) h
[编辑本段]二、智猪博弈理论
4 p: N. n; \1 K7 M0 P  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 - _' L5 n2 Y) |0 d& Q$ R
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 p( B1 \4 \0 f$ x$ [
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* K. J& Z) ]- h; k  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) y+ S# q4 ?. a; A  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 h2 T' S3 c9 ~  D% K" J6 B9 b& A4 @  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
3 m! V4 ^4 G' U/ S" J& Q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 U0 j' `9 l; V" V  {9 O: f  
% x. `2 H3 `* _  [三、关于企业价格策略
0 c9 L3 w, q) O( d$ h5 k( i  c. B/ ?% `( u4 W% ?4 s
  
2 A5 T" W/ i' r) O6 g) u! N  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 9 H' t# ], `) Z% j) q3 H" k" \
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )