本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 x5 I$ j# O% A2 i4 p! b' Q$ c* m
# {+ Z3 q' U0 O' |# ?
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: z) v. Q8 A4 k9 n, d. \* D 以下三个定义:+ B9 G, ~; g; t7 V+ b
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 @/ ^; Y& B: J7 t- u: j
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 e, Q! |& ^ B4 H8 E 所谓的双方优势策略则是指双方利益总和最大的策略。 b1 u2 c: X/ }/ q9 ?1 l, L
[编辑本段]严格优势策略举例分析) g7 _, b" e% N7 z, n. Z. g
一、经典的囚徒困境
% [, u9 m& J! r6 {! D; h 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: v. c" `6 b6 P" i4 `: A! ~' C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) f3 E8 z1 v7 D' N) F, o* d- r# f
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * Y0 V K% r4 O( x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , Y4 R, f: s! G/ e6 @
若二人都互相检举(互相“背叛”),则二人同样判监2年。. m$ }' F; C: i. _( k) `# B) _
3 h# o( U6 o9 E& E8 m* L$ F
用表格概述如下:
# `+ z1 P; J/ w% L
0 e9 Z' N" f; V5 T( B5 \" H, a 甲沉默(合作) 甲认罪(背叛) , R9 P& n6 x6 T* q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( s6 E* ^3 w3 q3 x9 d0 _乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ M7 s! `0 ]$ X, }, H" T( s6 R, E( i1 y P7 a% L( z: K6 A
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : J {$ a$ c( G. L$ a" H
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ f5 x' I$ [. M8 n5 O+ e+ A! H 若对方沉默、背叛会让我获释,所以会选择背叛。
; p2 a6 w7 E, ]$ c4 Y% I 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 & {1 d4 S7 Z. M' ]# p0 x0 Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ; Q4 `6 D' U2 ]: d4 F) p" m- j
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 D. z& n8 {1 U: Q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。$ f. F4 |+ w% j# @% f
[编辑本段]二、智猪博弈理论
$ j3 i# p _! b 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 . T# T3 K& U$ Y7 k0 E. C
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; Z* d, C5 M% v 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( u! p, s9 i# u3 B% U- x
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' f9 s9 @8 v$ x' b N3 G “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
$ M" C* f% h: j! Z& M G 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ s& [: q+ g/ Z5 r4 m4 j8 ]6 T6 U
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 H R" n8 |1 `! g
- b2 \7 M" f: |4 |6 G三、关于企业价格策略$ V J8 O3 P$ x
) e' v/ Z3 D$ V& _8 c1 R- p
4 f4 m+ B) D, }# Y 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 x: t& p ?6 E1 x
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 Q5 T" E5 w4 C4 y5 H. @; b, W 以下三个定义:
. P! _) S8 ^1 ^2 S; d 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& N+ v& }. r+ c 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 `) M3 P6 d1 L0 |- K
所谓的双方优势策略则是指双方利益总和最大的策略。
4 e3 w4 D& m. x% P7 f[编辑本段]严格优势策略举例分析' Q3 O) _8 ] W5 m6 T" W
一、经典的囚徒困境
/ {9 c; }0 c3 e( i1 ? 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: / N a1 ?1 P! r, W/ y
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 }* V k( a1 B/ P* w# G- g8 ^
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 N+ f( ]- M! {# M) S; M 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / g2 T. G# S# f- _- f/ F
若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 s% E% O6 F) U/ f
2 n. H8 k2 r4 \4 [* I' j: r用表格概述如下:
O+ [0 r: j, T8 B n! R
5 h4 A( d' `, f+ F* s( w8 M 甲沉默(合作) 甲认罪(背叛) 0 N e3 P9 k. X, q
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
5 I4 l/ \7 e4 {1 v& M' F乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % k4 W3 O r( E: C
1 u* {, s7 z1 Z! k 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 X: E2 G4 Q8 Z" y4 U) @ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: i# H7 O2 U2 b) a/ |. r1 H K
若对方沉默、背叛会让我获释,所以会选择背叛。
# @6 d! f. g. B1 Y2 r 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 z6 j( _6 L- c+ _' k: k; F/ M
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 j5 R% a- T/ v) K5 x. `$ H3 ]
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( B, e: S! ?$ } V0 Z, Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# ]8 o/ g$ q# y4 |; I
[编辑本段]二、智猪博弈理论
0 k9 u [: \; g 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 O* m7 y- P3 _ w2 X9 D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 T! B$ i! t W5 b* O e
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 A4 I, M! M# L$ x# M 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + ?& N- g/ Q2 C9 {& }! K
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
9 l% ? m8 y" Z. ` 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( j8 I. e8 p3 F% |5 ]
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( q9 Z; _) I6 w* M$ k% |5 n9 k
7 L* G; C5 m6 g; U三、关于企业价格策略: y( ^* N0 ^5 I5 }3 Q1 Q' J* l7 o: F2 Q
' }0 | z/ N" ^, {6 Y' g" h 6 ]- r8 ^: e" U, Y- N/ G% g
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + l& p# i9 V3 m$ n
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
/ H7 [; J: o& [' b, T 以下三个定义:
) h# P$ R; ` y1 M1 g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 ]* d. `1 j: Y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - k3 \- v o: L& V
所谓的双方优势策略则是指双方利益总和最大的策略。 0 q$ w+ g3 C+ N! }
[编辑本段]严格优势策略举例分析; Y2 z: M& `+ u8 a
一、经典的囚徒困境 . B9 Q( d( b' H! @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( v) s% n0 R* A2 E 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ O/ j. g0 F% q4 r0 K& v P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( \; C* g: d; S9 L4 y; {! A
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * X2 T, Q* Z6 \3 R1 S
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( _# R/ y9 p. e9 P5 v/ i
2 I, M9 ^) V$ B( n# h' T用表格概述如下:
5 N! m$ d/ D7 W& Y4 i; r* r" J( g
1 y4 I( K" S0 Y& @3 r! D 甲沉默(合作) 甲认罪(背叛) : m } ?+ C$ }1 U K8 {
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
: L0 ^: U' E6 n- q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . m8 g$ H0 [" {+ @7 {' Y- L
/ Y3 O. O8 t9 Z8 P0 y2 u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ \# \; R5 H3 Q" U 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
4 T% ]! ], w$ g# C0 n 若对方沉默、背叛会让我获释,所以会选择背叛。
) v8 [: R* l9 Y& Y2 q" f2 c5 C 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" ^2 x$ o6 H7 l- c) t& y 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( E1 I6 @- Q! n5 u! ^4 J, m+ j
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + k9 S$ m# f5 ~9 a/ r- B
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 a1 L9 m+ c8 h: B
[编辑本段]二、智猪博弈理论
8 c; D$ f% d: Y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 J/ b$ x: h- g3 W' J9 h6 s# y4 X# D6 M
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 {! [0 g6 o6 Y I4 t1 E* ^. h" L
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 `7 R5 A: y, E9 C 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ }2 q) g/ s+ Y% c “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 F1 ?3 ]7 d& s( ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 * ^% W2 G# p) z+ {' ^# J
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: O; d- u; k% B+ G: \3 u
7 f' Y9 g; X! W0 y三、关于企业价格策略
! F1 |( u5 j- y4 b+ ^, i
6 k8 p3 y" U+ q# r1 x' Q) l' A
- s/ m* O! ~1 ~( U8 n! S; u 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ( Z6 F9 i: M9 l e, H" L5 _
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) u) Y) G) j2 S F' B
以下三个定义:
- l6 Z* I% E0 l( U: }* @ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 4 c& D' k8 o4 m3 D
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( e! A5 m" \5 G+ a h
所谓的双方优势策略则是指双方利益总和最大的策略。
2 P0 L p8 |7 o, }7 r( c1 o[编辑本段]严格优势策略举例分析
" N$ ^/ h3 C% f& v 一、经典的囚徒困境 / v+ n- A* V# w5 y; c+ W
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & J/ W& @4 r0 [& u: R! C
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: V: |3 j5 `' |4 a 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
- h0 T. _( c, {( r$ Y, e 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- p! W# f0 Y+ z+ r4 z* f 若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 l5 n* h0 }; t& ] 7 z9 e4 a7 G# b4 x L; e
用表格概述如下:# J& e$ @6 J k7 T' d; `5 h- r
, A# |* U2 g% S0 s# m& l 甲沉默(合作) 甲认罪(背叛) : `1 {& L0 R" s/ w9 V8 I
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
N* Y6 e" d/ M% w4 R8 j8 z5 Z乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 q5 S2 N; n* x9 E5 {/ A6 x) b, c# G
7 f, Y6 m' ~: S; Z/ ~7 ` 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: ], A& A& P# y6 w3 I8 o% G* _ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" G' b" R2 K7 `: U3 ?3 E: \ 若对方沉默、背叛会让我获释,所以会选择背叛。 - q J% X% L# C9 w. y6 W' \8 ]* k7 [
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . l, G: l7 r$ i/ p$ t( z0 F8 h
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * N) M6 i6 F+ {! f
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # G r ]/ u4 J- g
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。' @; G7 M' `! X* }5 Y6 s" X4 O) b
[编辑本段]二、智猪博弈理论
. N% v$ f- \6 a }% Z X$ [ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 0 h2 d7 g s' c3 I4 d6 u. T- j+ R
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
2 P/ w7 v. ~* m9 c" y, C 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! w1 ?' R: O9 b3 L- S6 q5 i 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 {( L8 r. k$ L) J; A6 G “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 b5 Z7 e1 t$ ?7 D% ]9 ~
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 _& P( @0 C b9 c* A' e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) x! Z8 {4 n& V0 i
" I F) ^7 u1 Y: B9 {三、关于企业价格策略( @7 S8 T Q: H
" [" u7 l4 E$ k$ | " s9 s3 N- {) {9 t8 a8 ]5 o- O" ]
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% L/ {& ^- |/ f6 l8 V8 Y$ \) t 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |