考虑最简单最通用的情况,参赛者 N = { 1 , . . . , n } N={1,...,n} N={1,...,n}参与竞争奖项 B B B,参赛者 i i i付出努力 x i x_i xi,所有参赛者的努力组合是 x = { x 1 , . . . , x n } x={x_1,...,x_n} x={x1,...,xn}。竞赛成功函数(contest success function)描绘努力组合到获奖概率的映射关系,获奖概率符合如下约束: 0 ≤ p i ≤ 1 ∀ i , ∑ i = 1 n p i ≤ 1 0le p_ile 1forall i,sum_{i=1}^np_ile 1 0≤pi≤1∀i,∑i=1npi≤1。 p i = p i ( x 1 , . . . , x n ) p_i=p_i(x_1,...,x_n) pi=pi(x1,...,xn)
如果所有参赛者的估值函数与代价函数都是异质的。 v i ( B ) v_i(B) vi(B)表示参赛者 i i i针对奖项 B B B的估值, C i ( x i ) C_i(x_i) Ci(xi)表示参赛者 i i i付出努力 x i x_i xi所产生的代价。那么,效用函数可以表示如下: π i ( x 1 , . . . , x n ) = p i ( x 1 , . . . , x n ) v i ( B ) − C i ( x i ) pi_i(x_1,...,x_n)=p_i(x_1,...,x_n)v_i(B)-C_i(x_i) πi(x1,...,xn)=pi(x1,...,xn)vi(B)−Ci(xi)
情景设定:两个城市竞争下一届奥运会的举办权,各个城市都通过投入资金的方式来提升竞争力和获胜可能性。理想情况下,投入努力最多的城市获胜。但是现实情况可能存在噪音,即不一定是投入最多的获胜。 形式化表示:两位参赛者 i = 1 , 2 i=1,2 i=1,2竞争某个奖项,获胜估值 v 1 , v 2 v_1,v_2 v1,v2彼此已知,并且假设 v 1 ≥ v 2 ≥ 0 v_1ge v_2ge 0 v1≥v2≥0(参赛者 1 1 1获胜意愿更强烈,愿意付出更多投入)。代价函数相同且设定为 C ( x i ) = x i C(x_i)=x_i C(xi)=xi。获胜概率表示如下: p 1 ( x 1 , x 2 ) = { 1 if x 1 > x 2 1 / 2 if x 1 = x 2 0 if x 1 < x 2 p 2 = 1 − p 1 p_1(x_1,x_2)= begin{cases} 1& text{if $x_1>x_2$}\ 1/2& text{if $x_1=x_2$}\ 0 & text{if $x_1<x_2$} end{cases}\ p_2=1-p_1 p1(x1,x2)=⎩⎪⎨⎪⎧11/20if x1>x2if x1=x2if x1<x2p2=1−p1 均衡分析:参赛者 1 1 1认为参赛者 2 2 2投入努力 x 2 x_2 x2,那么他的最优响应要么是投入比 x 2 x_2 x2略大的努力,要么是投入 0 0 0。后者是因为 x 2 x_2 x2已经超出了参赛者 1 1 1的承受范围,投入更多努力不会带来收益。 该博弈中根本不存在纯策略均衡。纯策略均衡是指,双方采取某个策略,都是针对对方策略的最优响应。在这里,1认为2采取 x 2 x_2 x2,那么1该采取0或者 x 2 + ϵ x_2+epsilon x2+ϵ,如果1采取0,那么2只需要采取 0 + ϵ 0+epsilon 0+ϵ即可,此时1采取0不是最优响应;如果1采取 x 2 + ϵ x_2+epsilon x2+ϵ,那么2该采取 x 2 + 2 ϵ x_2+2epsilon x2+2ϵ或0并且无论2如何选择,1此时都不是最优响应。 既然不存在纯策略均衡,那么只可能存在混合策略均衡。混合策略我们用分数的累计分布函数(CDF)来表示。下面的CDF组合彼此都是最优响应,也就是说代表了一个混合策略均衡。(当 x 2 x_2 x2符合 F 2 ( x 2 ) F_2(x_2) F2(x2)分布, x 1 x_1 x1符合 F 1 ( x 1 ) F_1(x_1) F1(x1)分布的期望收益为 v 1 − v 2 v_1-v_2 v1−v2,不符合的话期望收益更小;当 x 1 x_1 x1符合 F 1 ( x 1 ) F_1(x_1) F1(x1)分布, x 2 x_2 x2符合 F 2 ( x 2 ) F_2(x_2) F2(x2)分布的期望收益为0,不符合的话期望收益为负。因此当前状态下,彼此都是最优响应)根据CDF求得期望如下。 F 1 ( x 1 ) = { x 1 v 2 if x 1 ∈ [ 0 , v 2 ] 1 if x 1 > v 2 F 2 ( x 2 ) = { [ 1 − v 2 v 1 ] + x 2 v 1 if x 1 ∈ [ 0 , v 2 ] 1 if x 2 > v 2 E x 1 = v 2 2 , E x 2 = ( v 2 ) 2 2 v 1 F_1(x_1)= begin{cases} frac{x_1}{v_2}& text{if $x_1 in [0,v_2]$}\ 1& text{if $x_1>v_2$}\ end{cases}\ F_2(x_2)= begin{cases} [1-frac{v_2}{v_1}]+frac{x_2}{v_1}& text{if $x_1 in [0,v_2]$}\ 1& text{if $x_2>v_2$}\ end{cases}\ E_{x_1}=frac{v_2}{2},E_{x_2}=frac{(v_2)^2}{2v_1} F1(x1)={v2x11if x1∈[0,v2]if x1>v2F2(x2)={[1−v1v2]+v1x21if x1∈[0,v2]if x2>v2Ex1=2v2,Ex2=2v1(v2)2 该混合均衡是唯一的。有期望分数总和看出,该竞赛效率很低。该竞赛的期望分数总和低于标准二价拍卖,并且鲁棒性不足,可能出现将奖品分配给非估值最高的参赛者的情况。以上便是一价全支付拍卖的基本性质。
Convex cost 本章节我们考虑代价函数是凸函数,也就是说 C ( 0 ) = 0 , C ′ ( x i ) > 0 , C ′ ′ ( x i ) ≥ 0 C(0)=0,C'(x_i)>0,C''(x_i)ge 0 C(0)=0,C′(xi)>0,C′′(xi)≥0。考虑情景如下:两位参赛者的估值相同均为 v v v,代价函数相同 C ( x ) C(x) C(x)。类似于上一章节,该设定下仍然不存在纯策略均衡,只存在混合策略均衡。
More than two contestants 本章节考虑超过两位参赛者的情况。根据多为参赛者的估值不同,也大体分为两类。 第一类: n n n位参赛者估值 v 1 ≥ v 2 ≥ v 3 ≥ . . . ≥ v n v_1ge v_2ge v_3ge ...ge v_n v1≥v2≥v3≥...≥vn。存在唯一的混合策略均衡,对于 i > 2 i>2 i>2来说 x i = 0 x_i=0 xi=0, x 1 , x 2 x_1,x_2 x1,x2符合上面提到的 F 1 ( x 1 ) , F 2 ( x 2 ) F_1(x_1),F_2(x_2) F1(x1),F2(x2)。也就是说,均衡状态下只有前两位参赛者有出价意愿,后续参赛者选择不参与,这样多参赛者的竞赛就退化成了二参赛者的竞赛。 第二类: n n n位参赛者估值 v 1 = v 2 = . . . = v j > v j + 1 ≥ . . . ≥ v n v_1=v_2=...=v_j>v_{j+1}ge...ge v_n v1=v2=...=vj>vj+1≥...≥vn。对于 i > j i>j i>j来说 x i = 0 x_i=0 xi=0。其余参赛者都可能出价参赛,因此可能存在多种混合策略均衡。此处略过。
Other cost variants 完全信息、不带噪音的全支付竞赛已经研究透彻。本章节考察代价函数的变种形式。考虑两位参赛者的竞赛,参赛者的收益函数设定如下: v − b x 1 − d x 2 , 1 w i n s − a x 1 − t x 2 , 1 l o s e s v − b x 2 − d x 1 , 2 w i n s − a x 2 − t x 1 , 2 l o s e s v-bx_1-dx_2,1 space wins\ -ax_1-tx_2,1 space loses\ v-bx_2-dx_1,2space wins\ -ax_2-tx_1,2space loses v−bx1−dx2,1 wins−ax1−tx2,1 losesv−bx2−dx1,2 wins−ax2−tx1,2 loses 上述一般化表述形式包含多种竞赛设定。当 b = a = 1 , d = t = 0 b=a=1,d=t=0 b=a=1,d=t=0时,代表估值相同为 v v v的标准形式竞赛;当 b = d = 0 , a = t = 1 b=d=0,a=t=1 b=d=0,a=t=1,代表当失败时竞赛者需要支付自己与对手的代价…
Constraints on effort 本节考虑分数限制,也就是说参赛者无法按照自己的意愿随意选择分数,而是必须服从某个限制。举例来说,研发竞赛(R&D Races)中,公司知道肯定研发投入越高收益越高,但实际并不可能实现无限研发投入,我们设定公司的流动资产作为其分数选择上限。假设有 n n n家公司,胜利估值都是 v v v,流动资产排名为: w 1 > w 2 > w 3 ≥ . . . ≥ w n ( w 1 < v ) w_1>w_2>w_3ge ...ge w_n(w_1<v) w1>w2>w3≥...≥wn(w1<v),那么存在如下混合策略均衡(由CDF表示)。 F 1 ( x 1 ) = { x 1 v if x 1 ∈ ( 0 , w 2 ) 1 if x 1 ≥ w 2 F 2 ( x 2 ) = { [ 1 − w 2 v ] + x 2 v if x 1 ∈ [ 0 , w 2 ) 1 if x 2 ≥ w 2 F_1(x_1)= begin{cases} frac{x_1}{v}& text{if $x_1 in (0,w_2)$}\ 1& text{if $x_1ge w_2$}\ end{cases}\ F_2(x_2)= begin{cases} [1-frac{w_2}{v}]+frac{x_2}{v}& text{if $x_1 in [0,w_2)$}\ 1& text{if $x_2ge w_2$}\ end{cases}\ F1(x1)={vx11if x1∈(0,w2)if x1≥w2F2(x2)={[1−vw2]+vx21if x1∈[0,w2)if x2≥w2
Incumbency advantages 本节关注于竞赛者之间的异质性,或者说是非对称性。总结来说,非对称性可能存在于三个方向,参赛者的胜利估值、代价函数以及竞赛成功函数。特殊的是,胜利估值不同可以等价映射到估值相同、代价函数不同的情况。(因为估值实际上表征的是,愿意承担分数选择所带来代价的程度)。 本节题目为现任者优势,所讲述的是关于竞赛者竞赛成功函数的非对称性。现任者优势用来表征headstart,结合情景来说,现任者已经在市场中积累了经验,对于新进入者来说,现任者花费选择分数获胜的概率更大,这个优势就是headstart。举例来说,考虑情景代价函数相同均为 C i ( x ) = x C_i(x)=x Ci(x)=x,胜利估值相同均为 v v v,竞赛成功函数为: p 1 ( x 1 , x 2 ) = { 1 if x 1 > x 2 − δ 1 / 2 if x 1 = x 2 − δ 0 if x 1 < x 2 − δ p_1(x_1,x_2)= begin{cases} 1& text{if $x_1 >x_2-delta$}\ 1/2& text{if $x_1= x_2-delta$}\ 0 & text{if $ x_1<x_2-delta$} end{cases}\ p1(x1,x2)=⎩⎪⎨⎪⎧11/20if x1>x2−δif x1=x2−δif x1<x2−δ 上述竞赛成功函数表示, δ delta δ即为参赛者 1 1 1的headstart或者说Incumbency advantage。
Incomplete information 本章节关注的是全支付竞赛中的不完全信息,也就是说:参赛者们都清楚自己对于奖品的估值,但并不知道其他人对于奖品的估值,只能通过经验或者猜测获得不完全信息。 为了研究不完全信息设定下均衡的特点,有关不完全信息的建模如下:2位对称参赛者,这里对称的意思是估值分布、分数选择函数、代价函数全相同。参赛者的估值 v i ∈ [ 0 , 1 ] v_iin [0,1] vi∈[0,1]独立同分布于 F ( v ) F(v) F(v)。参赛者 i i i选择分数 x i = ξ ( v i ) x_i=xi(v_i) xi=ξ(vi), ξ − 1 ( x i ) = v i xi^{-1}(x_i)=v_i ξ−1(xi)=vi(假设逆函数存在)。代价函数位 C ( x i ) = x i C(x_i)=x_i C(xi)=xi。参赛者1的效用函数为: π 1 ( x 1 ) = F ( ξ − 1 ( x 1 ) ) v 1 − x 1 pi_1(x_1)=F(xi^{-1}(x_1))v_1-x_1 π1(x1)=F(ξ−1(x1))v1−x1 为了最大化效益函数,求导并令其为 0 0 0得: π 1 ′ ( x 1 ) = F ′ ( ξ − 1 ( x 1 ) ) d ξ − 1 d x 1 v 1 − 1 = 0 pi'_1(x_1)=F'(xi^{-1}(x_1))frac{dxi^{-1}}{dx_1}v_1-1=0 π1′(x1)=F′(ξ−1(x1))dx1dξ−1v1−1=0 根据对称性假设,参赛者服从同一分数选择函数 ξ xi ξ。 d x d v = F ′ ( v ) v frac{dx}{dv}=F'(v)v dvdx=F′(v)v 这是一个差分方程,解决的难易程度取决于分布 F ( v ) F(v) F(v)。假设最简单的情况,估值服从均匀分布,即 F ′ ( v ) = 1 F'(v)=1 F′(v)=1得: d x = v d v ξ ( v ) = v 2 2 dx=vdv\ xi(v)=frac{v^2}{2} dx=vdvξ(v)=2v2 均衡的含义就是每位参赛者的当前选择都是针对当前局势的最优响应。自己的估值、代价函数确定,唯一需要抉择的就是分数选择函数 ξ xi ξ,也就是结合自己估值选择分数。 不完全信息设定下的竞赛均衡,有着更加优良的性质。Efficiency Allocation,是指奖品分配给估值更高的参赛者,或者称为Robust。完全信息设定与不完全信息设定有一定的相似性,完全信息设定由于彼此已知估值,需要随机化分数选择函数来获利,而不完全信息设定,彼此估值未知已经体现了随机化的思想,分数选择函数就不需要随机化了。
The two-player case 考虑附加噪声的二参赛者一价全支付竞赛。两位参赛者选择的分数分别为 x 1 , x 2 x_1,x_2 x1,x2,噪声体现在所选择的分数无法确定性转换成胜利权重,也就是说转换关系存在随机化参数。一种简单的建模方式是,参赛者的胜利权重设定为 x i + ϵ i x_i+epsilon_i xi+ϵi,比较 x 1 + ϵ 1 , x 2 + ϵ 2 x_1+epsilon_1,x_2+epsilon_2 x1+ϵ1,x2+ϵ2之间的关系决定胜负,令 ϵ = ϵ 2 − ϵ 1 epsilon=epsilon_2-epsilon_1 ϵ=ϵ2−ϵ1,那么胜利关系就变成比较 x 1 − x 2 , ϵ x_1-x_2,epsilon x1−x2,ϵ。参数 ϵ ∈ [ − e , e ] epsilonin[-e,e] ϵ∈[−e,e],服从分布 G G G。 p 1 ( x 1 , x 2 ) = { 1 if x 1 − x 2 > ϵ 1 / 2 if x 1 − x 2 = ϵ 0 if x 1 − x 2 < ϵ p_1(x_1,x_2)= begin{cases} 1& text{if $x_1 - x_2>epsilon$}\ 1/2& text{if $x_1 - x_2=epsilon$}\ 0 & text{if $ x_1-x_2<epsilon$} end{cases}\ p1(x1,x2)=⎩⎪⎨⎪⎧11/20if x1−x2>ϵif x1−x2=ϵif x1−x2<ϵ 设定胜利和失败收益分别为 v i ( b W ) , v i ( b L ) v_i(b_W),v_i(b_L) vi(bW),vi(bL)。那么参赛者的效用函数表示如下。 p i ( x 1 , x 2 ) v i ( b w ) + ( 1 − p i ( x 1 , x 2 ) ) v i ( b L ) − C ( x i ) p_i(x_1,x_2)v_i(b_w)+(1-p_i(x_1,x_2))v_i(b_L)-C(x_i) pi(x1,x2)vi(bw)+(1−pi(x1,x2))vi(bL)−C(xi)
The standard Tullock contest p i ( x 1 , . . . , x n ) = { x i r ∑ j = 1 n x j r if max { x 1 , . . . , x n } > 0 1 / n otherwise p_i(x_1,...,x_n)= begin{cases} frac{x_i^r}{sum_{j=1}^nx_j^r}& text{if max${x_1,...,x_n}>0$}\ 1/n& text{otherwise}\ end{cases}\ pi(x1,...,xn)={∑j=1nxjrxir1/nif max{x1,...,xn}>0otherwise 观察Tullock竞赛通用的竞赛成功函数(获奖概率函数),参数 r r r决定了该竞赛的很多性质,当 r r r很大时,代表参赛者增加努力带来的边际贡献更大,简单来说就是,努力(efforts)增加一点点,经过一个乘方的关系都会获得更大的比例收获。当 r = 1 r=1 r=1时,该竞赛被称为lottery contest,这也是Tullock竞赛中最常见的一种,因其分析计算的简便性。
Existence,Uniqueness and Comparative Statics 本章节介绍Tullock竞赛的均衡存在性、唯一性以及比较静态分析。在Tullock竞赛的均衡中,并不总是将奖项分配给估值最大的参赛者,但是会将获胜概率向估值更大的参赛者有所偏移。
Many participants 中文释义是多参赛者。分对称竞赛与非对称竞赛两种情况分别研究。参赛者的努力总和与参数 r r r、奖项总和存在着一定的关系。
Why is this contest so popular? 从公理推理的角度分析:当Tullock竞赛的参数 r = 1 r=1 r=1时,获胜概率关于efforts是线性的,也就是说 p ( x k , X ) = k p ( x k / k , X ) p(x_k,X)=kp(x_k/k,X) p(xk,X)=kp(xk/k,X)。这条性质只有针对该竞赛成功函数成立,这条独特的优良性质也使得该竞赛成功函数广泛应用。
Information aspects 一般性质的Tullock竞赛,设定每位参赛者都了解彼此之间所有的信息,也就是说默认信息是完全且完美的。但是实际情况中,不完全或者不完美信息的情况也会出现,我们也都需要去建模研究。除此之外,信息的不对称性也需要考虑,比如说某位参赛者有一些特定优势。
3.3.4 Experimental evidence and evolutionary game theory
接下来是演化博弈论的角度思考竞赛。某个多阶段竞赛共有 n n n位参赛者,每阶段共同竞争正则化后数值为1的奖励,获奖的比例等于其分数选择的比例,那么参赛者在某个阶段的效用函数为 π i = x i / ∑ j = 1 n x j − x i pi_i=x_i/sum_{j=1}^nx_j-x_i πi=xi/∑j=1nxj−xi。参赛者无法自由选择分数,而是根据参赛者的类型决定分数,并且类型随着阶段的进行而演化,收益更大的类型有更大概率在下一阶段保留。
本节我们考虑内在因素产生的决策时机。假设有两位参赛者,估值为 v 1 > v 2 v_1>v_2 v1>v2,两位参赛者首先选择先决策(e)还是后决策(l),然后相应时机在做出分数选择。后决策的参赛者需要根据先决策参赛者的决策做出响应,响应函数如下。 x 1 , m a x = x 1 ( v 1 / 4 ) = v 1 / 4 , x 2 , m a x = x 2 ( v 2 / 4 ) = v 2 / 4 x_{1,max}=x_1(v_1/4)=v_1/4,x_{2,max}=x_2(v_2/4)=v_2/4 x1,max=x1(v1/4)=v1/4,x2,max=x2(v2/4)=v2/4。 x 1 ( x 2 ) = x 2 v 1 − x 2 x 2 ( x 1 ) = x 1 v 2 − x 1 x_1(x_2)=sqrt{x_2v_1}-x_2\ x_2(x_1)=sqrt{x_1v_2}-x_1\ x1(x2)=x2v1 −x2x2(x1)=x1v2 −x1
下图就是两位参赛者的响应函数图,两条响应曲线相交于 N N N点。图中 S 1 S_1 S1点处的弧线代表了参赛者2的效用等值线,图中并未画出所有效用等值线。如果两位参赛者都选择先决策或后决策,也就是 ( e , e ) (e,e) (e,e)或 ( l , l ) (l,l) (l,l),转变成同时博弈,均衡点就是 N N N点。当时机组合为 ( e , l ) (e,l) (e,l)时,参赛者1先决策,均衡会落于 S 1 S_1 S1点;当时机组合为 ( l , e ) (l,e) (l,e)时,参赛者2先决策,均衡会落于 S 2 S_2 S2点。
考虑一种情况,奖项价值随着参赛者努力的提升而增加,比如说在市场份额的竞争中,某家企业付出更大投入宣传营销,既扩大了自己的市场份额(带来负外部性),也扩大了整体市场的规模(带来正外部性)。效用函数如下。 π i ( x 1 , . . . , x n ) = x i r ∑ j = 1 n x j r v i ( ∑ j = 1 n x j ) − x i pi_i(x_1,...,x_n)=frac{x_i^r}{sum_{j=1}^nx_j^r}v_i(sum_{j=1}^nx_j)-x_i πi(x1,...,xn)=∑j=1nxjrxirvi(j=1∑nxj)−xi
考虑一种情况:两个国家合作且竞争,每个国家都可以选择生产日用品,也可以选择生产武器提高军事实力,所生产的日用品放在一起根据军事实力来分配。每个国家都需要在合作与竞争之间做出权衡。第一个国家的效用函数为。 π 1 ( y 1 , y 2 ) = ( 1 2 + x 1 − x 2 2 ) ( y 1 + y 2 ) pi_1(y_1,y_2)=(frac{1}{2}+frac{x_1-x_2}{2})(y_1+y_2) π1(y1,y2)=(21+2x1−x2)(y1+y2)
3.6 Delegation
本章节介绍策略委派的相关内容,参赛者寻找代理者,签订委派合同,让代理者代替自己进行决策。两位参赛者估值为 v 1 , v 2 v_1,v_2 v1,v2,参赛者将实际出价权委托给代理者 A 1 , A 2 A_1,A_2 A1,A2,参赛者代理者之间签订合同 ( ϕ 1 , b i ) (phi_1,b_i) (ϕ1,bi)。代理者的代价函数是 C i ( x i ) = x i C_i(x_i)=x_i Ci(xi)=xi。如果代理者 A i A_i Ai赢得奖项,会将奖项递交给对应参赛者,并收获预先规定的报酬 b i b_i bi,这个数值就是代理者对于奖项的估值,也被称作委派估值。在竞拍之前,代理者需要向参赛者提交 ϕ i phi_i ϕi,被称作预付定金。