腐败问题一直是很多国家关注和研究的对象,同其他国家一样,中国在预防腐败和惩罚腐败上也一直很尽职尽责,甚至还颁布了诸如死刑等严厉的刑罚,但是仍然没有让腐败现象得到很好的控制。这让我们不得不重新思考到底建立什么样的机制才能更好地减少甚至杜绝腐败现象。本文从一个全新的思路出发,使用演化博弈的方法建立一个腐败–查处–第三方干预机制–舆论监督的四方演化博弈模型,通过对博弈模型的分析,为腐败的预防与惩罚机制的完善提供有价值的参考。 Corruption has always been the object of attention and research in many countries. Like other countries, China has been doing its part in preventing and punishing corruption. Severe penalties, such as the death penalty, have even been promulgated, but there’s still no effective control of corruption, so we have to rethink what kind of mechanism we can put in place to better reduce or even eliminate corruption. This paper starts from a new way of thinking; a four-party evolutionary game model, including corruption, investigation and punishment, third party intervention mecha-nism and public opinion supervision, is established by using evolutionary games. By analyzing the game model, this paper provides a valuable reference for the improvement of the mechanism of prevention and punishment of corruption.
陈雪莉,侯吉成
北京信息科技大学,北京
收稿日期:2018年10月23日;录用日期:2018年11月13日;发布日期:2018年11月20日
腐败问题一直是很多国家关注和研究的对象,同其他国家一样,中国在预防腐败和惩罚腐败上也一直很尽职尽责,甚至还颁布了诸如死刑等严厉的刑罚,但是仍然没有让腐败现象得到很好的控制。这让我们不得不重新思考到底建立什么样的机制才能更好地减少甚至杜绝腐败现象。本文从一个全新的思路出发,使用演化博弈的方法建立一个腐败–查处–第三方干预机制–舆论监督的四方演化博弈模型,通过对博弈模型的分析,为腐败的预防与惩罚机制的完善提供有价值的参考。
关键词 :腐败,演化博弈,复制动态
Copyright © 2018 by authors and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
腐败问题一直是社会科学研究的热点之一,它通常被定义为“利用职务便利谋取私利” [
在本文中我们规定博弈方分别为下级官员、上级官员,第三方干预(比上下级官员权利更大的国家监察机关)和新媒体普通民众等舆论监督。为了便于分析,本文暂不考虑腐败现象中的行贿者。采用的方法:1) 分析下级官员腐败的原因和影响各博弈方策略选择的要素;2) 构建博弈得益矩阵;3) 根据得益矩阵分别求出复制动态;4) 对博弈复制动态方程进行稳定性分析;5) 提出防治腐败的对策和建议。
自我国进入新时代以来,腐败行为不再单单依赖于国家官员和监察机关等公务部门调查处理,有许多的腐败受贿案件也是通过网络媒体和普通民众的举报传播引起相关机构的重视进而进行调查从而得以查处。
假设1:博弈方为有差别(各博弈方)的有限理性群体:参与者1是下级官员,参与者2是上级官员,参与者3是监察机关参与者4是舆论监督,他们的策略集合分别为{不腐败,腐败},{查处,不查处},{监察,不监察},{举报,不举报}。
假设2: C 3 ≫ A 2 , C r > A 2 (具体根据腐败金额而定),其中各个参数值符号及其对应含义如表1所示。
假设3:监察机关监察上、下级官员所需成本以及上级官员成功查处腐败后所获额外收益均从下级官员腐败所获额外收益和腐败罚金中补偿,除此之外若腐败金额还有剩余则收归监察机关。
假设4:博弈模型中,若上级官员选择查处腐败策略,则舆论监督的影响可忽略不计。
参数符号 | 含义 |
---|---|
A 1 | 上级官员的基本收益 |
A 2 | 下级官员的基本收益 |
A 3 | 第三方监察官员基本收益 |
C 1 | 上级官员查处腐败成本 |
C 2 | 上级官员成功查处腐败所获额外收益 |
C 3 | 下级官员腐败所获非法额外收益 |
C r | 下级官员腐败被查处后惩处罚金 |
C 4 | 第三方干预监察成本 |
G | 监察机关对上级官员不查处腐败现象处以罚金 |
Q | 下级官员腐败行为给第三方机关带来的恶劣影响 |
C 5 | 舆论监督举报成本 |
π | 舆论监督举报腐败现象所获收益 |
S | 腐败行为给民众等第四方带来的损害 (官员贪污受贿腐败所得物质金钱大多还是来自普通民众,腐败现象对民众构成极大损害) |
R | 国家对第三方监察机关监察不力的惩罚 |
表1. 各参数符号及其含义
因每位参与主体均有两个策略组合,所以理论上可形成 2 4 = 16 种博弈策略组合,具体见表2。
策略组合收益 |
---|
(不腐败,查处,监察,举报) ( A 2 , A 1 − C 1 , A 3 − C 4 , 0 ) |
(不腐败,不查处,监察,举报) ( A 2 , A 1 , A 3 − C 4 , 0 ) |
(不腐败,查处,不监察,举报) ( A 2 , A 1 − C 1 , A 3 , 0 ) |
(不腐败,不查处,不监察,举报) ( A 2 , A 1 , A 3 , 0 ) |
(不腐败,查处,监察,不举报) ( A 2 , A 1 − C 1 , A 3 − C 4 , 0 ) |
(不腐败,不查处,监察,不举报) ( A 2 , A 1 , A 3 − C 4 , 0 ) |
(不腐败,查处,不监察,不举报) ( A 2 , A 1 − C 1 , A 3 , 0 ) |
(不腐败,不查处,不监察,不举报) ( A 2 , A 1 , A 3 , 0 ) |
(腐败,查处,监察,举报) ( A 2 + C 3 − C r , A 1 + C 2 − C 1 , A 3 + C r + C 3 − C 4 − Q − C 2 , − C 5 + π − S ) |
(腐败,不查处,监察,举报) ( A 2 + C 3 − C r , A 1 − G , A 3 + C r + C 3 − C 4 − Q , − C 5 + π − S ) |
(腐败,查处,不监察,举报) ( A 2 + C 3 − C r , A 1 + C 2 − C 1 , A 3 − Q − R , − C 5 + π − S ) |
(腐败,不查处,不监察,举报) ( A 2 + C 3 − C r , A 1 − G , A 3 − Q − R , − C 5 + π − S ) |
(腐败,查处,监察,不举报) ( A 2 + C 3 − C r , A 1 + C 2 − C 1 , A 3 + C r + C 3 − C 4 − Q − C 2 , − S ) |
(腐败,不查处,监察,不举报) ( A 2 + C 3 − C r , A 1 − G , A 3 + C r + C 3 − C 4 − Q , − S ) |
(腐败,查处,不监察,不举报) ( A 2 + C 3 − C r , A 1 + C 2 − C 1 , A 3 − Q − R , − S ) |
(腐败,不查处,不监察,不举报) ( A 2 + C 3 , A 1 , A 3 − Q , − S ) |
表2. 腐败问题非对称演化博弈收益矩阵
假设博弈初始阶段,在下级官员群体中,采取{不腐败}策略的下级官员所占群体比例为x,则采取{腐败}策略的比例为 1 − x ;在上级官员群体中,采取{查处}策略的上级领导所占群体比例为y,则采取{不查处}策略的比例为 1 − y ;在第三方监察官员群体中,采取{监察}策略的群体所占群体比例为z,则采取{不监察}策略的比例为 1 − z ;在第四方舆论监督群体中,采取{举报}策略所占群体比例为 α ,采取{不举报}策略所占群体比例为 1 − α ,其中 x , y , z , α ∈ [ 0 , 1 ] [
现假设在两个博弈群体中,所有博弈方群体成员均采用纯策略,即在策略集合中选取唯一确定的策略。令M是某一博弈群体中所有纯策略组合的集合,定义 N t ( x i ) 博弈群体中所有在 时刻采用纯策略 x i ∈ M 的成员集合,变量 n t ( x i ) 为在t阶段采用纯策略 x i 的成员群体比例,则可得:
n t ( x i ) = N t ( x i ) / ∑ x j ∈ M N t ( x j ) (1)
在t阶段采用纯策略 x i 的期望收益为:
u t ( x i ) = ∑ x j ∈ M n t ( x i ) u t ( x i , x j ) (2)
其中 u t ( x i , x j ) 表示采用纯策略 x i 的博弈方在另一类博弈方成员采用纯策略 x j 时的期望收益,可知群体的平均期望收益为:
u t ¯ = ∑ x i ∈ M n t ( x i ) ⋅ u t ( x i ) (3)
在博弈中有限理性的博弈方会根据直觉和判断力发现不同策略的得益差异,得益较差类型的博弈方或迟或早都会发现改变策略对自己更有利,进而开始模仿其他类型的博弈方,所以博弈中几种类型博弈方的比例是随时间变化的,是时间t的函数,而比例动态变化的速度往往取决于博弈方学习模仿的速度。通常情况下,博弈方学习模仿的速度取决于两个因素,一是模仿对象的数量大小;二是模仿对象的成功程度(可用模仿对象策略得益表示)。从而提出下面这样的连续时间复制动态模型
N ′ t ( x i ) = k ⋅ N t ( x i ) ⋅ u t ( x i ) ,( k > 0 )为常数 (4)
对(1)求导可得:
d n t ( x i ) / d t = N ′ t ( x i ) ∑ x j ∈ M N t ( x j ) − N t ( x i ) ∑ x j ∈ M N ′ t ( x j ) / [ ∑ x j ∈ M N t ( x j ) ] 2 (5)
将(1),(4)代入(5)化简可得:
d n t ( x i ) / d t = k ⋅ n t ( x i ) [ u t ( x i ) − u t ¯ ] (6)
下面分别计算本文四方博弈群体的复制动态方程并进行分析。
下级官员选择“不腐败”和“腐败”策略的期望收益分别用 u 11 , u 12 表示:
化简得:
{ u 11 = A 2 u 12 = A 2 + C 3 + ( 1 − α ) C r ( y z − y − z ) − α C (8)
下级官员的平均期望得益为:
u 1 ¯ = x ⋅ u 11 + ( 1 − x ) u 12 (9)
将(8)代入(9)中可得:
u 1 ¯ = A 2 + ( 1 − x ) [ ( 1 − α ) C r ( y z − y − z ) + C 3 − α C r ] (10)
由此得到下级官员的复制动态方程为;
F = d x / d t = k x ( u 11 − u 1 ¯ ) = k x ( 1 − x ) { C r [ α − ( 1 − α ) ( y z − y − z ) ] − C 3 } (11)
方程(11)的含义是,选择“不腐败”策略的下级官员的比例随时间的变化率 d x / d t 与x成正比,与选择“不腐败”时下级官员期望收益大于平均收益的幅度 u 11 − u 1 ¯ 也成正比 [
上级官员的‘查处’和‘不查处’策略的期望收益分别用 u 21 , u 22 表示:
{ u 21 = ( A 1 − C 1 ) { x [ z α + ( 1 − z ) α + z ( 1 − α ) + ( 1 − z ) ( 1 − α ) ] } + ( A 1 − C 1 + C 2 ) { ( 1 − x ) [ α + ( 1 − z ) α + z ( 1 − α ) + ( 1 − z ) ( 1 − α ) ] } u 22 = A 1 { x [ z α + ( 1 − z ) α + z ( 1 − α ) + ( 1 − z ) ( 1 − α ) ] + ( 1 − z ) ( 1 − α ) ( 1 − x ) } + ( A 1 − G ) { ( 1 − x ) [ z α + ( 1 − z ) α + z ( 1 − α ) ] } (12)
化简得:
{ u 21 = A 1 − C 1 + C 2 ( 1 − x ) u 22 = A 1 − ( 1 − x ) G ( α + z − z α ) (13)
上级官员的平均期望得益为:
u 2 ¯ = y ⋅ u 21 + ( 1 − y ) ⋅ u 22 (14)
将(13)代入(14)中得:
u 2 ¯ = A 1 + ( 1 − x ) ( y − 1 ) G ( α + z − z α ) − y [ C 1 − C 2 ( 1 − x ) ] (15)
所以上级官员的复制动态方程为:
G = d y / d t = k y ( u 21 − u 2 ¯ ) = k y ( 1 − y ) { ( 1 − x ) [ G ( α + z − z α ) + C 2 ] − C 1 } (16)
方程(16)的含义是选择“查处”策略的上级关于的比例随时间的变化率 d y / d t 与y成正比,也与选择“查处”时期望收益大于平均收益的幅度 u 21 − u 2 ¯ 成正比。
第三方干预“监察”和“不监察”策略的期望收益分别用 u 31 , u 32 表示:
{ u 31 = ( A 3 − C 4 ) [ x y α + x ( 1 − y ) α + x y ( 1 − α ) + x ( 1 − y ) ( 1 − α ) ] + ( A 3 + C 3 + C r − C 2 − C 4 − Q ) [ ( 1 − x ) y α + ( 1 − x ) y ( 1 − α ) ] + [ ( 1 − x ) ( 1 − y ) α + ( 1 − x ) ( 1 − y ) ( 1 − α ) ] ( A 3 + C 3 + C r − C 4 − Q ) u 32 = [ x y α + x ( 1 − y ) α + x y ( 1 − α ) + x ( 1 − y ) ( 1 − α ) ] ⋅ A 3 + ( A 3 − Q − R ) [ ( 1 − x ) y α + ( 1 − x ) y ( 1 − α ) + ( 1 − x ) ( 1 − y ) α ] + ( 1 − x ) ( 1 − y ) ( 1 − α ) ( A 3 − Q ) (17)
化简得:
{ u 31 = ( 1 − x ) ( C 3 + C r − Q − y C 2 ) + A 3 − C 4 u 32 = A 3 − ( 1 − x ) [ Q + R ( α + y − y α ) ] (18)
第三方干预的平均期望得益为:
u 3 ¯ = z u 31 + ( 1 − z ) u 32 (19)
将(18)代入(19)中得:
u 3 ¯ = ( 1 − x ) [ z ( C 3 + C r − y C 2 ) − ( 1 − z ) R ( α + y − y α ) − Q ] + A 3 − z C 4 (20)
所以第三方干预的复制动态方程为:
H = d z / d t = k z ( u 31 − u 3 ¯ ) = k z ( 1 − z ) { ( 1 − x ) [ C 3 + C r + R ( α − y α ) + ( R − C 2 ) y ] − C 4 } (21)
方程(21)的含义是选择“监察”策略的第三方干预的比例随时间的变化率 d z / d t 与z成正比,也与选择“监察”时期望收益大于平均收益的幅度 u 31 − u 3 ¯ 成正比。
舆论监督“举报”和“不举报”的期望收益分别用 u 41 , u 42 表示:
{ u 41 = ( − C 5 + π − S ) [ ( 1 − x ) y z + ( 1 − x ) ( 1 − y ) z + ( 1 − x ) y ( 1 − z ) + ( 1 − x ) ( 1 − y ) ( 1 − z ) ] u 42 = ( − S ) [ ( 1 − x ) y z + ( 1 − x ) ( 1 − y ) z + ( 1 − x ) y ( 1 − z ) + ( 1 − x ) ( 1 − y ) ( 1 − z ) ] (22)
化简得:
{ u 41 = ( 1 − x ) ( − C 5 + π − S ) u 42 = ( 1 − x ) ( − S ) (23)
舆论监督的平均期望得益为:
u 4 ¯ = α u 41 + ( 1 − α ) u 42 (24)
将(23)代入(24)中得:
u 4 ¯ = ( 1 − x ) [ α ( π − C 5 ) − S ] (25)
所以第四方舆论监督的复制动态方程为:
K = d α / d t = k α ( u 41 − u 4 ¯ ) = k α ( 1 − α ) ( 1 − x ) ( π − C 5 ) (26)
方程(26)的含义是选择“举报”策略的第四方舆论监督的比例随时间的变化率 d α / d t 与 α 成正比,也与选择“举报”时期望收益大于平均收益的幅度 u 41 − u 4 ¯ 成正比。
复制动态的稳定状态,即在复制动态过程中采用两种策略博弈方比例不变的水平。在这种均衡状态下,任何一个参与者偏离均衡都将是无利可图的,所以参与博弈者都不会想单独改变策略。在数学上,相当于当干扰使x出现低于 x * 时, F = d x / d t 必须大于0,当干扰使x出现高于 x * 时, F = d x / d t 必须小于0,也就是说在这些稳定状态处 F ( x ) 的导数 F ′ ( x * ) 必须小于0,即 d F / d x < 0 ,这便是微分方程的“稳定性定理” [
由(11)计算可知:若 α = C 3 + C r ( y z − y − z ) / C r ( 1 − y ) ( 1 − z ) ,有 F ( x ) ≡ 0 ,即此时所有x都为稳定状态;若 α C 3 + C r ( y z − y − z ) / C r ( 1 − y ) ( 1 − z ) ,令 F = 0 得 x = 0 , x = 1 为 x 的两个稳定状态 [
首先根据 d G / d y = 0 找出上级官员的稳定状态,由(16)计算可知,若
α > C 1 − ( C 2 + z G ) ( 1 − x ) / G ( 1 − x ) ( 1 − z ) 时, d G ( y ) / d y | y = 0 > 0 , d G ( y ) / d y | y = 1 < 0 ,此时 y = 1 为平衡点, y = 0 不是平衡点,上级官员的复制动态会趋向于 y * = 1 ,即博弈方都采用“查处”策略; α < C 1 − ( C 2 + z G ) ( 1 − x ) / G ( 1 − x ) ( 1 − z ) 时 d G ( y ) / d y | y = 0 < 0 , d G ( y ) / d y | y = 1 > 0 ,此时 y = 0 为平衡点, y = 1 不是平衡点,上级官员的复制动态会趋向于 y * = 0 ,即博弈方都采用“不查处”策略。
由(21)计算可知:若 α = C 4 − ( 1 − x ) [ ( R − C 2 ) y + C 3 + C r ] / ( 1 − x ) ( 1 − y ) R 时,有
若 α ≠ C 4 − ( 1 − x ) [ ( R − C 2 ) y + C 3 + C r ] / ( 1 − x ) ( 1 − y ) R ,令 H ( z ) = 0 得 z = 0 , z = 1 为z的两个稳定状态;由于 ( 1 − x ) ( 1 − y ) R > 0 , d H / d z = k ( 1 − 2 z ) { ( 1 − x ) [ C 3 + C r + R ( α − y α ) + ( R − C 2 ) y ] − C 4 } ,有以下两种情况: α > C 4 − ( 1 − x ) [ ( R − C 2 ) y + C 3 + C r ] / ( 1 − x ) ( 1 − y ) R 时,有 d H ( z ) / d z | z = 0 > 0 , d H ( z ) / d z | z = 1 < 0 ,此时 z = 1 为平衡点, z = 0 不是平衡点,监察官员的复制动态会趋向于 z * = 1 ,即博弈方都采用“监察”策略; α < C 4 − ( 1 − x ) [ ( R − C 2 ) y + C 3 + C r ] / ( 1 − x ) ( 1 − y ) R 时,有 d H ( z ) / d z | z = 0 < 0 , d H ( z ) / d z | z = 1 > 0 ,此时 z = 0 为平衡点, z = 1 不是平衡点,监察官员的复制动态会趋向于 z * = 0 ,即博弈方都采用“不监察”策略。
由(26)可知:若 π = C 5 时,有 K ( α ) ≡ 0 ,此时所有 α 都为稳定状态;若 x ≠ 1 , π ≠ C 5 ,令 K ( α ) = 0 得 α = 0 , α = 1 为 α 的两个稳定状态;由于
综合博弈中四个群体各自复制动态分析 [
D i | D i = 0 | D i > 0 | D i < 0 |
---|---|---|---|
主体 | ( i = 1 , 2 , 3 , 4 ) | 1为均衡解 | 0为均衡解 |
下级官员 i = 1 | x 取任意值 | α < θ 1 | α > θ 1 |
上级官员 i = 2 | y 取任意值 | α > θ 2 | α < θ 2 |
检察机关 i = 3 | z 取任意值 | α > θ 3 | α < θ 3 |
舆论监督 i = 4 | α 取任意值 | P > C 5 | P < C 5 |
表3. 四方博弈均衡解
表3中有:
D 1 = C r ( 1 − α ) ( y z − y − z ) + C 3 − α C r
D 2 = ( 1 − x ) [ G ( α + z − z α ) + C 2 ] − C 1
D 3 = ( 1 − x ) [ C 3 + C r + R ( α − y α ) + ( R − C 2 ) y ] − C 4
D 4 = ( 1 − x ) ( P − C 5 )
θ 2 = C 1 − ( 1 − x ) ( C 2 + G z ) / ( 1 − x ) ( 1 − z ) G
θ 3 = C 4 − ( 1 − x ) [ ( R − C 2 ) y + C 3 + C r ] / ( 1 − x ) ( 1 − y ) R
分析可知,当下级官员腐败受贿金额 C 3 增加时,对其腐败的罚金 C r 也应同样增加,如此才能有效减少下级官员选择“腐败”策略,使其逐渐趋向于选择“不腐败”策略,而具体该以怎样的比例增加,需要根据不同地区的经济政策和发展情况制定实施。对于上级官员来说查处腐败所需成本 C 1 的大小直接影响其策略选择,如果个别腐败现象查处成本 C 1 较大,现实生活中上级官员便有极大可能不采取任何调查举措,这便会导致腐败行为者更加猖狂。随着上级官员选择“不查处”策略群体比例的增加,监察机关增大对其不作为的经济处罚 G ,同时如果能增加其成功查处腐败后所获经济奖赏或者政治褒奖 C 2 都能有效促使更多的上级官员趋向于选择“查处”策略,所以赏罚结合才能更有效的督促官员们更多地为人民服务,更多的履行自己的职责,减少腐败现象。
对第三方监察机关来说,国家增加其监察不力的惩罚 R ,才会使其更加尽职尽责,更好的监察上、下级官员,减少社会上腐败案件和包庇腐败现象的循环发生。第四方舆论监督泛指如今网络新媒体报道以及民众匿名举报等一系列普通民众监督,分析可知只有当举报腐败后所获收益 P 大于自身举报所需成本 C 5 时,民众们才会更多地趋向于选择“举报”策略,这也是有限理性下大部分普通人的正常心理。因此有关负责部门面对普通民众的匿名举报时应更加重视,如果举报有实,应给与物质精神或者经济方面的丰富奖励,从而鼓励其更多地监督身边各种贪污腐败行为,进而形成社会上良好的政治风气。同样网络新媒体等途径举报受贿腐败也是现如今很有影响力的一个举措,毕竟现在是一个网络发达的时代,通过网络民众能更好地关注到一些平常接触不到的事情,对新媒体报道来说成功举报腐败行贿现象会使其阅读量、点击量和关注度都能得到很大的提高,这对他们来说也是获取经济效益的一个有效途径。所以监察机关或者其他政府部门面对民众举报时,应正确看待调查,不能全然采取不重视或者不闻不问的态度。
腐败问题一直是国家和人民共同关心的问题,本文构建四方博弈分析如何能有效减少腐败现象,针对不同博弈方群体分别给出了一些意见建议,而在现实生活中更要从思想道德建设方面入手,加强对基层官员和领导的自身素质教育,加强普通民众对腐败现象危害性的认知,让全民参与监督腐败,建立更完善更严苛的奖罚体制,对清廉洁身自好的官员予以奖励和荣誉,对不为人民服务选择腐败的官员给予严厉的惩罚,从多方面着手以期实现零腐败目标,具体给出几个建议:
1) 提高上级领导查处腐败现象后所得收益 C 2 ,这里多指经济效益,如此上级领导会更乐于对腐败现象进行查处,理性的下级官员更不会冒着更高的被查处风险选择腐败,这也侧面说明了“高薪养廉” [
2) 加重对下级官员腐败行为的经济处罚 C r [
3) 提高对上级官员不查处腐败的经济惩处 G ,现实中存在不少官官相护、上级官员包庇下级官员腐败甚至伙同参与腐败等一系列不正风气,所以需完善监察政策 [
本篇论文是在我的导师侯吉成教授精心指导和悉心关怀下完成的。在文章写作过程中,侯老师对我的极大支持和鼓励,对文章出了很多宝贵的意见与建议,给了我最大的帮助。在此向侯吉成老师致以崇高的敬意和衷心的感谢!
陈雪莉,侯吉成. 腐败现象形成机理与奖惩机制研究Study on the Formation Mechanism of Corruption and the Mechanism of Reward and Punishment[J]. 应用数学进展, 2018, 07(11): 1393-1401. https://doi.org/10.12677/AAM.2018.711162
https://doi.org/10.1007/BF02409751