1. 引言
随着“新发展理念”与“总体国家安全观”的提出,“发展”和“安全”成为社会发展的头等大事,统筹二者关系成为重要的时代课题。当前,我国供给侧持续产出,处于生产安全事故高发期,安全生产形势严峻。仅2023年,全国就有21,242人因各类生产安全事故死亡。这些事故不仅造成了巨大的损失,引发了社会关注,还使政府面临舆论压力。天津滨海新区“8·12”爆炸、湖南株洲“5·7”中毒窒息、江苏响水“3·21”爆炸等一系列特重大事故,表明安全生产仍处于脆弱、爬坡、过坎阶段,事故易发多发阶段[1]。因此,应急管理领域专家学者提出了“完善国家应急管理体系,建立大安全大应急框架,坚持安全第一、预防为主等要求”[2]。我国政府不断从事故中学习,开展顶层设计,以减少和应对事故,展现出较强的适应与学习能力。生产安全事故治理是长期过程,每项制度与管理改进都离不开对事故经验教训的总结。能否有效从事故中学习并提炼经验,是实现事前防范的关键。
现有研究表明,危机学习能吸取教训、弥补监管漏洞,完善生产安全政策制度。生产安全事故发生后,地方政府虽会开展危机学习,但这些举措效果存疑,其能否降低未来事故风险和死亡人数尚待验证。
为解答这一问题,本文采用准实验方法,以2015年12月广东深圳光明新区渣土受纳场“12·20”特别重大滑坡事故为案例,基于省级面板数据,运用合成差分法对危机学习效果进行实证评估,旨在推动危机学习理论发展。
2. 文献回顾与问题提出
2.1. 生产安全事故致因
随着20世纪全球工业化进程的迅猛推进,工业领域取得了前所未有的大踏步发展,但与此同时,生产安全事故的发生频率也显著增加,对社会经济稳定与人员安全构成了严峻挑战。因此,深入探索事故致因,以期有效预防和控制各类生产安全事故,成为了众多学者、专家以及政策制定者首要关注和亟待解决的关键问题。当前,学术界在事故致因分析领域已建立了多种理论模型,这些模型大多围绕人的特性、机器设备性能,以及两者之间是否匹配和协调的核心观点展开。这些模型旨在揭示事故发生的深层次原因,为制定针对性的预防措施提供科学依据。其中,海因里希因果连锁理论[3]强调了事故不是单一事件的结果,而是一系列相互关联的事件链的终端;Benner的“扰动”模型[4]则侧重于识别导致系统失衡的外部或内部扰动因素;Leveson的系统论事故致因STAMP模型(Systems-Theoretic Accident Model and Processes) [5] [6]则运用系统理论,分析技术系统设计中的安全控制不足;里森的“瑞士奶酪模型”[7]形象地描绘了事故发生的多重防御层中的漏洞如何被同时穿透;Rasmussen提出的社会技术系统事故致因模型[8] [9]则综合考虑了技术因素与社会组织因素的相互作用;瑟利模型[10]则侧重于人在事故前的信息处理过程,分析认知失误如何导致不安全行为;而金矿人失误模型[11]则进一步深入探讨了人因失误背后的组织文化和系统缺陷。
2.2. 生产安全事故问责
生产安全事故的问责机制亦是学术研究的重点议题之一。具体而言,事故问责系指在事故灾难情境下,特定的问责主体依据法定程序,对相关政府及其公务员的违法失职行为进行行政责任与法律责任追究的过程[12]。问责制度的历史悠久,通过对新中国成立70年来责任追究模式的演变进行考察,不难发现这一历程映射出国家治理结构的深刻重塑,其背后折射出安全与发展两大主题之间复杂而微妙的辩证关系,正如梁玉柱所论述的。自党的十八大以来,事故问责机制展现出三大显著特征:行政处罚力度相对有限、党纪政纪处分不断强化、刑事司法追究持续推进[13]。尽管事故问责制度历经发展,但仍面临诸多挑战。杨占科的研究揭示了对领导干部进行问责时普遍存在的三种不利倾向,即“交代式问责”、“粗放式问责”与“简单化问责”,这些倾向削弱了问责机制的有效性[14]。高恩新观察到,在特大生产安全事故的情境中,问责制度呈现出一种显著的“分水岭”现象,即严厉的问责主要集中在行政组织的某一特定层级或群体之上,而此群体的上级与下级成员相比之下所承受的问责压力则相对较轻[15]。公共安全事故一旦发生,媒体与舆论往往迅速聚焦,形成强大的社会压力,迫使政府必须迅速采取有效措施,并对负有责任的相关人员进行处分。然而,这种迫于外界压力而进行的问责,往往带有简单性与交代式的色彩,其科学性与合理性有待深入考量[16]。在此背景下,“为问责而问责”的现象时有发生,这无疑是对问责机制初衷的偏离与扭曲[17]。
2.3. 生产安全事故危机学习
鉴于事故问责中出现的上述情况,众多学者纷纷认识到单从问责治理事故的局限性,因此,将目光转移到更加灵活和效果显著的危机学习上。危机学习来源并发展于组织学习,1978年,Argyris等首次提出“组织学习”的概念[18]。危机学习作为组织学习与危机管理理论交融的结晶,常指组织或个体经由灾难性事件提炼经验、汲取深刻教训的过程,旨在增强危机应对效能或预先规避潜在风险。这涵盖了追溯危机根源、深刻反省应对举措中的缺陷,并积极探索高效解决危机的策略与方法。组织学习侧重于日常的、常态化的知识积累与技能提升,相比之下,危机学习则聚焦于非常规情境下的应对活动,专门针对突发事件进行深刻反思与经验总结。Denis Smith和Dominic Elliott比较早地讨论了危机与学习的关联,认为危机学习至少包含三种形态,分别是为了危机而学习(Learning for Crisis)、作为危机的学习(Learning as Crisis)、从危机中学习(Learning from Crisis) [19]。作为应急管理一个独立阶段,危机学习一般发生在危机结束后,是一种危机后学习或“危机间学习”,既是“从危机中学习”[20],也是为了危机而学习。危机学习不是一种零碎活动的简单认知,应“融入应急管理过程的各个阶段中”[21],即“应急管理过程的危机学习”。
重大事故不仅会激发事发地的危机学习,产生“前车之覆,后车之鉴”的学习路径,还会将这种学习效应波及至邻近区域。在有限的定量研究中,唐雲与王英对危机学习溢出效应的探讨,指出“观他人之失”亦能“促自我之智”,而“吃己一堑”则更能“长己一智”[22]。姜雅婷、柴国荣着重考察政府承诺对于“目标考核–治理效果”的中介作用,发现目标考核能够显著改善治理效果,而政府对安全生产治理的注意力配置在其中起到了中介作用[23],并依据30个省的面板数据实证分析,得到目标考核显著降低了生产安全事故死亡人数和死亡率的结论[24]。
2.4. 问题的提出
当前关于危机学习的动因、过程机制、影响因素等方面的研究颇深,但是关于生产安全事故的危机学习效果的研究较少,大多集中在定性描述上。当生产安全事故发生后,地方政府会及时展开危机学习,但是这些做法和措施是浮于形式,还是切实有效?能否有效降低未来的事故风险概率,从而降低未来事故死亡人数?对比以上研究成果,危机学习的效果研究尚欠缺新的方法以实现更加精确的定量研究。
3. 研究设计
3.1. 案例简介
本文选取了广东“12·20”特别重大滑坡事故作为本文危机学习的研究案例。该事故发生后,广东省开展了一系列长时间,多类型的生产安全事故危机学习,取得了事故至今再未发生特别重大生产安全事故的工作成效。
3.1.1. 事故经过及损失
2015年12月20日,广东省深圳市光明新区红坳渣土受纳场发生滑坡,滑坡体推倒并掩埋了其途经的红坳村柳溪、德吉程工业园内33栋建筑物。事故共造成73人死亡,4人下落不明,3人重伤,14人轻伤。事故还造成33栋建筑物(厂房24栋,宿舍楼3栋,私宅6栋)被损毁、掩埋,导致90家企业生产受影响,涉及员工4630人。事故调查组依据《企业职工伤亡事故经济损失统计标准》(GB 6721-1986),核定事故造成直接经济损失88112.23万元。
3.1.2. 事故性质
2015年12月25日,国务院成立了广东深圳光明新区渣土受纳场“12·20”特别重大滑坡事故调查组。经调查组调查认定,广东深圳光明新区“12·20”滑坡不属于山体滑坡、自然地质灾害,是一起特别重大生产安全责任事故。
3.2. 危机学习过程分析
3.2.1. 数据收集与分析
为全面获取广东省各级政府在事故发生后开展的危机学习工作内容,笔者从广东省人民政府门户网站、广东省应急管理厅网站及各大新闻媒体官网等多个渠道收集相关文本数据。完成数据收集后,为保证数据的有效性和全面性,对收集到的政策文本进行初步浏览,了解各文本的基本信息。经搜索与筛选,最终确定52篇文本作为进一步研究的分析对象,其中省级文本34篇,市级文本18篇。将这些文本批量导入辅助软件Nvivo 12进行整理分析,剔除语义重复、交叉及模糊的语句,并对原始资料进行开放性编码,形成512条有效语句,其中412条用于建模,100条用于饱和度检验。对原始资料逐句或逐段编码,采用“编号”标注,如“编号:A-1-1”代表省级文本第一篇第一段用于编码的文本段,“编号:B-2-3”代表市级文本第二篇第三段用于编码的文本段。随后将“标签化”的资料进行概念化,当原始数据指代类似做法时,将“标签”归类为表达同类定义的“概念”,依此操作,最终将大量编码转化为数量更少的概念,实现资料的归类与整合,共提炼出71多个初始概念,其中58个出现次数较多且具有代表性。第二阶段,进一步理清相互独立的概念及其关系,对同类概念进行整理、比较和归类,用新词准确概括同组相似概念的实质,完成范畴化。依据主轴编码规则,对22个初始编码再次抽象,共得到7个主范畴。其中,典型案例学习、上级指示传达、同级经验交流等3个初始范畴归纳为外部知识输入;先进典型表彰、应急预案更新等2个初始范畴归纳为内部经验总结;树立正确理念、开展宣传教育等2个初始范畴归纳为安全意识提升;增投资金、增配人力、更新设备、提升技术等4个初始范畴归纳为安全资源投入;提及调查、挂牌督办、一岗双责、专项考核等4个初始范畴归纳为安全制度优化;事故相关行业检查、安全生产大检查、域外事故引发检查等3个初始范畴归纳为运动式治理;定期检查、“回头看”式检查、重点行业和时间检查等3个初始范畴归纳为常态化治理。
经过选择性编码的任务从主范畴中寻找到能起到“提纲挈领”作用的核心范畴,然后采用故事线的形式来简要刻画原始资料记载的现象或事件脉络,在此基础之上进而建立起实质性理论。
为了检验上述模型的理论饱和度,我们对做饱和度检验的100条文本,进行重新的标签化、概念化,检验过程中没有发现明显新颖的概念、范畴,核心范畴之间也没有产生新关系,理论模型仍能解释。这表明该理论模型具有良好的理论饱和度,不需要再进一步扩大资料分析的范围。
3.2.2. 危机学习过程刻画
广东“12·20”重大滑坡事故的危机学习过程涵盖知识获取、知识转移、知识同化三个环节。与其他危机学习研究不同,本研究未从思过惩戒型学习视角(以事故调查报告为危机学习主要部分)出发,而是基于经验扩散型学习视角,收集事故发生后长时间、多类型的危机学习文本资料,运用扎根理论展开研究,发现其危机学习过程由知识获取、知识转移、知识同化这三个紧密相连的环节构成,且思过惩戒型学习仅是核心范畴知识获取的组成部分之一。广东省政府后续较长时间的危机学习均围绕经验扩散型学习展开。综上,广东“12·20”重大滑坡事故的危机学习呈现出“知识获取–知识转移–知识同化”的学习过程。其概念模型如下图1所示。
经扎根分析广东“12·20”特别重大滑坡事故案例,得出知识获取、知识转移、知识同化三个核心范畴,现逐一分析。
知识获取方面,对危机学习文本编码与概念化,先得“外部知识获取”、“内部经验总结”,后提炼出“知识获取”。生产安全事故防范知识源于内部经验总结与外部知识输入。内部经验总结以中央事故调查组的报告为始,总结事故经验教训;外部知识输入指事故后广东省政府与同级交流及接收上级安全生产指示。可见,广东省政府此次事故危机学习的知识获取来源丰富,有效知识获取是知识转移与同化关键,其在应用环节落实情况影响学习效果。
知识转移方面,对文本编码概念化初得“运动式治理”、“常态化治理”,进而得出“知识转移”。它是危机学习重要落实环节,通过优化组织结构营造良好环境,包含“运动式治理”与“常态化治理”。运动式治理是危机发生后政府组织的短期高强度活动,如“12·20”事故中的救援、调查与安全检查,为常态化治理奠基并推动知识转化。常态化治理是日常建立长效机制,实现安全生产持续管理,广东地区将事故教训转化为动力,加强监管、完善制度、提升员工素养,促进安全文化发展与知识转化。
知识同化方面,对文本编码概念化初得“安全意识提升”、“安全资源投入”、“安全制度优化”,进而得出“知识同化”。它是危机学习成果固化的关键,将安全生产知识转化为相关方共识与行动规范。此过程包含三个主范畴:安全意识提升即相关人员对安全生产认识与重视提高,政府和企业通过培训提升安全文化;安全资源投入指危机学习后政府和企业增加资源保障安全;安全制度优化是在学习基础上完善现有制度,“12·20”事故后政府和企业修订制度,强化责任机制,提升安全管理效能。
综上,广东省政府“12·20”事故危机学习知识同化渠道多样,从意识、资源、制度构建生产安全事故防范体系,落实良好,显著提升安全生产治理水平。
Figure 1. Description of crisis learning process in Guangdong “12∙20” particularly significant production safety accident
图1. 广东“12·20”特别重大生产安全事故危机学习过程刻画
3.3. 模型构建
本文所使用的合成差分法(Synthetic Difference-in-Differences)是一种扩展的Difference-in-Differences (DID)方法,以下简称SDID,是由Arkhangelsky等人于2021年开发,用于处理面板数据中的政策评估问题。这种方法结合了合成控制法(Synthetic Control Method)和双重差分法(DID)的优点,旨在更准确地估计政策效应。具体技术细节如下:
考虑一个平衡面板:N个个体,T个时期,个体i在时期t的结果变量为
,二元处理变量为
。同时假定前
个个体不被处理。后
个个体在
会被处理,类似合成控制法(SC)。
首先寻找权重
,以使得处理组的事前趋势和控制组的事前趋势尽可能相似,即
,对于所有的
都成立。然后,寻找权重
,以平衡处理前的时间趋势和处理后的时间趋势[25]。最后,在二维固定效应模型下估计平均处理效应(
):
(1)
公式(1)中给定估计时间固定效应
,以及给定单位固定效应
估计的时不变单位特定因子,该过程灵活地允许共享的时间聚合因子。作为完全饱和固定效应模型的标准模型,一个
和一个
固定效应被归一化为零,以避免多共线性。单位固定效应的存在意味着SDID将只是寻求在预处理趋势上匹配处理和控制单位,而不一定是在预处理趋势和水平上,允许处理和控制单位之间的持续差异。
SDID中选择单位权重ω,旨在确保在处理组和对照组之间进行比较,后者在采用处理之前大致遵循平行的趋势。时间权重的选择,λ在SDID的情况下,可以从处理前期间和处理后期间获得更多的权重,在寻找每个控制单元的处理后平均和处理前加权平均之间的恒定差异。具体来说,如Arkhangelsky等人所述,单位特定的权重可以通过以下公式解决[26]:
(2)
(3)
其中,
指的是欧几里得范数,ζ是一个正则化参数。这导致了
非负权值向量加上截距
向量。所有i∈的权重
意味着在所有预处理期间,控制和处理趋势单位之间的绝对差异应该最小化,而
最初允许处理和控制之间随时间的恒定差异。总之,这些都意味着单位将遵循平行的前趋势,尽管提供了
,但不是完全相同的前趋势。
在有时间权值的情况下,遵循类似的步骤,寻找使目标函数最小化的权值:
(4)
(5)
其中,(5)中的最后一项是一个非常小的正则化项,以确保时间权值的唯一性,其中
。
与公式(1)相比,DID是通过下述不含任何时间和个体权重的二维固定效应模型来估计处理效应的:
(6)
因此,SDID估计量事实上使得二维固定效应更加集中,也就是说它将更多的权重放在与处理组个体更相似的个体身上,以及将更多的权重放在与处理期更相似的时期上。
与SDID不同,SC保持最优选择单位特定权重ω,但不寻求通过时间权重考虑最优权重,并省略单位固定效应
意味着合成控制和处理单位应该保持大效的预处理水平以及趋势。SC估计量事实上求解如下的优化问题:
(7)
可以看到,SC仅考虑了截面维度上的权重,忽略了时间维度上的权重。SDID通过加入时间权重可以将那些和处理器相差甚远的时期排除掉,以减小估计的偏误、提高估计的精度。
因此,综上所述,对比SC和DID方法,SDID具有一些明显的优势。首先,合成差分法结合了合成控制法和DID方法的优点,能够更全面地政策实施的影响。它不仅能像合成控制法那样通过多个控制对象的加权来模拟目标对象在政策实施前的情况,还能像DID方法那样关注政策实施前后的变化。其次,合成差分法在权重确定上更为客观和准确。合成差分法则通过数据驱动的方式确定权重,减少了主观选择的误差,使得结果更加可靠。此外,合成差分法通过综合考虑多个因素,能够在一定程度上减少政策内生性偏差,使得政策评估结果更加准确。
3.4. 实验设置
3.4.1. 变量设置
本章试图探究特别重大生产安全事故危机学习效果,因此,是否发生特别重大生产安全事故以及相应的危机学习过程,是本文的解释变量。如何衡量危机学习的效果,相关研究已有较多示范。本文参考现有研究[27] [28],以每亿元GDP生产安全事故死亡人数,衡量危机学习的效果,并作为本章研究的被解释变量。本文选取的控制变量如下表1所示。
Table 1. Variable Settings
表1. 变量设置
变量 |
指标 |
单位 |
数据来源 |
解释变量 |
是否发生特别重大生产安全事故以及相应的危机学习过程 |
无 |
《广东深圳光明新区渣土受纳场“12·20”特别重大滑坡事故调查报告》、广东省政府相关门户网站资料 |
被解释变量 |
每亿元GDP生产安全事故 死亡人数 |
人 |
2021~2023年中国统计年鉴,2011~2020年广东省 统计年鉴 |
控 制 变 量 |
经济发展 |
人均地区生产总值 |
元 |
国家统计局 |
经济结构 |
第二产业增加值占比 |
% |
国家统计局 |
就业结构 |
第二产业从业人数占比 |
% |
2021~2023年中国统计年鉴,2011~2020年各省级 行政单位统计年鉴 |
人口密度 |
城镇化率 |
% |
2011~2023年中国统计年鉴 |
人口素质 |
6岁及以上人口高中学历占比 |
% |
2011~2023年中国统计年鉴 |
医疗条件 |
每万人医疗机构床位数 |
张 |
国家统计局 |
人均地区生产总值:依据已有实证研究,经济发展对安全事故影响显著[28] [29]。本研究以人均地区生产总值衡量当地经济水平。经济发展初期,人均地区生产总值提升使生产规模扩大、活动增多,企业重增长而轻安全投入与管理,导致事故死亡人数上升。当人均地区生产总值达一定程度,社会对安全重视提升,企业资金技术投入增加,政府监管加强,事故死亡人数下降,呈倒“U”型关系。
第二产业增加值占比:生产安全事故多集中于第二产业,该产业含采矿业、制造业等高危行业。其增加值占比越高,地区经济对高危行业依赖越深,安全风险越大,事故发生概率和死亡人数相应增加。如采矿业有瓦斯爆炸、透水风险;制造业存在机械伤害、火灾爆炸隐患;建筑业易发生高处坠落、坍塌事故,所以该占比与事故死亡人数呈正相关。
第二产业从业人数占比:此占比高低决定暴露于高风险生产环境的人数。占比越高,面临事故风险人员越多,事故伤亡人数往往越多。从安全管理看,大规模从业人群增加企业管理难度与成本,若管理措施不到位,事故可能性和伤亡人数会进一步上升。
城镇化率:城镇化率体现人口向城镇集聚程度。城镇化率提高,城镇经济生产活动密集复杂,各类活动集中,增加事故发生概率。且城镇化进程中存在城市规划不合理、安全基础设施滞后、居民安全意识不一等问题,加剧事故风险。在人口密集城镇,一旦发生事故,易引发连锁反应,造成严重伤亡和损失。
6岁及以上人口高中学历占比:以该占比衡量人口素质,占比越高,地区人口素质相对越高。高学历群体学习和安全意识强,能快速掌握并遵守安全规程,注重自身安全。对企业而言,高学历员工有利于开展安全培训与管理,提升企业安全管理水平,降低事故可能性。同时,高学历人群能有效传播安全知识理念,营造安全文化氛围,降低地区事故死亡人数。
每万人医疗机构床位数:鉴于数据可获取性,本研究用每万人医疗机构床位数代表医疗卫生水平。该指标数值越高,医疗资源越丰富。事故发生后,丰富的医疗资源能及时救治伤者,提高救治成功率,降低死亡人数。充足的医疗资源还能为应急救援提供支持,提升社会应急响应能力,减少事故伤亡和损失。
3.4.2. 准自然实验分组
本文通过合成差分法研究特别重大生产安全事故的危机学习效果,作为准自然实验方法,合成差分法需要对实验组施加特定的干预行为,即:发生特别重大生产安全事故,并开展危机学习行为。通过前面的论述,广东“12·20”特别重大滑坡事故符合该项条件,并且,综合考虑上述变量数据的可得性,最终选取了广东省作为实验组,收集2010~2022年省级面板数据,研究事故发生后地方政府危机学习的真实效果。同其他的因果推断的方法一样,合成差分同样依赖于“反事实框架”(Counterfactual Framework),而构建“反事实框架”的基本思路如下:首先,通过把类似于实验组对象的对照组个体利用某种拟合方法进行拟合,构造出一个“虚拟的”实验对象,即没有发生干预的对象。然后,再将虚拟的实验对象和真实的实验对象进行比较,其差值就是所谓的干预行为或者干预政策产生的因果效应。反事实状态的构造建立在一个重要的基础之上:对照组对象不能受到作为解释变量的政策或者事件的影响。本文选取了广东“12·20”特别重大滑坡事故作为案例,基于2010~2022年省级面板数据,研究事故发生后地方政府危机学习的真实效果。因此,要排除在该时间段发生过特别重大生产安全事故的省份。根据《生产安全事故报告和调查处理条例》对于特别重大事故的认定标准,通过查阅应急管理部官网相关内容,获得2010~2022年期间发生过特别重大生产安全事故的省级行政单位(见表2)。
Table 2. Place of particularly significant production safety accidents in 2010~2022
表2. 2010~2022年特别重大生产安全事故发生地
时间 |
省级行政单位 |
时间 |
省级行政单位 |
2010 |
河南、辽宁、内蒙古、山西、河南/黑龙江 |
2017 |
陕西 |
2011 |
浙江、云南、河南 |
2018 |
无 |
2012 |
内蒙古、四川 |
2019 |
江苏 |
2013 |
山东、吉林 |
2020 |
无 |
2014 |
江苏、湖南/福建、西藏、山西 |
2021 |
无 |
2015 |
河南、陕西、广东、天津 |
2022 |
河南、湖南 |
2016 |
江西、湖南、重庆、内蒙古 |
|
|
通过人工检索网页、新闻、应急管理部以及各省应急管理厅官网实现,共筛选出12个在2010~2022年中没有发生过特别重大生产安全事故的省级行政单位(除港澳台地区),纳入到对照组中(见表3)。
Table 3. Experimental grouping
表3. 实验分组
实验组 |
对照组 |
广东 |
湖北、安徽、海南、广西、贵州、宁夏、北京、上海、河北、新疆、青海、甘肃 |
4. 实证结果分析
4.1. 拟合结果
Figure 2. Descriptive analysis of data
图2. 数据描述性分析
根据描述性分析(见图2),该数据集包含169个观测值,包含10个变量,涵盖了ID、年份、人均GDP、人均床位数、城市化率、增加值、就业、质量、死亡和是否经过处理等多个方面。变量类型包括长整型(long)、整型(int)和浮点型(float),这意味着数据集中包含了连续变量和分类变量。数据集按年份排序,有助于时间序列分析或观察随时间的趋势。
Figure 3. SDID fitting
图3. SDID拟合情况
通过观察SDID相关拟合情况(见图3),可以得出以下结论:ATT (平均处理效应)的估计值为−2.08e+03 (即−2080),这意味着实验组相对于对照组在“death”这一结果变量上平均减少了2080个单位。这是一个相对较大的效应,表明处理对结果产生了显著的影响。标准误(Std. Err.)为591.73930,这表明ATT估计值具有一定的精确度,但也不是特别小。实际分析中,标准误的大小与样本量、变量间的变异性和模型设定等因素有关。t统计量的值为−3.52,绝对值大于2 (通常认为t值绝对值大于2时效应显著),这也支持了ATT估计值的显著性。p值(P > |t|)为0.000,远小于通常的显著性水平(如0.05),因此可以非常确信这个ATT估计值是显著的,即实验组和对照组之间的差异不是由随机误差造成的。95%置信区间的下限是−3.24e+03 (即−3240),上限是−9.21e+02 (即−921),这进一步证实了ATT估计值的显著性,并且效应的大小相对较大。综合以上信息,SDID估计的拟合情况非常好。ATT估计值显著且效应较大,这为本文提供了实验组与对照组之间差异的强有力证据。
Figure 4. Annual death toll of production safety accidents in real and synthetic Guangdong Province
图4. 真实广东省和合成广东省年生产安全事故死亡人数
根据SDID的结果,图4描绘了真实广东省和合成广东省在2010年至2022年间的年生产安全事故。其中,横坐标表示年份,纵坐标代表年生产安全事故死亡人数。由于“12·20”特别重大滑坡事故发生于2015年,因此2015年为干预时点,在图中表示为垂直实线的位置。图中实线曲线代表的是真实的广东省(也即图中的Treated)在观察期内每年因生产安全事故死亡的人数,虚线表示的是合成的广东省(也即图中control)在2010年至2022年间每年死于生产安全事故的人数。
Figure 5. Parallel trend of annual death toll of production safety accidents in real and synthetic Guangdong Province
图5. 真实广东省和合成广东省年生产安全事故死亡人数平行趋势
从图5中不难发现,在2010~2015年间,实线和虚线走势十分接近,具有平行趋势,这表明人为拟合出来的广东省历年(2010~2015)的生产安全事故死亡人数的增减趋势大致上符合广东省实际上每年生产安全事故的死亡人数增减趋势。2010~2015年可以视为训练期,实线和虚线的几乎平行表明拟合是有效果的,因此,2015年之后的结果亦可信。2015年后,虚线增减趋势大致不变,但是实线在2015~2016时大幅下降,二者的差值即为发生于2015年的特别重大生产安全事故对广东省生产安全事故死亡人数的抑制,也即相关文献研究得出的事故发生之后给当地政府带来的震慑效应[30]。
更为重要的是,在2016年之后,实线所代表的真实广东省年生产安全事故死亡人数持续降低,与虚线代表的合成广东省年生产安全事故死亡人数对比,下降幅度更大,即实线与虚线走势不再平行,表明广东省在事故发生之后持续的危机学习收到了良好的学习效果,显著减少了年生产安全事故死亡人数,也即所寻求的因果效应。
Figure 6. Weight chart of control group
图6. 对照组权重图
图6展示了对照组的权重分布,即合成广东省是由哪些省(直辖市)拟合而来。其中,贵州占比权重最大,其次是新疆维吾尔自治区,广西壮族自治区与安徽省权重相当,北京市、上海市权重相当,湖北省权重较低,而甘肃权重最小。河北省、海南省、青海省、宁夏回族自治区未纳入拟合来源。
4.2. 稳健性检验
如何证明广东省在2015年后,每年生产安全事故死亡人数的显著下降是由于广东“12·20”特别重大滑坡事故危机学习所导致的呢?每年生产安全事故死亡人数的显著下降会不会是由于其他因素导致的呢?为此我们需要对模型拟合的结果进行稳健性检验,以验证模型拟合的结果是否真实可信。
4.2.1. 安慰剂检验原理
安慰剂检验是因果推断必不可少的环节。合成控制法的提出者Abadie认为因果推断并不能利用大样本的统计推断方法来检验估计结果的显著性,但可以借助安慰剂检验(Placebo Test)来对结果进行显著性分析。安慰剂检验思想来源于医学,其原理是:把参加实验的病人随机地分为两组,一组称为实验组,组内病人服用的是待检验的新药;另一组是对照组,病人服用的是伪装成药物的糖丸,这种糖丸对实验效果无影响,称之为安慰剂。实验过程当中不能够让参与的病人知道自己服用的是真正的药物还是糖丸,否则就会产生主观的心理预期,影响试验的效果。Abadie借鉴了这一实验原理提出了安慰剂检验的方法,其基本思想是:将其它没有受到干预的个体(即控制组)假定为处理组(即实验组),逐一进行拟合,排列出全部的处理效应,如果真实处理组的处理效应比所有控制组的处理效应大的话,就能够判定处理组的处理效应在统计上是显著的,其估计结果是稳健的。安慰剂检验通常可以分为时间安慰剂检验和地区安慰剂检验。
4.2.2. 时间安慰剂检验
Figure 7. Taking 2012 as the intervention time point
图7. 以2012年为干预时点
Figure 8. Taking 2018 as the intervention time point
图8. 以2018年为干预点
本文采用的安慰剂检验称之为时间安慰剂检验。其原理在于:如果时间的因素影响到了因果效应的识别,那么在变换干预时点后,数据拟合的结果也会随之发生变化,如果因果效应不随时间的变化而变化,则无论如何变化干预时点,数据拟合的结果也不会发生太大的改变。针对本文,安慰剂检验的思想在于:如果将事故发生的时间随机地换成其他年份,那么已经识别出来的因果效应不会随着事故发生年份的改变而产生变化。本研究选取的广东“12·20”特别重大滑坡事故发生在2015年,随机地将事故发生的时间“变换”为2012年(图7中竖实线位置),不难发现,真实的广东省与合成的广东省年生产安全事故死亡人数增减趋势在2010~2015年期间几乎不存在差异,表现为代表真实广东省的实线同代表合成广东省的虚线几乎平行,二者之间出现显著性差异是从2015年起始的,表明了假设事故发生在2015年之前,对实际存在着的因果效应没有影响。
除了将事故发生时间向前调整之外,还可以向2015年之后的年份调整。本文随机选取了2018年(图8中竖实线的位置),不难发现,真实的广东省与合成的广东省在年生产安全事故死亡人数的显著性差异仍然是从2015年开始的,并未到2018年才发生显著差异,这表明即使假设事故发生在2015年之后,对实际存在着的因果效应没有影响。
4.2.3. 地区安慰剂检验
地区安慰剂检验的原理在于:通过对照组拟合实验组,显示出广东省危机学习对于降低年生产安全事故死亡人数的显著效果。然而,对照组数据是否具有特殊性,导致并非只有广东省作为实验组,才会出现因果效应?同理,是否即使没有发生特别重大生产安全事故以及后续的危机学习过程的省份,作为实验组也能出现因果效应?因此,遵循上述安慰剂检验思想,从未发生过特别重大生产安全事故的省份中(前文表2),选择同为东部发达地区,且经济规模、年生产安全事故死亡人数规模相近的上海市作为地区稳健性检验的实验组,剩余省级行政单位作为地区稳健性检验的对照组,其余操作不变,仍然以2015年为干预时间。图9展示了以上海市为实验组时,对照组权重分布情况。
Figure 9. Regional placebo test weight chart of control group
图9. 地区安慰剂检验对照组权重图
Figure 10. Annual death toll of production safety accidents in real and synthetic Shanghai City
图10. 真实上海市和合成上海市年生产安全事故死亡人数
从图10中可以明显发现,以2015年为干预时间,代表真实上海年生产安全事故死亡人数的实线与合成上海年生产安全事故死亡人数的虚线相互交错,无平行趋势,并未出现如图5的因果效应。由此可以说明,本文研究通过了地区安慰剂检验。
综上所述,对于广东省危机学习效果的拟合分别通过了时间安慰剂检验和地区安慰剂检验,表明本文基于反事实框架的模型拟合结果是真实可信的,在广东省“12·20”特别重大滑坡事故发生后,广东方面进行的危机学习确实能够显著抑制此后年份的年生产安全事故死亡人数。
5. 结论与研究展望
本文通过合成差分法这一准自然实验,基于省级面板数据,以广东“12·20”特别重大滑坡事故为研究案例,实证得出结论:地方政府在生产安全事故发生之后的危机学习能显著且持续地减少年生产安全事故死亡人数。即,地方政府的危机学习效果是显著的,危机学习对于降低事故发生率和减少伤亡损失是非常有效的手段,值得地方政府重视和研究,增加危机学习投入,改进危机学习制度,以期不断提高危机学习效果。
需要指出的是,本研究存在一定的不足之处。首先,控制变量设置还可以进一步优化质量,增加数量,在可得数据的范围内,尽量多地控制变量可以使实验结果更加准确,拟合效果更加接近现实。其次,本文研究地方政府生产安全事故危机学习效果,仅以广东“12·20”特别重大滑坡事故为例,还需进一步囊括其他省份,进而获得更多的危机学习效果实证结果;同时,事故类型可扩展到其他事故类型,以期获得其他事故类型的危机学习效果实证结果。
在未来的相关研究中,可以考虑引入更多的案例作为研究对象,事故类型也可以进一步丰富,从而弥补本文研究的不足,为我国的安全工作提供科学化的政策依据和参考。