1. 引言
1.1. 研究背景
随着全球经济的快速发展和市场竞争的不断加剧,员工离职问题日益成为企业面临的重要挑战。员工的流动性不仅对组织的稳定性和效益造成直接影响,同时也涉及到人才管理、组织文化和领导力等多方面的复杂问题。在这个背景下,深入了解员工离职与离职倾向的影响因素,对于构建积极的组织环境、提高员工满意度、推动企业可持续发展具有重要意义。
近年来,随着社会的不断进步和经济的蓬勃发展,就业机会呈现逐渐增多的趋势。然而,与此同时,以“90后”、“95后”为代表的新一代人才纷纷步入职场,企业离职率迅速攀升,尤其在一些大城市,员工流失的比例持续上升[1]。
国家劳动和社会保障部劳动科学研究所与北森测评网共同进行的“中国职业发展现状”调查结果显示,在被调查的人群中,超过60%的被调查者选择了自愿离职,其中跳槽两次和跳槽三次的人最多,加起来共占跳槽总人数的43.75%。[2]。员工作为企业的重要资产,扮演着不可替代的角色。如果员工离职,那么原本为企业带来现金流的员工就会变成“负债”,不仅不会带来收益,还会增加企业的沉没成本[3]。严重的离职问题首先会导致企业服务的质量降低,损害企业在消费者心目中的品牌形象。其次,员工离职也会带来知识流失,特别是企业中掌握着核心技术或有着丰富管理经验的关键员工的离职,会给企业带来巨大的损失[4]。最后,员工离职率的上升会导致企业营业成本增加,甚至可能引发商业技术泄密的风险,使企业产生声誉风险并降低企业的竞争力。
基于以上企业员工离职可能带来的种种问题,有必要根据企业员工离职的以往和当前情况进行深入分析,找出导致员工离职或离职倾向的重要影响因素,进而有针对性的加以管理,使得企业的人力资源发挥更大的价值。
1.2. 研究目的与意义
在当今这个快速发展的商业环境中,人力资源的稳定性和连续性已经成为了决定企业成败的关键因素。然而,近年来员工离职现象的日益严重,给企业带来了严重的挑战。员工的流失不仅仅是数字统计的问题,更是企业内部稳定性和运营效能的直接反映。
核心人才的流失可能导致企业知识库的枯竭,进而影响企业的创新力和竞争力。员工离职也会给企业的生产效率带来直接影响。新员工的招聘、培训和适应周期都需要消耗大量的时间和资源,而这些过程中产生的成本不容忽视。企业需要投入更多的资源来填补离职员工的空缺,对于那些原本就在竞争中苦苦挣扎的企业来说,无疑是雪上加霜。更深层次的,员工离职问题还会对企业的核心竞争力造成打击。特别是对于高科技行业或专业服务行业来说,失去关键技术人才可能导致企业失去市场敏感性和灵活性,从而影响其长期的竞争地位。
因此,深入分析员工离职与离职倾向的影响因素对企业来说至关重要。这不仅有助于企业可以通过改进管理体制、提供更多的职业发展机会、加强团队建设等方式来降低员工离职率,从而在人才竞争激烈的商业环境中脱颖而出。
本文旨在对企业员工离职问题进行分析,根据各种因素对员工离职的影响重要性,使企业制定更有效的人力资源管理策略,提高员工的工作满意度和忠诚度,保持品牌声誉、提高生产效率,从而确保企业在激烈的市场竞争中持续取得成功。
1.3. 研究方法
本文在对企业员工离职预测问题的研究过程中,主要采用以下研究方法:
(1) 文献研究法
利用文献研究法,通过学校图书馆、互联网等知识平台搜集与企业员工离职相关的书籍、期刊与论文。通过对国内外相关文献的查阅,可以研究极其广泛的社会情况,从这些材料研究总结梳理出本文用到的理论基础以及研究思路,选取较好的评价指标,构建出合适的企业员工离职模型。
(2) 定量与定性分析法
对定性数据进行量化处理,对获得的企业员工离职数据集中的数据进行探索性分析,在此基础上建立Logistic回归模型找出对企业员工离职影响比较大的特征,根据这些特征分析员工离职原因的某些性质、特征、相互关系,进行分析比较并给出相应建议,为企业的人力资源管理者提供参考。
2. 文献综述
伴随着众多企业受员工离职问题的困扰,我国的学者也开展了对这一领域课题的研究,并成功提出了许多员工离职影响因素。
符益群等(2002)从五个方面来探究对员工离职的影响因素,分别是个体方面、关于工作本身的相关方面、个体同组织之间契合度方面、组织以及心理因素等方面[5]。赵西萍等(2003)通过问卷调查法收集到离职因素相关数据后,利用因子分析的方法找寻对员工的工作态度有影响的公共因子,并分析了这些公共因子同员工产生离职倾向是否存在着关联,以此找到了导致员工产生离职倾向的最为重要的因素,在文章最后对西安地区不同类型企业当中员工的离职倾向差异以及影响员工离职倾向的关键影响因素[6]。向征等(2006)利用发放调查问卷以及对已经离职的高学历员工进行访谈的形式,来对重庆市企业内的高学历员工离职因素进行了研究,并提出了减少高学历员工离职率的四点措施[7]。陈志霞(2006)在对相关理论研究的基础上,通过多种调查方式收集相关的数据,再利用数据统计方法从员工组织支持感的角度出发研究它的心理结构和对员工的工作绩效以及离职倾向的影响[8]。李向民等(2007)从员工离职的概念的角度进行切入,探究了员工离职给企业带来的离职成本以及在不同的行业和不同的职业之中的离职率分布情况,并从主要包含员工个体的信息的人口统计学因素、可以受到企业所控制的因素和无法受到企业控制的因素三个方面建立员工离职模型来分析员工离职的原因,并给出了相关的应对策略[9]。熊明良(2008)利用调查问卷的方法,通过结合系统抽样和分层抽样的方式,以收集到的建筑企业中383名员工的有效问卷作为样本,采用层级回归方法对工作满意度的各个构成层面和组织认同相对于员工产生离职倾向的解释能力进行分析,在此基础上又检验了在员工做出离职决定过程中组织认同所起到的调节作用[10]。李倩等(2009)利用发放调查问卷的方式来收集高新技术企业员工与离职倾向相关的数据,再利用SPSS软件对收集来的这些数据进行处理,结果表明较高的高层管理者对员工的信任程度和员工对组织的认同程度能够有效抑制员工的离职,表明高管信任与员工的离职倾向有着较高的关联,并且组织承诺在高管的信任影响员工离职倾向过程中产生了重要作用[11]。赵慧娟等(2010)对中部六省的企业员工发放调查问卷的方式收集相关数据,并对收集到的信息进行层级回归分析,来研究员工的价值观与组织是否存在一致性以及员工在各个方面满足组织要求的程度和这些省市中的员工产生离职的想法是否相关,结果表明,这一区域内企业中的员工与企业的能力相匹配水平相对于价值观要高,员工与企业的价值观相匹配、能力相匹配可以降低员工的离职倾向,当员工的价值观与能力都和企业相匹配时会明显降低员工的离职倾向[12]。
综上所述,总结造成员工离职的影响因素,大致可以分为以下几类:一是员工的个人因素,二是工作因素,三是组织因素,四是企业文化因素。
3. 数据分析
3.1. 数据处理
3.1.1. 数据来源及筛选
本文数据取自IBM Watson Analytics平台发布的数据集“IBM HR Analytics Employee Attrition & Performance”,该数据集被分享在当前全球最大的机器学习竞赛平台Kaggle上。因原数据过于繁杂,根据经验与其他文献参考,本文选取了原数据中的14个变量来进行分析,探究各个变量对员工离职的影响大小。经检验发现,在“Employee Count”、“Standard Hours”、“Over18”这三个特征中仅有一个数值,表明这三个特征属于常量,删除后对于数据的分析以及模型的结果没有任何影响,应予以删除。此外,发现“Employee Number”特征中的数值是员工的编码属于无关特征,在分析员工离职的原因以及构建离职二值logistic模型时提供不了有用的信息,应该做删除处理。后经过检验发现,数据中并不存在缺失值与重复样本。因此,最终采用经剔除后的10个变量进行数据分析。
3.1.2. 定性变量的量化
在进行建模分析之前,引入虚拟变量将定性变量量化,表1为所使用的变量字段及其量化结果,其中,Attrition为y,Age、Business Travel、Gender、Job Level、Job Role、Monthly Income、Over Time、Total Working Years、Work Life Balance、Years Since Last Promotion分别为
。
Table 1.Quantification of variables
表1.变量量化表
字段 |
含义 |
取值范围 |
Age |
年龄 |
18~60 |
Attrition |
离职情况 |
No = 0 |
Yes = 1 |
Business Travel |
出差频率 |
Non-Travel = 0 |
Travel_Rarely = 1 |
Travel_Frequently = 2 |
Gender |
性别 |
Male = 0 |
|
|
Female = 1 |
Job Level |
职级 |
1~5 |
Job Role |
职能 |
Research Scientist = 0 |
Sales Executive = 1 |
Human Resources = 2 |
Healthcare Representative = 3 |
Laboratory Technician = 4 |
Research Director = 5 |
Manager = 6 |
Sales Representative = 7 |
Manufacturing Director = 8 |
Monthly Income |
月收入 |
1009~1999 |
OverTime |
员工是否加班 |
No = 0 |
Yes = 1 |
Total Working Years |
总工作年数 |
0~40 |
Work Life Balance |
工作生活平衡度 |
1~4 |
Years Since Last Promotion |
距离上次升职时间 |
0~15 |
3.2. 列联表相关性分析
列联表也称交叉表,是由两个分类变量交叉分类后得到的频数分布表。列联表分析是通过频数交叉表来讨论两个或多个分类变量之间是否存在关联,其基本思想与假设检验基本一致。首先,建立一个原假设H0:两个变量之间是没有关联(独立)的,然后进行卡方检验。卡方统计量计算公式如下:
其中,
为经验频数,
为
的极大似然估计,df为自由度。
通过对各个特征与员工的离职状态进行列联表相关性分析,我们可以评估它们之间是否存在相关性。若存在显著的相关性,则我们可以选择该特征纳入逻辑回归模型;若不存在显著的相关性,那么这个特征可能与员工的离职状态无关,将其舍弃,不纳入逻辑回归模型中。在离职员工数据集中存在着连续型特征和离散型分类特征,因此考虑对两种类型分别进行相关分析。
因变量Attrition一个是二分类特征,Age、Monthly Income、Total Working Years、Years Since Last Promotion为连续特征,当一个为二分类特征,另一个是连续特征时利用点二列相关进行相关性分析。可以利用SPSS软件中的Pearson相关检验来进行相关性分析,结果如下:
Table 2.Correlation analysis between continuous features and turnover status
表2.连续特征和离职状态间的相关性分析
变量 |
皮尔逊相关性 |
显著性(双尾) |
Age |
−0.159** |
<0.01 |
Monthly Income |
−0.160** |
<0.01 |
Total Working Years |
−0.171** |
<0.01 |
Years Since Last Promotion |
−0.033 |
0.206 |
由表2可知,员工的年龄、月收入、总工作年数与员工的离职状态之间在0.01水平上显著线性相关,而距离上次升职时间与离职状态之间的p值为0.206,远大于显著性水平0.05,不存在线性相关关系。
(1) 员工职位影响因素分析
对九种不同员工职位进行卡方检验及Cramer’s V检验,结果如表3,可以知道员工的职位与离职状态之间存在关联,在0.05水平上显著。
Table 3.Chi-square test results between position and turnover status
表3.职位与离职状态的卡方检验结果
|
值 |
自由度 |
渐进显著性 |
渐进显著性(双侧) |
皮尔逊卡方 |
86.190a |
8 |
|
<0.01 |
似然比 |
88.909 |
8 |
|
<0.01 |
克莱姆V |
0.242 |
|
<0.01 |
|
有效案例中的N |
1470 |
|
|
|
a.0个单元格(0.0%)的期望计数小于5。最小期望计数为8.38。 |
(2) 性别影响因素分析
从皮尔逊卡方检验和费希尔精确检验的分析结果来看,p值都远大于0.01,则员工的性别与员工离职状态之间不存在显著线性相关,结果如表4所示。
Table 4.Chi-square test results between gender and turnover status
表4.性别与离职状态的卡方检验结果
|
值 |
自由度 |
渐进 Sig. (双侧) |
精确 Sig. (双侧) |
精确 Sig. (单侧) |
皮尔逊卡方 |
1.275a |
1 |
0.259 |
|
|
连续性修正b |
1.117 |
1 |
0.291 |
|
|
似然比 |
1.286 |
1 |
0.257 |
|
|
费希尔精确检验 |
|
|
|
0.278 |
0.145 |
有效案例中的N |
1470 |
|
|
|
|
(3) 是否加班影响因素分析
从皮尔逊卡方检验和费希尔精确检验的分析结果来看,p值都小于0.001,接近于0,则员工是否加班则和离职状态之间在0.05水平上存在着显著线性相关,结果如表5所示。
Table 5.Chi-square test results between overtime and turnover status
表5.是否加班与离职状态的卡方检验结果
|
值 |
自由度 |
渐进 Sig. (双侧) |
精确 Sig. (双侧) |
精确 Sig. (单侧) |
皮尔逊卡方 |
89.044a |
1 |
<0.001 |
|
|
连续性修正b |
87.564 |
1 |
<0.001 |
|
|
似然比 |
81.402 |
1 |
<0.001 |
|
|
费希尔精确检验 |
|
|
|
<0.001 |
<0.001 |
有效案例中的N |
1470 |
|
|
|
|
a. 0单元格(0.0%)的期望计数少于5。最小期望计数为94.80。 |
(4) 出差频率
从线性卡方检验的分析结果可以得到,p值远小于0.01,则出差频率与员工离职状态之间在0.05水平上显著线性相关,结果如表6所示。
Table 6.Chi-square test results between frequency of business trips and turnover status
表6.出差频率与离职状态的卡方检验结果
|
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
出差频率 |
23.696 |
1 |
<0.001 |
(5) 职级
从线性卡方检验的分析结果可以得到,p值远小于0.01,则职级与员工离职状态之间在0.05水平上显著线性相关,结果如表7所示。
Table 7.Chi-square test results between job level and turnover status
表7.职级与离职状态的卡方检验结果
|
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
职级 |
42.008 |
1 |
<0.001 |
(6) 工作生活平衡度
从线性卡方检验的分析结果可以得到,p值为0.014,则工作生活平衡度与员工离职状态之间在0.05 水平上显著线性相关,结果如表8所示。
Table 8.Chi-square test results between work-life balance and turnover status
表8.工作生活平衡度与离职状态的卡方检验结果
|
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
工作生活平衡度 |
6.006 |
1 |
0.014 |
(7) 结论
在对各个特征与员工的离职状态进行单因素相关性分析后,可以得到:在0.05显著性水平水平上,性别和距上次升值时间与离职状态不存在明显的相关性,而年龄、出差频率、职级、职位、月收入、是否加班、总工作年数和工作生活平衡度等特征则与员工是否离职呈现出显著相关性。
3.3. Logistic回归分析
在初步了解公司员工分布情况后,我们旨在深入研究各个特征对员工离职的具体影响。逻辑回归模型因其“白盒模型”属性而具有出色的透明度和可解释性,使其成为分析员工离职影响因素及其重要性的理想选择。
3.3.1. 变量筛选
在构建逻辑回归模型之前,我们必须验证选择的变量与离职状态之间是否存在关系。由列联表的相关性分析可知,在所有解释变量中,除性别与距上次升职的时间等变量外,其他变量均与员工离职状态存在显著相关关系。因此,我们选择剩余的8个变量进行模型构建。
3.3.2. 多重共线性检验
为了避免特征间的严重共线性对模型的结果产生影响,我们利用Python软件中的可视化工具绘制部分特征的相关性热力图,如图1所示。
Figure 1.Heatmap
图1.热力图
从特征的相关性热力图可以看到,部分特征之间存在着较高的相关性,为了保证逻辑回归模型结果的准确性和特征重要性的可解释性,对与员工的年龄、职级和月收入都有较高的相关性的总工作年数这一特征进行删除。另外在月收入与职级两个特征之间存在相关系数为1的相关性,因此选择将职级这一特征予以剔除,保留月收入这一特征。最终模型建立时的解释变量数共有6个。
3.3.3. 模型实现及检验
本节根据筛选出的变量以及定性变量的量化指标用二值Logistic回归进行模型建立。
设响应变量Y仅有两个状态,它们分别以0和1两个值表示。
是我们的研究对象。设有
个因素
影响Y的取值,则称
为二值Logistic回归模型,简称Logistic回归模型,其中的k个因素
称为Logistic回归模型的协变量。其中
是待估旳未知参数。
由所选变量可知,员工月收入与年龄均为定量数据,工作职能与是否加班为名义数据,工作与生活平衡度及出差频率则为有序数据,依据此,进一步进行接下来的模型构建。
(1) 参数估计及其显著性检验
Table 9.Parameter estimation table
表9.参数估计表
变量 |
B |
显著性 |
Business Travel |
0.649 |
<0.001 |
Job Role |
0.035 |
0.222 |
Monthly Income |
−0.0001 |
<0.001 |
Over Time |
1.415 |
<0.001 |
Work Life Balance |
−0.257 |
0.015 |
Age |
−0.038 |
<0.001 |
常量 |
−0.411 |
0.381 |
由上表9可以看出,在0.05的显著性水平下,出差频率、是否加班、年龄、工作与生活平衡度及月收入等因素对员工的离职状态影响显著,而工作职能则对其员工离职影响甚微。因此最终得到的回归方程为:
(2) 模型系数的Omnibus检验
Table 10.Omnibus test table
表10.Omnibus 检验表
|
卡方 |
显著性 |
步骤 |
172.581 |
<0.001 |
块 |
172.581 |
<0.001 |
模型 |
172.581 |
<0.001 |
从模型系数检验中可以看到,其显著性均 < 0.01,即拟合效果较好,表明模型总体有意义。
(3) 模型的H-L检验
Table 11.Hosmer-Lemeshow test table
表11.H-L检验表
卡方 |
自由度 |
显著性 |
11.870 |
8 |
0.157 |
在0.05显著性水平下,该检验拒绝原假设,故也认为模型的拟合优度良好,再次说明了所选取模型的优良性。
(4) 特征重要性排序
Figure 2.Feature importance ranking chart
图2.特征重要性排序图
利用SPSS中的OR值,对识别为显著的特征进行绘制特征重要性排序图,由图可以看出,各个对离职有显著影响的特征影响程度由小到大依次排序分别为:工作生活平衡度、年龄、月收入、出差频繁度与是否加班。
3.3.4. 模型分析结论
员工的离职状态受是否加班、出差频繁度、工作生活平衡度、月收入与年龄的影响最为显著。与前两者为正相关关系,与其他特征则呈现负相关关系。按影响程度由小到大依次排序分别为:工作生活平衡度、年龄、月收入、出差频繁度与是否加班。
4. 结论与建议
4.1. 结论
(1) 在0.05显著性水平水平上,员工的离职状态是否加班、出差频繁度、工作生活平衡度、月收入与年龄的影响最为显著。
(2) 其影响程度由小到大依次排序分别为:工作生活平衡度、年龄、月收入、出差频繁度与是否加班。
(3) 员工离职与是否加班、出差频繁度为正相关关系;员工离职与工作生活平衡度、年龄、月收入呈负相关关系。
4.2. 建议
(1) 制定员工晋升规划
企业需要对员工建立系统全面的价值评估体系,同时要基于公平公正的原则将公司制度决策透明化。在员工晋升的过程中,企业应积极建立有效的沟通反馈通道,使得员工能够将自己的真实意愿及时有效的进行表达,企业管理层也能进行及时的反馈,并且形成良性互动。
(2) 合理安排工作时间
企业实施弹性工作制。在保证完成相关任务与项目的前提下,赋予员工更多的自由,使得员工在现阶段普遍快速的生活、工作节奏下获得更大的个人空间,从而维持对工作的积极性与热情。
(3) 完善企业激励机制
针对员工激励的方式可以是多种多样的,总体可以分为物质激励和精神激励,物质激励可以保障员工的基本生活需要,而精神激励则会给员工一定的鼓舞作用,是对员工价值的认可,企业需对员工的工作动机与需求进行整体把握,立足于员工,建立起贴合员工需求的激励机制。
(4) 构建以人为本的企业文化
企业应充分关注员工的生命安全问题,提高每个员工的商业保险标准,解决员工的后顾之忧。提高员工办公环境的舒适度。最后,企业在面临重大决策时,可以通过调查问卷、座谈会、网站提意见等方式,接收员工的意见,让员工参与进来,让企业管理层看到并采纳基层员工的意见。