Analysis of Factors Influencing Employee Turnover and Attrition Tendencies in Enterprises
In the competitive landscape of talent acquisition, high turnover rates not only increase the human resource costs of enterprises but also adversely affect their reputation. This paper aims to conduct an in-depth analysis of the factors leading to employee turnover, predict and effectively manage employees’ attrition tendencies, and promote the healthy development of enterprises. Based on real data from the employee turnover prediction training competition on the Kaggle platform, this study utilizes contingency table analysis to assess the correlation between various features and turnover status. Subsequently, utilizing logistic regression, it delves into the relationships and degrees of influence of these features on employee turnover. The research findings indicate that, at a significance level of 0.05, overtime, frequency of business trips, work-life balance, monthly income, and age have the most significant impact on employee turnover status. The degree of influence, ranked from smallest to largest, is as follows: work-life balance, age, monthly income, frequency of business trips, and overtime. Employee turnover demonstrates a positive correlation with overtime and frequency of business trips, while exhibiting a negative correlation with work-life balance, age, and monthly income. In light of these findings, the following recommendations are proposed: (1) Develop employee promotion plans; (2) Implement reasonable work hour arrangements; (3) Enhance enterprise incentive mechanisms; (4) Foster a people-centric corporate culture. It is hoped that these recommendations will assist enterprises in formulating more effective human resource management strategies, thereby ensuring sustained success in today’s fiercely competitive market.
Resignation
随着全球经济的快速发展和市场竞争的不断加剧,员工离职问题日益成为企业面临的重要挑战。员工的流动性不仅对组织的稳定性和效益造成直接影响,同时也涉及到人才管理、组织文化和领导力等多方面的复杂问题。在这个背景下,深入了解员工离职与离职倾向的影响因素,对于构建积极的组织环境、提高员工满意度、推动企业可持续发展具有重要意义。
近年来,随着社会的不断进步和经济的蓬勃发展,就业机会呈现逐渐增多的趋势。然而,与此同时,以“90后”、“95后”为代表的新一代人才纷纷步入职场,企业离职率迅速攀升,尤其在一些大城市,员工流失的比例持续上升
国家劳动和社会保障部劳动科学研究所与北森测评网共同进行的“中国职业发展现状”调查结果显示,在被调查的人群中,超过60%的被调查者选择了自愿离职,其中跳槽两次和跳槽三次的人最多,加起来共占跳槽总人数的43.75%。
基于以上企业员工离职可能带来的种种问题,有必要根据企业员工离职的以往和当前情况进行深入分析,找出导致员工离职或离职倾向的重要影响因素,进而有针对性的加以管理,使得企业的人力资源发挥更大的价值。
在当今这个快速发展的商业环境中,人力资源的稳定性和连续性已经成为了决定企业成败的关键因素。然而,近年来员工离职现象的日益严重,给企业带来了严重的挑战。员工的流失不仅仅是数字统计的问题,更是企业内部稳定性和运营效能的直接反映。
核心人才的流失可能导致企业知识库的枯竭,进而影响企业的创新力和竞争力。员工离职也会给企业的生产效率带来直接影响。新员工的招聘、培训和适应周期都需要消耗大量的时间和资源,而这些过程中产生的成本不容忽视。企业需要投入更多的资源来填补离职员工的空缺,对于那些原本就在竞争中苦苦挣扎的企业来说,无疑是雪上加霜。更深层次的,员工离职问题还会对企业的核心竞争力造成打击。特别是对于高科技行业或专业服务行业来说,失去关键技术人才可能导致企业失去市场敏感性和灵活性,从而影响其长期的竞争地位。
因此,深入分析员工离职与离职倾向的影响因素对企业来说至关重要。这不仅有助于企业可以通过改进管理体制、提供更多的职业发展机会、加强团队建设等方式来降低员工离职率,从而在人才竞争激烈的商业环境中脱颖而出。
本文旨在对企业员工离职问题进行分析,根据各种因素对员工离职的影响重要性,使企业制定更有效的人力资源管理策略,提高员工的工作满意度和忠诚度,保持品牌声誉、提高生产效率,从而确保企业在激烈的市场竞争中持续取得成功。
本文在对企业员工离职预测问题的研究过程中,主要采用以下研究方法:
(1) 文献研究法
利用文献研究法,通过学校图书馆、互联网等知识平台搜集与企业员工离职相关的书籍、期刊与论文。通过对国内外相关文献的查阅,可以研究极其广泛的社会情况,从这些材料研究总结梳理出本文用到的理论基础以及研究思路,选取较好的评价指标,构建出合适的企业员工离职模型。
(2) 定量与定性分析法
对定性数据进行量化处理,对获得的企业员工离职数据集中的数据进行探索性分析,在此基础上建立Logistic回归模型找出对企业员工离职影响比较大的特征,根据这些特征分析员工离职原因的某些性质、特征、相互关系,进行分析比较并给出相应建议,为企业的人力资源管理者提供参考。
伴随着众多企业受员工离职问题的困扰,我国的学者也开展了对这一领域课题的研究,并成功提出了许多员工离职影响因素。
符益群等(2002)从五个方面来探究对员工离职的影响因素,分别是个体方面、关于工作本身的相关方面、个体同组织之间契合度方面、组织以及心理因素等方面
综上所述,总结造成员工离职的影响因素,大致可以分为以下几类:一是员工的个人因素,二是工作因素,三是组织因素,四是企业文化因素。
本文数据取自IBM Watson Analytics平台发布的数据集“IBM HR Analytics Employee Attrition & Performance”,该数据集被分享在当前全球最大的机器学习竞赛平台Kaggle上。因原数据过于繁杂,根据经验与其他文献参考,本文选取了原数据中的14个变量来进行分析,探究各个变量对员工离职的影响大小。经检验发现,在“Employee Count”、“Standard Hours”、“Over18”这三个特征中仅有一个数值,表明这三个特征属于常量,删除后对于数据的分析以及模型的结果没有任何影响,应予以删除。此外,发现“Employee Number”特征中的数值是员工的编码属于无关特征,在分析员工离职的原因以及构建离职二值logistic模型时提供不了有用的信息,应该做删除处理。后经过检验发现,数据中并不存在缺失值与重复样本。因此,最终采用经剔除后的10个变量进行数据分析。
在进行建模分析之前,引入虚拟变量将定性变量量化,
字段 |
含义 |
取值范围 |
Age |
年龄 |
18~60 |
Attrition |
离职情况 |
No = 0 |
Yes = 1 |
||
Business Travel |
出差频率 |
Non-Travel = 0 |
Travel_Rarely = 1 |
||
Travel_Frequently = 2 |
||
Gender |
性别 |
Male = 0 |
Female = 1 |
||
Job Level |
职级 |
1~5 |
Job Role |
职能 |
Research Scientist = 0 |
Sales Executive = 1 |
||
Human Resources = 2 |
||
Healthcare Representative = 3 |
||
Laboratory Technician = 4 |
||
Research Director = 5 |
||
Manager = 6 |
||
Sales Representative = 7 |
||
Manufacturing Director = 8 |
||
Monthly Income |
月收入 |
1009~1999 |
OverTime |
员工是否加班 |
No = 0 |
Yes = 1 |
||
Total Working Years |
总工作年数 |
0~40 |
Work Life Balance |
工作生活平衡度 |
1~4 |
Years Since Last Promotion |
距离上次升职时间 |
0~15 |
列联表也称交叉表,是由两个分类变量交叉分类后得到的频数分布表。列联表分析是通过频数交叉表来讨论两个或多个分类变量之间是否存在关联,其基本思想与假设检验基本一致。首先,建立一个原假设H0:两个变量之间是没有关联(独立)的,然后进行卡方检验。卡方统计量计算公式如下:
其中, 为经验频数, 为 的极大似然估计,df为自由度。
通过对各个特征与员工的离职状态进行列联表相关性分析,我们可以评估它们之间是否存在相关性。若存在显著的相关性,则我们可以选择该特征纳入逻辑回归模型;若不存在显著的相关性,那么这个特征可能与员工的离职状态无关,将其舍弃,不纳入逻辑回归模型中。在离职员工数据集中存在着连续型特征和离散型分类特征,因此考虑对两种类型分别进行相关分析。
因变量Attrition一个是二分类特征,Age、Monthly Income、Total Working Years、Years Since Last Promotion为连续特征,当一个为二分类特征,另一个是连续特征时利用点二列相关进行相关性分析。可以利用SPSS软件中的Pearson相关检验来进行相关性分析,结果如下:
变量 |
皮尔逊相关性 |
显著性(双尾) |
Age |
−0.159** |
<0.01 |
Monthly Income |
−0.160** |
<0.01 |
Total Working Years |
−0.171** |
<0.01 |
Years Since Last Promotion |
−0.033 |
0.206 |
由
(1) 员工职位影响因素分析
对九种不同员工职位进行卡方检验及Cramer’s V检验,结果如
值 |
自由度 |
渐进显著性 |
渐进显著性(双侧) |
|
皮尔逊卡方 |
86.190a |
8 |
<0.01 |
|
似然比 |
88.909 |
8 |
<0.01 |
|
克莱姆V |
0.242 |
<0.01 |
||
有效案例中的N |
1470 |
|||
a.0个单元格(0.0%)的期望计数小于5。最小期望计数为8.38。 |
(2) 性别影响因素分析
从皮尔逊卡方检验和费希尔精确检验的分析结果来看,p值都远大于0.01,则员工的性别与员工离职状态之间不存在显著线性相关,结果如
值 |
自由度 |
渐进 Sig. (双侧) |
精确 Sig. (双侧) |
精确 Sig. (单侧) |
|
皮尔逊卡方 |
1.275a |
1 |
0.259 |
||
连续性修正b |
1.117 |
1 |
0.291 |
||
似然比 |
1.286 |
1 |
0.257 |
||
费希尔精确检验 |
0.278 |
0.145 |
|||
有效案例中的N |
1470 |
(3) 是否加班影响因素分析
从皮尔逊卡方检验和费希尔精确检验的分析结果来看,p值都小于0.001,接近于0,则员工是否加班则和离职状态之间在0.05水平上存在着显著线性相关,结果如
值 |
自由度 |
渐进 Sig. (双侧) |
精确 Sig. (双侧) |
精确 Sig. (单侧) |
|
皮尔逊卡方 |
89.044a |
1 |
<0.001 |
||
连续性修正b |
87.564 |
1 |
<0.001 |
||
似然比 |
81.402 |
1 |
<0.001 |
||
费希尔精确检验 |
<0.001 |
<0.001 |
|||
有效案例中的N |
1470 |
||||
a. 0单元格(0.0%)的期望计数少于5。最小期望计数为94.80。 |
(4) 出差频率
从线性卡方检验的分析结果可以得到,p值远小于0.01,则出差频率与员工离职状态之间在0.05水平上显著线性相关,结果如
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
|
出差频率 |
23.696 |
1 |
<0.001 |
(5) 职级
从线性卡方检验的分析结果可以得到,p值远小于0.01,则职级与员工离职状态之间在0.05水平上显著线性相关,结果如
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
|
职级 |
42.008 |
1 |
<0.001 |
(6) 工作生活平衡度
从线性卡方检验的分析结果可以得到,p值为0.014,则工作生活平衡度与员工离职状态之间在0.05 水平上显著线性相关,结果如
线性和线性组合值 |
自由度 |
渐进显著性(双侧) |
|
工作生活平衡度 |
6.006 |
1 |
0.014 |
(7) 结论
在初步了解公司员工分布情况后,我们旨在深入研究各个特征对员工离职的具体影响。逻辑回归模型因其“白盒模型”属性而具有出色的透明度和可解释性,使其成为分析员工离职影响因素及其重要性的理想选择。
在构建逻辑回归模型之前,我们必须验证选择的变量与离职状态之间是否存在关系。由列联表的相关性分析可知,在所有解释变量中,除性别与距上次升职的时间等变量外,其他变量均与员工离职状态存在显著相关关系。因此,我们选择剩余的8个变量进行模型构建。
为了避免特征间的严重共线性对模型的结果产生影响,我们利用Python软件中的可视化工具绘制部分特征的相关性热力图,如
从特征的相关性热力图可以看到,部分特征之间存在着较高的相关性,为了保证逻辑回归模型结果的准确性和特征重要性的可解释性,对与员工的年龄、职级和月收入都有较高的相关性的总工作年数这一特征进行删除。另外在月收入与职级两个特征之间存在相关系数为1的相关性,因此选择将职级这一特征予以剔除,保留月收入这一特征。最终模型建立时的解释变量数共有6个。
本节根据筛选出的变量以及定性变量的量化指标用二值Logistic回归进行模型建立。
设响应变量Y仅有两个状态,它们分别以0和1两个值表示。 是我们的研究对象。设有 个因素 影响Y的取值,则称
为二值Logistic回归模型,简称Logistic回归模型,其中的k个因素 称为Logistic回归模型的协变量。其中 是待估旳未知参数。
由所选变量可知,员工月收入与年龄均为定量数据,工作职能与是否加班为名义数据,工作与生活平衡度及出差频率则为有序数据,依据此,进一步进行接下来的模型构建。
(1) 参数估计及其显著性检验
变量 |
B |
显著性 |
Business Travel |
0.649 |
<0.001 |
Job Role |
0.035 |
0.222 |
Monthly Income |
−0.0001 |
<0.001 |
Over Time |
1.415 |
<0.001 |
Work Life Balance |
−0.257 |
0.015 |
Age |
−0.038 |
<0.001 |
常量 |
−0.411 |
0.381 |
由上
(2) 模型系数的Omnibus检验
卡方 |
显著性 |
|
步骤 |
172.581 |
<0.001 |
块 |
172.581 |
<0.001 |
模型 |
172.581 |
<0.001 |
从模型系数检验中可以看到,其显著性均 < 0.01,即拟合效果较好,表明模型总体有意义。
(3) 模型的H-L检验
卡方 |
自由度 |
显著性 |
11.870 |
8 |
0.157 |
在0.05显著性水平下,该检验拒绝原假设,故也认为模型的拟合优度良好,再次说明了所选取模型的优良性。
(4) 特征重要性排序
(1) 在0.05显著性水平水平上,员工的离职状态是否加班、出差频繁度、工作生活平衡度、月收入与年龄的影响最为显著。
(2) 其影响程度由小到大依次排序分别为:工作生活平衡度、年龄、月收入、出差频繁度与是否加班。
(1) 制定员工晋升规划
企业需要对员工建立系统全面的价值评估体系,同时要基于公平公正的原则将公司制度决策透明化。在员工晋升的过程中,企业应积极建立有效的沟通反馈通道,使得员工能够将自己的真实意愿及时有效的进行表达,企业管理层也能进行及时的反馈,并且形成良性互动。
(2) 合理安排工作时间
企业实施弹性工作制。在保证完成相关任务与项目的前提下,赋予员工更多的自由,使得员工在现阶段普遍快速的生活、工作节奏下获得更大的个人空间,从而维持对工作的积极性与热情。
(3) 完善企业激励机制
针对员工激励的方式可以是多种多样的,总体可以分为物质激励和精神激励,物质激励可以保障员工的基本生活需要,而精神激励则会给员工一定的鼓舞作用,是对员工价值的认可,企业需对员工的工作动机与需求进行整体把握,立足于员工,建立起贴合员工需求的激励机制。
(4) 构建以人为本的企业文化
企业应充分关注员工的生命安全问题,提高每个员工的商业保险标准,解决员工的后顾之忧。提高员工办公环境的舒适度。最后,企业在面临重大决策时,可以通过调查问卷、座谈会、网站提意见等方式,接收员工的意见,让员工参与进来,让企业管理层看到并采纳基层员工的意见。