1. 引言
针对转向架的关键位置精度和尺寸精度不稳定的问题,通过分析前期积累的质量数据,初步确定可能的影响因素,包括采集加工过程中的环境温度、机床检测元件光栅尺的问题、刀具的磨损状态以及主轴电流等。在这其中,以加工过程中的环境温度、刀具磨损状态等为主要影响因素。着重研究温度对加工质量的影响,利用深度学习、多感知数据进行特征提取,针对批量制造过程中产品质量的波动性与不确定性,建立概率统计模型表征方法。在此基础上,建立制造过程状态向量及其相似度度量方法,利用聚类算法挖掘制造过程大数据中的异常状态数据,实现大批量加工制造过程的质量问题溯源与定位,并结合多元统计回归方法,分析温度变化与最终产品质量之间的定量关系。在整个分析过程中,首先需要利用温度传感器采集轴承座以及光栅尺两个关键位置处的温度数据,其次,与三坐标测量系统建立通讯,获取对应的误差数据表,从中选取与分析有关的关键尺寸,通过软件读取关键尺寸对应的零件号,零件号与实时采集的温度数据关联,从而以零件号作为中介,实现质量数据与温度数据的关联对应。在必要情况下,还可以追溯构架的加工履历,包括设备、刀具、人员、作业时间等信息。在采集到加工质量数据以及温度数据后,利用Matlab软件进行二者之间的关联性模型拟合,并利用神经网络进行优化得出最优模型。在此基础上对一日内的温度变化趋势的曲线进行分析拟合,对一日内不同时间段的加工质量优化作出理论指导。基于现有的研究,可以对质量波动的关联性因素作出准确定位,并对不同加工参数下的加工质量波动趋势作出较为准确的预测[1][2]。目前正在继续推动制造数据加工参数与质量数据间的精确回归预测模型的建立,后续能够基于制造数据加工参数预测准确的质量数据指标,为制造过程中的加工参数调整作理论指导[3][4]。
2. 构件Y轴方向关键尺寸数据处理
加工过程需要提取的Y轴方向测量项点有(对应质量确认表):
EZ20M系列:共19个,B1、B2、D1、D2、E1、E2、F1、F2、G1、G2、Q1、Q2、Q3、Q4、R、S1、S2、BB1、BB2
EZ20T系列:共17个,B1、B2、D1、D2、E1、E2、J1、J2、J3、J4、J5、J6、M、N1、N2、S1、S2
为了实现加工构件的加工时间和轴承座、光栅尺温度传感器采集到的温度数据的采集时间一一对应,实现对温度与加工质量的关联性研究,所采用的方法是通过MES系统查询构件加工编号对应的Y方向质量项点数据,其中Y方向质量项点数据存在于正装工序和反装工序中,反装工序无法通过机床刀具加工代码定位刀具号和子程序号,正装工序可以通过机床刀具加工代码定位刀具号和子程序号,可以定位到刀具号和子程序号的正装工序尺寸已在表格中注明,其中EZ2NM系列有B1、B2、D1、D2、G1、G2、R共7个Y方向质量项点为正装工序尺寸,EZ20T系列有B1、B2、M共3个Y方向质量项点为正装工序尺寸,正装工序尺寸通过机床刀具加工代码定位到刀具号和子程序号已在表1中注明。DNC系统中会同步记录刀具号、程序号、子程序号、程序行、主轴转速、进给速度、主轴负载、进给轴负载等加工数据,可以精确查询刀具号、子程序号的加工时间,从而可以实现Y方向质量项点数据的加工时间和温度传感器采集时间的一一对应关系,从而实现对温度与加工质量的关联性研究。
Table 1.Comparison table of tool number and sub process number corresponding to quality item point data exported from MES system for key dimensions in the Y-axis direction of components
表1.构件Y轴方向关键尺寸MES系统导出质量项点数据对应刀具号与子程序号对照表
生产编号系列 |
质量项点数据编号 |
刀具号 |
子程序号 |
EZ20M |
B1/B2 |
H58 |
M111 |
EZ20M |
D1/D2 |
H64 |
M217 |
EZ20M |
G1 |
/ |
M52 |
EZ20M |
G2 |
H17 |
M53 |
EZ20M |
R |
H63 |
/ |
EZ20T |
B1/B2 |
H58 |
M111 |
EZ20T |
M |
H63 |
/ |
通过对图1~4的数据分布图进行初步分析,可知尺寸B1、B2在已采集数据维度范围内均为标准值2000.0,没有误差范围的波动,因此我们着重讨论EZ20M系列D1、D2、G1、G2,EZ20M、EZ20T系列的R、M参数的误差与温度的关联性分析。
根据表1的对应关系,查找DNC系统中记录的刀具号、子程序号等加工数据对应的加工时间,以加工时间为中介一一对应,即可实现Y方向关键尺寸与传感器采集的温度数据的对应关系,从而进一步进行后续分析。
3. 构件Y轴方向关键尺寸与轴承座温度、光栅尺温度关联性分析
观察上文绘制的质量项点分布折线图,我们对各个待处理的质量项点数据进行初步分析。对于质量项点B1、B2的数据我们在已采集数据维度范围内均为标准值2000.0,没有误差范围的波动,我们可以初步认为随着温度的改变,质量项点B1、B2的误差保持不变或变化很小,质量项点B1、B2的误差与温度之间没有显著的关联性。因此我们将拟合预测建模的重点放在EZ20M系列D1、D2、G1、G2,EZ20M、EZ20T系列的R、M参数数据上。
Figure 1.Distribution diagram of key dimensions B1 and B2 in the Y-axis direction of components
图1.构件Y轴方向关键尺寸B1、B2数据分布图
Figure 2.Distribution diagram of key dimensions G1 and G2 in the Y-axis direction of components
图2.构件Y轴方向关键尺寸G1、G2数据分布图
Figure 3.Distribution diagram of key dimensions D1 and D2 in the Y-axis direction of components
图3.构件Y轴方向关键尺寸D1、D2数据分布图
Figure 4.Distribution diagram of key dimensions R and M in the Y-axis direction of components
图4.构件Y轴方向关键尺寸R、M数据分布图
首先是EZ20M系列的G1、G2质量项点数据,通过观察质量项点分布折线图,相较于B1、B2,G1、G2质量项点数据在标准值的基础上出现了部分异常值,但是绝大部分数据仍然没有波动且为标准值,对于这种情况我们采用Matlab的函数回归器对其进行一次函数的拟合分析,预估拟合结果为y = [标准值]的一个常数函数,如果拟合结果符合预估猜想,且拟合优度R > 0.9,我们可以认为随着温度的改变,质量项点G1、G2的误差保持不变或变化很小,质量项点G1、G2的误差与温度之间没有显著的关联性,出现异常值的原因可能是由于随机误差造成的。
而对于EZ20M系列D1、D2以及EZ20M、EZ20T系列的R、M参数数据,我们将二维散点图绘制在坐标系内,初步观察很难预测二者之间的函数关系,因此不适用于通过函数拟合进行二者间的关系分析,综合考量我们同样选择采用神经网络拟合对二者之间的关联性进行分析预测,而在此处由于质量项点数据的数据量没有温度数据的数据量大,为了保证拟合出的模型对新数据和预测数据都具有较好的泛化能力,在此处选择泛化能力较强、预测精确性更高的贝叶斯正则化算法(Bayesian Regularization)进行拟合分析预测。
贝叶斯正则化算法(Bayesian Regularization)对模型复杂性进行惩罚,倾向于选择相对简单且能更好泛化的模型。它能够更好地拟合数据,从而提高机器学习模型的准确性,增加模型的稳定性和可解释性。下面从贝叶斯算法和正则化两个层面来阐述该拟合分析预测模型。
贝叶斯算法是基于贝叶斯定理提出的,贝叶斯定理的表达式为:
(1)
其中,
是在给定数D的情况下,参数
的后验概率;
是在参数
下观测到数据D的似然;
是参数
的先验概率;P(D)是是数据D的边际概率,通常作为归一化常数。先验概率(Prior Probability)是在观测到数据之前对参数的概率分布的估计。它反映了我们的先验信念或领域知识。似然函数(Likelihood)表示在给定模型参数的情况下观测到数据的概率分布。后验概率(Posterior Probability)是在考虑观测数据后,参数的概率分布。它是通过应用贝叶斯定理计算得出的。边际概率(Marginal Probability)是观测数据的概率,通常用于将后验概率归一化,以获得有效的后验分布。
朴素贝叶斯模型的基本思想是:对于给定的待分类项
,求解在此项出现的条件下各个类别yi出现的概率,哪个
最大,就把此待分类项归属于哪个类别。朴素贝叶斯算法的定义为:设
为一个待分类项,每个ai为X的一个特征属性,且特征属性之间相互独立。设
为一个类别集合,计算
,
,…,
,则我们可以得到:
(2)
在朴素贝叶斯算法中,待分类项的每个特征属性都是条件独立的,根据各特征值的独立性可以得到:
(3)
于是可得:
(4)
根据上述对于贝叶斯算法的阐述,贝叶斯算法在多次拟合过程中通过概率模型不断迭代构建出一个符合学习过程且能够对新数据进行预测的数学模型,这样以概率模型为基础的算法在进行神经网络拟合时极易出现过拟合的情况,导致整个模型的泛化能力严重下降,无法对后续数据进行精确预测。于是我们引入正则化的概念。
正则化其基本原理是在目标函数(也称为损失函数)中添加一个惩罚项,以减少特征权重的过大,从而使模型更容易泛化。我们选用Dropout技术对贝叶斯算法进行正则化,具体原理为:
在每一次训练迭代中,Dropout将以概率P(通常为0.5)随机选择一些神经元,并将它们的输出值置为0,同时将剩余神经元的输出值除以概率P。这样做的效果相当于每次训练迭代都训练了一个不同的网络,因为每次都会随机丢弃一些神经元。通过随机丢弃神经元,Dropout可以减少神经网络中神经元之间的依赖关系,使得网络更加稀疏、泛化能力更强。这样可以避免某些特定神经元过度依赖于其他神经元的情况,降低了过拟合的风险。此外,Dropout还能够提高模型的鲁棒性,因为每个神经元都要在其他神经元不可用的情况下进行预测,所以网络需要学习到冗余的特征表示,从而提高了模型的泛化能力。总结来说,Dropout正则化通过随机丢弃一部分神经元的输出,减少了神经网络中神经元之间的依赖关系,提高了模型的泛化能力,降低了过拟合的风险。我们可以假设随机变量
为0和1的概率分别为p和1 −p(丢弃和保留的概率),则任意神经元
可以表示为:
(5)
而
,所以有:
(6)
因此我们可以得出结论,利用Dropout正则化并不改变神经元的期望值,即不改变整个输入的期望,它只对贝叶斯算法起优化、防止过拟合的作用而不会改变神经网络拟合的最终结果。
如图5~8所示,根据对D1、D2与轴承座温度、光栅尺温度的关联性分析可以看出,通过线性拟合,可以认为在总体趋势上随着温度的升高,D1、D2的尺寸误差也会增大,但是二者并非是标准的线性相关,通过更深入的拟合分析可以发现D1、D2的尺寸误差随着轴承座、光栅尺温度的升高其实是呈阶梯式爬升的,即当温度增加到一定阈值时D1、D2的尺寸误差才会出现0.1的增加,这一方面要考虑是由于D1、D2的测量精度只精确到小数点后一位造成的,另一方面要考虑D1、D2的尺寸误差的变化是与温度区间相关的,而不是随着温度的线性变化而线性变化的,这就需要更大的数据量进行更精确的拟合,但是总体趋势上可以认为D1、D2的尺寸误差与轴承座温度、光栅尺温度是有关联性的,随着轴承座温度、光栅尺温度的增加,D1、D2的尺寸误差也会出现增大。
Figure 5.Fitting the correlation between key dimensions D1 and D2 in the Y-axis direction of the component and the temperature of the grating ruler
图5.构件Y轴方向关键尺寸D1、D2与光栅尺温度关联性拟合
Figure 6.Residual analysis of fitting the correlation between key dimensions D1 and D2 in the Y-axis direction of the component and the temperature of the grating ruler (R = 0.91)
图6.构件Y轴方向关键尺寸D1、D2与光栅尺温度关联性拟合残差分析(R = 0.91)
Figure 7.Fitting the correlation between key dimensions D1 and D2 in the Y-axis direction of the component and the temperature of the bearing seat
图7.构件Y轴方向关键尺寸D1、D2与轴承座温度关联性拟合
Figure 8.Residual analysis of fitting the correlation between key dimensions D1 and D2 in the Y-axis direction of the component and the temperature of the bearing seat (R = 0.91)
图8.构件Y轴方向关键尺寸D1、D2与轴承座温度关联性拟合残差分析(R = 0.91)
如图9和图10所示,根据对G1、G2与轴承座温度、光栅尺温度的关联性分析可以看出,通过一次函数线性拟合,拟合结果为y = [标准值]的一次函数(常数函数),且拟合优度R > 0.99,因此可以认为在总体趋势上G1、G2的尺寸误差是相对稳定的,虽然有部分数据值偏离标准值,但是没有明确的证据表明G1、G2的尺寸误差变化与轴承座温度、光栅尺温度的变化有关,出现偏离的数据可能是由于加工及测量过程中的随机误差所造成的,因此在总体趋势上可以认为G1、G2的尺寸误差与轴承座温度、光栅尺温度之间并没有显著的关联性。
Figure 9.Fitting the correlation between key dimensions G1 and G2 in the Y-axis direction of the component and the temperature of the grating ruler
图9.构件Y轴方向关键尺寸G1、G2与光栅尺温度关联性拟合
Figure 10.Fitting the correlation between key dimensions G1 and G2 in the Y-axis direction of the component and the temperature of the bearing seat
图10.构件Y轴方向关键尺寸G1、G2与轴承座温度关联性拟合
如图11~14所示,根据对R、M参数与轴承座温度、光栅尺温度的关联性分析可以看出,通过对参数和温度数据的拟合,可以认为在总体趋势上随着温度的升高,R、M的尺寸误差也会增大,虽然二者并非是标准的线性相关,但是拟合结果的拟合优度R > 0.9,相较于前文的参数D1、D2,R、M的参数误差增大与轴承座温度、光栅尺温度的升高有着更为明显的线性关系,同样的,线性相关并不完全标准一方面要考虑是由于R、M的测量精度只精确到小数点后一位造成的,另一方面要考虑加工及测量过程中的随机误差带来的影响,这就需要更大的数据量进行更精确的拟合,但是总体趋势上可以认为R、M的尺寸误差与轴承座温度、光栅尺温度是有较为显著的关联性的,随着轴承座温度、光栅尺温度的增加,R、M的尺寸误差也会出现增大,且呈现出较为明显的线性相关性。
Figure 11.Fitting the correlation between key dimensions R and M in the Y-axis direction of the component and the temperature of the grating ruler
图11.构件Y轴方向关键尺寸R、M与光栅尺温度关联性拟合
Figure 12.Residual analysis of fitting the correlation between key dimensions R and M in the Y-axis direction of the component and the temperature of the grating ruler (R = 0.93)
图12.构件Y轴方向关键尺寸R、M与光栅尺温度关联性拟合残差分析(R = 0.93)
Figure 13.Fitting the correlation between key dimensions R and M in the Y-axis direction of the component and the temperature of the bearing seat
图13.构件Y轴方向关键尺寸R、M与轴承座温度关联性拟合
Figure 14.Residual analysis of fitting the correlation between key dimensions R and M in the Y-axis direction of the component and the temperature of the bearing seat (R = 0.97)
图14.构件Y轴方向关键尺寸R、M与轴承座温度关联性拟合残差分析(R = 0.97)
4. 一个自然日周期内温度变化趋势分析
如图15和图16所示,将时间–轴承座温度、时间–光栅尺温度的二维散点图绘制在坐标系内,初步观察很难预测二者之间的函数关系,因此不适用于通过函数拟合进行二者间的关系分析,综合考量我们选择采用神经网络拟合对二者之间的关联性进行分析预测,采用经典Levenberg-Marquardt算法进行拟合分析预测。
Figure 15.Daily variation data record of bearing seat temperature
图15.轴承座温度日变化数据记录
Figure 16.Daily variation data record of grating ruler temperature
图16.光栅尺温度日变化数据记录
Levenberg-Marquardt算法是一种迭代技术,该算法结合了牛顿法和梯度下降法的优点,能够实现快速收敛,同时避免陷入局部最小值。Levenberg-Marquardt算法的基本思想是在每次迭代过程中,通过对损失函数的海森矩阵进行近似,计算出能使损失函数最小化的步长,从而更新模型参数。这个过程不断重复,直到损失函数达到预设的精度要求或迭代次数达到预设的上限。Levenberg-Marquardt算法的优点在于它能够处理非线性的问题,并且在求解过程中能够自适应地调整步长,避免因步长过大而跳到非预期的局部最小值。同时,该算法也需要计算损失函数的海森矩阵和雅可比矩阵[5]。
利用Levenberg-Marquardt算法解决神经网络回归拟合问题时,优化目标f具有平方和形式:
(7)
将模型输出线性化可得:
(8)
代入第i个样本的梯度值可得:
(9)
式中Ym、Y是所有样本输出组成的向量和模型输出向量。上式可以用来求解最优
使f取得极值,因此将其对
求导,可以得到:
(10)
于是可以得到对应的迭代关系为,在实际建模应用时,加入阻尼因子
就可以得到广泛的Levenberg-Marquardt迭代算法:
(11)
关于阻尼因子我们需要注意,当
时,上式等价于不改变;当
较大时,上式将是一个具有小步长的一阶梯度下降法。因此,可以在初始阶段选择一个较大的
,随着迭代的进行逐步减小
,加快其收敛速度,若性能得不到提升,则增大
。若初始阶段拟合程度不够好时,
和真实值之间的差距就较大,此时过小的
未必能提高拟合效果,反而可能使其变差。因此,需要一个较大的
使其变为一个小步长的梯度下降法。
我们在使用Levenberg-Marquardt算法对时间–轴承座温度、时间–光栅尺温度之间的关系进行建模拟合预测时,按照以下步骤进行:
1) 定义目标函数:将拟合问题转化为目标函数最小化的问题。目标函数通常是通过对数据观测值和模型预测值之间的差异(残差)进行平方和计算得到的。
2) 初始化参数:为模型中的参数设置初始值。
3) 迭代优化:
a) 计算雅可比矩阵:根据当前参数值计算目标函数对各个参数的偏导数,形成雅可比矩阵。
b) 计算海森矩阵:通过当前的参数值和雅可比矩阵计算出海森矩阵的近似值。
c) 更新参数:利用Levenberg-Marquardt公式更新模型的参数,使目标函数值更小。
d) 判断收敛:检查更新后的参数是否满足收敛条件,如目标函数值的改变量小于预设的阈值或迭代次数达到预设的上限。
4) 阻尼Gauss-Newton法:在每次迭代过程中,通过加入阻尼项,使求解更加稳定。阻尼项的大小根据收敛情况和模型复杂度自适应调整。
5) 终止条件:当满足收敛条件或达到预设的迭代次数上限时,停止迭代,输出当前模型参数作为拟合结果。
需要特别注意的是,在使用Levenberg-Marquardt算法时,需要多次计算目标函数、雅可比矩阵和海森矩阵的近似值,因此需要较大的计算量和存储空间。同时,该算法也需要根据具体情况调整阻尼项的大小和收敛条件,以保证求解的稳定性和准确性。我们还应该时刻关注拟合过程中隐藏层的个数,避免出现拟合程度不够和过拟合的情况。
如图17~20所示,使用Levenberg-Marquardt算法对轴承座温度日变化、光栅尺温度日变化的拟合结果显示拟合优度R > 0.99,说明拟合结果能够很好的说明轴承座温度、光栅尺温度在一日内随时间的变化情况,同时能够对一日内任意时间的温度进行较好的预测。观察拟合结果可以发现,轴承座在一日内的温度总体呈上升趋势,但是轴承座温度在起始和结尾段变化率较小,在一日中14~17时温度随时间变化率较大,一方面要考虑这一段时间处于加工最密集的时间段,加工量的增加引起了轴承座温度的升高,另一方面需要考虑14~17时为一日内温度最高的时间点,外界温度对加工过程中温度的升高形成正反馈,促进了轴承座温度的升高。但是温度的总体上升幅度并不大,ΔT< 2.5℃。
Figure 17.Fitting of the temperature change trend of the bearing seat within a natural day
图17.一个自然日内轴承座温度变化趋势拟合
Figure 18.Residual analysis of fitting the trend of temperature changes in bearing seats within a natural day (R = 0.99)
图18.一个自然日内轴承座温度变化趋势拟合残差分析(R = 0.99)
光栅尺温度在一日内总体同样呈上升趋势,但是相较于轴承座温度其整体变化率比较平均,线性相关性更高,光栅尺温度变化与时间更接近与正比例关系,温度的总体上升幅度比轴承座更小,ΔT< 0.7℃。综合分析轴承座温度日变化及光栅尺温度日变化,整体温度较为稳定,变化幅度并不大,考虑加工机床内存在温度补偿或温度负反馈调节系统。
Figure 19.Fitting of the temperature change trend of the grating ruler within a natural day
图19.一个自然日内光栅尺温度变化趋势拟合
Figure 20.Residual analysis of fitting the trend of temperature changes in grating ruler within a natural day (R = 0.99)
图20.一个自然日内光栅尺温度变化趋势拟合残差分析(R = 0.99)
5. 结论
基于制造数据对构架加工质量的波动溯源(即加工精度误差),着重处理了加工质量波动与光栅尺温度、轴承座温度两个关键位置的温度数据的关联性拟合分析,我们可以得到如下结论:构架的加工质量与轴承座温度、光栅尺温度之间都具有较强的关联性,但是不同位置的关联性又存在着不同,Y轴关键尺寸D1、D2随着温度的升高,加工误差会随之增大但并不是线性相关而是呈阶梯式爬升的。而Y轴关键尺寸R、M随着温度的升高,加工误差同样会随之增大,但是不同的是此时呈现出较为明显的线性相关性。至于Y轴关键尺寸G1、G2的变化与温度数据之间则没有明显的关联性。
此外,通过分析一个自然日内温度数据的变化趋势可以发现,无论是轴承座温度还是光栅尺温度总体都呈上升趋势,但是幅度并不大,温度变化范围较为有限。结合对加工质量与温度数据之间的关联性的分析可知,应该对一个自然日内靠后的加工着重关注,随着温度的升高,加工误差出现的概率也随之增大,加工质量的波动性越来越大,加工质量出现下降。
通过对温度与加工质量之间的关联性分析,不仅确定了温度是造成加工质量波动的源头性问题之一,同时也为加工过程中温度参数的控制、调整提供了理论依据,更为其它参数与加工质量波动的关联性研究提供了模式参考。