1. 介绍
2005年,Qi在[1]中提出了张量特征值的概念,即,令
是一个m阶n维张量,若存在一个数
和非零向量
满足
,
则
叫做张量
的特征值,x叫做
所对应的特征向量,其中
和
都表示一个n维向量,且
若
和x都属于实数域,则
叫做张量
的H-特征对。此外,Qi也在[1]中定义了Z-特征值,即,若存在数
和向量
满足
(1.1)
则称特征对
是Z-特征对。值得注意的是,
和x属于复数域时,称特征对
为E-特征对。
张量Z-特征值在许多实际问题中都被运用,如自动控制[2],人脑科学[3],统计数据分析中的最佳秩一逼近[4]等领域。为此,很多学者对张量Z-特征值的求解展开了研究。
目前,已经有许多计算对称或非负张量Z-特征对的算法,但是结合[5]中的张量绝对值方程
(1.2)
以及张量Z-特征值的一般形式(1.1), 考虑形式为
(1.3)
的特征值问题。其中
是非奇异张量,
,受[6]启示,(1.3)可改写成
其中
,是一个对角矩阵,其主对角线元素
满足
该问题涉及到绝对值,其在原点处是不可微的。据我们所知该问题还未研究,这便是本文的研究意义。
求解(1.3)中
和x的过程实际上是求解约束化非线性方程组的问题。非线性方程组的求解方法有许多,比如说梯度投影法、罚函数法等。在本文,我们用梯度神经网络方法求解含有绝对值形式的张量特征值和特征向量。
2. 构造梯度神经网络模型
梯度神经网络现在已经被认为是数值计算中的一个强大的算法[4],在矩阵求逆和Drazin逆[5],线性和非线性方程组[6]的求解等领域有着十分重要的作用。鉴于其高速处理特性和在实际应用中硬件实现的方便性,更多梯度神经网络求解线性方程组与非线性方程组问题见[7]-[10]。
为了监测和控制(1.3)的求解过程,根据梯度神经网络方法设计思路[11],首先定义一个误差函数
(2.1)
为了迫使
收敛于零。类似于[12]的工作,接着定义一个监测误差函数
显然,当监测误差函数
收敛于零时,
也收敛于零。
为了实现
收敛到零的目的,根据梯度神经网络设计方法,监测误差函数的负梯度方向作为下降方向,即
(2.2)
把(2.2)展开,有
(2.3)
其中
和
。
采用欧拉差分对(2.3)进行离散,得
(2.4)
其中
是步长,
,
应足够小。
故获得了一个计算(1.3)中
和x的算法步骤,如下
步骤一:给定一个张量
,误差参数
,最大代步数
和初始向量
;
步骤二:令
,
,
;
步骤三:当
时,计算
和
步骤四:计算
步骤五:当
时,输出
;否则返回第三步;
步骤六:结束。
为了证明算法的有效性,在下一小节,将分析算法的稳定性和收敛性。
3. 收敛性分析
本小节,我们讨论所提出的梯度神经网络模型(2.3)的一些收敛性质,首先我们给出定理3.1。
定理3.1方程(2.1)的每一个解
都是系统(2.3)的平衡点。反过来,若
是非奇异,那么系统(2.3)的平衡点是方程(2.1)的解。
证明:前一部分,显然成立。现证明第二部分。
假定
是系统(2.3)的平衡点,即
由于
是非奇异矩阵,
,进而有
。因此
。证毕。
假定
满足
。由[13]可知,平衡点
附近找到邻域
,
使得
是非奇异矩阵。
定理3.2若张量
满足
。初始向量
,则从初始向量
出发的x都会收敛到
。
证明:构造一个Lyapunov函数
求
关于时间t的导数得
(3.1)
其中矩阵
是对称正定。则对任意
,
是非奇异的,我们有
其中
和
是矩阵H的最小和最大特征值。函数
是单调递增的奇函数,所以
,再加上
我们可以得到
那么
参数
,故
关于时间t的导数满足
因
是正定函数,
是负定函数,满足Lyapunov稳定性条件,故误差函数
会收敛于零。换句话说,状态向量
在
处是渐近稳定的。证毕。
定理3.3模型(2.3)的收敛速率为
,其中
。
证明:根据(3.1),有
(3.2)
求解(3.2)得
因此
显然,模型的收敛速率为
。证毕。
4. 数值实验
本小节,我们用一些数值例子来表明提出的梯度神经网络求解该问题的有效性和可行性。例4.1和例4.2均在Python上实验。
例4.1[14]令张量
,其具体值如下
用梯度神经网络来求解例4.1时,选择误差
和最大迭代步数
。同时,为了方便,取
,初始特征值
和特征向量
,获得了部分数值结果见表1。
Table1.Partial results calculated by layered neural networks (1)
表1.梯度神经网络计算出的部分结果(1)
|
x |
CPU(s) |
IT |
|
error |
−3.1547 |
|
0.0117 |
19 |
1 |
6.72 × 10−8 |
−3.2525 |
|
0.0053 |
17 |
1.1 |
4.62 × 10−8 |
−3.2525 |
|
0.0076 |
18 |
1.08 |
4.01 × 10−8 |
例4.2[15]令张量
,其具体值如下
其他
,其中
。
用梯度神经方法求解张量
在
时的特征值和特征向量,选择初始特征值
,初始特征向量
且误差
。为了简便,取
。获得了部分数值结果见表2。
Table 2.Partial results calculated by layered neural networks (2)
表2.梯度神经网络计算出的部分结果(2)
|
x |
CPU(s) |
IT |
|
error |
2 |
|
0.0024 |
10 |
0.9 |
1.02 × 10−7 |
2 |
|
0.0003 |
1 |
1 |
0 |
2 |
|
0.0024 |
11 |
1.08 |
1.02 × 10−7 |
5. 总结
在本文中,利用梯度神经网络方法求解含有绝对值形式的张量特征值和特征向量,数值实验表明了该方法的有效性,不足之处有两点:第一,梯度神经网络方法中的参数
是影响收敛时间和误差的,选择最佳的参数
是目前急需解决的问题;第二,新形式的张量特征值问题涉及到绝对值函数
,由于
是非光滑函数,根据已有研究张量绝对值方程的工作,绝对值函数可以用光滑函数逼近。能否用光滑函数逼近
,然后再用神经网络方法求解,这也是一个值得思考的问题。