1. 引言
由于神经网络(NNs)在各种技术领域的成功应用,近年来对其进行了深入研究。NNs的应用取决于其动态行为特征,如稳定性、周期解、分岔、混沌和协作行为。其中,稳定性是理论研究中的一个关键问题,也是众多实际应用的前提 [1] [2] ,并且在不同的应用中期望NNs具有不同的稳定性。例如,在优化问题中,期望NNs具有唯一的稳定平衡点 [3] 。而在联想记忆中,当NNs执行联想记忆功能时,平衡点被视为存储在网络中的信息。因此,NNs拥有的平衡点越多,其记忆存储容量就越大。所以,需要NNs具有多个局部稳定平衡 [4] [5] 。综上所述,多稳定性具有重要的理论意义和应用价值。
激活函数的类型对平衡点的数量和记忆存储能力起着重要作用。目前,对具有简单激活函数(如饱和函数 [6] 和S形函数 [7] )的NNs的多稳定性已经进行了深入研究。在 [8] 中,分析了具有原点对称阶梯激活函数的递归神经网络(RNNs)的多稳定性。结果表明,具有这种激活函数的RNNs可以具有
个平衡点,其中
个是局部指数稳定的。除了单调函数外,具有非单调激活函数的RNNs的多稳定性也是一个热门话题。在 [9] 中,研究了具有Gaussian激活函数的RNNs的多稳定性,揭示了这样一个系统最多可以拥有2n个稳定平衡点,并且它的每个解轨迹都会收敛到稳定平衡点。在 [10] 中,发现了具有非单调Mexican-hat-type函数n维NNs可以最多具有3n个平衡点。在 [11] 中,研究了具有不连续非单调分段线性激活函数的神经网络的多稳定性,并且发现不连续激活函数在多稳定性具有着更良好的性质 [12] 。为了获得更大的记忆存储容量,将Morita激活函数扩展为Morita-like函数。结果表明,具有该激活函数的NNs可以产生
个稳定平衡。
受到上述启发,本文提出了一类新的不连续非单调激活函数。之后,深入研究了时滞递归神经网络(DRNN)的多稳定性和局部指数稳定性并且通过增加激活函数的峰值点来增大NNs的记忆存储容量。最后,提供了一个数值例子,展示了结论的准确性。
2. 问题陈述
2.1. 模型描述
在本文中,将考虑如下DRNN:
(2.1.1)
其中
是第i个神经元的状态,
表示第i个神经元的自反馈,
和
分别表示第j个神经元在第i个神经元上的连接权重,
是一个常量外部输入,
满足
(
为常数)。
由于不连续非单调激活函数在增大记忆存储容量方面有着良好的性质,本文提出了一类新型的不连续非单调激活函数。
(2.1.2)
其中
,
,
,
,
是常数并且
。
和
是连续且单调递增的函数,
和
是连续且单调递减函数,
,
并且
,
。
有两个峰值点
和
。
为了便于描述,我们定义了以下符号,
由此对
进行状态空间划分:
显然可见,
有
个元素。
2.2. 平衡点的定义
由于具有激活函数(2.1.2)的DRNN(2.1.1)是具有不连续点的微分方程组,因此我们需要说明神经网络(2.1.1)解的含义。定义
并且
。
定义2.2.1. 如果
满足以下条件:
1)
在
上是连续的,并且在
上是绝对连续的。
2) 对于几乎所有的
,存在可测函数
使得
且满足
,
,
则
是DRNN(2.1.1)的一个解。
定义2.2.2. 如果向量
满足:
,
,则称之
为DRNN(2.1.1)的平衡点。
3. 主要结果
3.1. 平衡点的存在性分析
首先,我们将分析位于激活函数(2.1.2)连续区域中的平衡点数目。
引理3.1.1 对
,如果以下条件成立:
(3.1.1)
(3.1.2)
(3.1.3)
则具有激活函数(2.1.2)的DRNN(2.1.1)有
个平衡点位于
。
证明:从集合
中任意选取一个元素为
其中
是
的子集,并且
,
。我们将证明DRNN(2.1.2)在位于
中至少有一个平衡点。
注意,DRNN(2.1.1)的平衡点与以下无延迟神经网络的平衡点相同
(3.1.4)
令
(3.1.5)
情形1:当
时,根据(3.1.1)和(3.1.5)可得:
并且
,由于
在
连续,所以至少存在一个
使得
。
情形2:当
时,根据(3.1.2)和(3.1.5)可得:
结合
,由于
在
上连续,所以至少存在一个
使得
。
情形3:当
时,根据(3.1.1)可得
,结合
,由于
在
上连续,所以至少存在一个
使得
。
情形4:当
时,根据(3.1.2)可得
,结合
,由于
在
上连续,所以至少存在一个
使得
。
情形5:当
时,根据(3.1.1)可得
,结合
,由于
在
上连
续,所以至少存在一个
使得
。
情形6:当
时,根据(3.1.3)和(3.1.5)可得
,并且
,由于
在
上连续,所以至少存在一个
使得
。
定义映射
:
满足
。显然,映射
连续。根据Brouwer不动点定理,
至少存在一个不动点
,此不动点也是DRNN(2.1.1)位于
中的一个平衡点。由于
被划分为了6个区间,因此具有不连续非单调激活函数(2.1.2)的DRNN(2.1.1)在
中至少存在
个平衡点。
注3.1.1 不等式(3.1.1)~(3.1.3)表明了
,
。事实上,根据(3.1.1)和(3.1.2),我们可以得到
,使得
,由于
,因此这意味着
,
。
上述给出的引理3.1.1只考虑了平衡点的所有分量都位于激活函数的连续区域的情况,但是是否存在一些平衡点,其部分分量正好位于激活函数的不连续点。这个问题将在下列引理中被讨论。
引理3.1.2 假设(3.1.1)~(3.1.3)成立,具有非单调不连续激活函数(2.1.2)和DRNN(2.1.1)至少存在
个平衡点位于激活函数
的不连续区域。
证明:对于任何点
,定义一个集合
。
表示集合
中元素的数量。在下文中,我们将根据
的值分为两种情形讨论。
情形1:
,这意味着向量
只有一个分量
。为了不失一般性的情况下,我们假设
。接下来,我们将证明
是DRNN(2.1.1)的一个平衡点。根据定义2.2.2,我们仅需要满足:
(3.1.6)
(3.1.7)
我们将首先证明对于任意的
,(3.1.6)都成立。注意到
,我们有
。由
,(3.1.1)和(3.1.3)可得:
(3.1.8)
(3.1.9)
因此(3.1.6)成立。
从
中任意选取一个区域:
其中
是
的子集,
,
。接下来,我们要证明(3.1.7)成立。对于任意的
,定义函数:
(3.1.10)
其中
。这就意味着
。接下来有六种可能的案例需要讨论。
1) 当
时,
,
且
。根据(3.1.1)和(3.1.10)可得:
由于
和
的连续性,因此,存在
使得
。
2) 当
时,
且
。根据(3.1.2)和(3.1.10)可得:
因此,存在
使得
。
3) 当
时,
,
且
。根据(3.1.1)和(3.1.10)可得
。因此,存在
使得
。
4) 当
时,
。根据(3.1.2)和(3.1.10)可得
。
因此,存在
使得
。
5)当
时,
,
且
。根据(3.1.1)和(3.1.10)可得:
因此,存在
使得
。
6) 当
时,
。根据(3.1.2)和(3.1.10)可得
。由于
和
的连续性,因此,存在
使得
。
定义映射
:
满足
。显然,映射
连续。根据Brouwer不动点定理,
至少存在一个不动点
并且满足(3.1.7)。因此,
是DRNN(2.1.1)的平衡点。由于
的任意性,
被划分成
,具有非单调不连续激活函数(2.1.2)的DRNN(2.1.1)具有
个平衡点,并且这
个平衡点的第一个分量
。
对于其他
种情况:
,可以类似讨论。因此,在情形1中,DRNN(2.1.1)至少存在
个平衡点。
情形2:对于其余的情况
,通过与情形1中相同的推理,我们可以得到神经网络至少存在
个平衡点。
综上所述,具有非单调不连续激活函数(2.1.2)的DRNN(2.1.1)至少存在
个平衡点位于所设计的激活函数的不连续点处。
结合引理3.1.1和3.1.2,我们可以得到的结论是具有非单调不连续激活函数(2.1.2)的DRNN(2.1.1)至少存在
个平衡点。下面的定理总结了上面得到的结果。
定理3.1.1 假设(3.1.1)~(3.1.3)成立,具有非单调不连续激活函数(2.1.2)的DRNN(2.1.1)至少存在
个平衡点,其中
个位于激活函数的连续区域,
个位于激活函数的不连续区域。
证明:结合引理3.1.1和3.1.2,我们可以得到具有非单调不连续激活函数(2.1.2)的DRNN(2.1.1)至少存在
个平衡点,
个位于激活函数的不连续区域。
3.2. 平衡点的稳定性分析
令
显然,
有
个元素,
有
个元素。在讨论平衡点的局部稳定性之前,我们首先证明
的正不变性,它将在稳定性定理中起着关键作用。
引理3.2.1 对
,如果以下条件成立:
(3.2.1)
(3.2.2)
(3.2.3)
那么
是DRNN(2.1.1)正不变集。
证明:首先,很容易看出,条件(3.2.1)~(3.2.3)意味着定理3.1.1中的条件(3.1.1)~(3.1.3)成立。因此,根据定理3.1.1,在引理3.2.1的条件下,可以保证DRNN(2.1.1)的
个平衡点的共存。
从集合
中任意选取一个集合:
其中
是
的子集,
,
。
情形1:假设存在
和
使得
和
,从而
。另一方面,根据(3.2.1)可得:
与
矛盾。因此,
不会逃离
。
情形2:假设存在
和
使得
和
,从而
。另一方面,根据(3.2.2)可得:
与
矛盾。因此,
不会从左侧逃离
。类似地,
不会从右侧逃离
。
情形3:假设存在
和
使得
和
,从而
。另一方面,根据(3.2.2)可得:
与
矛盾。因此,
不会从左侧逃离
。类似地,
不会从右侧逃离
。
情形4:假设存在
和
使得
(
是充分小的正数),
和
对于
。由于
是充分小的正数,根据(3.2.3)可得:
与
矛盾。因此,
不会从左侧逃离
。从这四种情形中,我们得到
是DRNN(2.1.1)的一个正不变集。
接下来,我们将证明位于
的平衡点是局部稳定的。令
,
,
,其中
,
。
定理3.2.1假设(3.2.1)~(3.2.3)成立,如果存在正常数
使得以下条件成立:
(3.2.4)
那么具有非单调不连续激活函数(2.1.2)和DRNN(2.1.1)至少有
个平衡点,其中位于
的
个是局部指数稳定的。
证明:假设
中的平衡点为
,令
,
。那么
的右上Dini导数
其中
或
。
根据(3.2.4),存在充分小的
满足下列不等式成立:
(3.2.5)
令
和
显然,
对于
。接下来,我们会证明
对于
。假设存在
和
使得
,
。基于上述假设,
。然而,
根据(3.2.5)可得,
。这与
矛盾。因此,当
时,
这意味着
会指数收敛到
中的平衡点
。
3.3. 定理的推广
与 [11] 相比,我们增加了激活函数的复杂性,提出了一类新的不连续非单调激活函数,并证明了具有这类新的激活函数的神经网络有
个平衡,其中有
个稳定平衡。更重要的是,需要满足的条件数量与 [11] 中的相同。因此,我们猜测增加激活函数的峰值可以在不增加计算复杂性的情况下增加稳定平衡的数量。接下来,我们继续增加峰值的数量,并提出以下激活函数:
(3.3.1)
其中
是常数并且
。
是连续且单调递增的函数,
和是连续且单调递减函数,
,
并且
,
。
有k个峰值点
。然后,可以得到以下两个定理。
推论3.3.1 对
,如果以下条件成立:
(3.3.2)
(3.3.3)
(3.3.4)
那么具有非单调不连续激活函数(3.3.1)的DRNN(2.1.1)至少存在
个平衡点,其中
个位于激活函数的连续区域,
个位于激活函数的不连续区域。
证明:与定理3.1.1和引理3.2.1的证明方法类似,因此省略证明。
在给出推论3.3.2之前,我们先令
,
,
,其中
。
。
推论3.3.2 假设(3.3.2)~(3.3.4)成立,如果存在正常数
使得以下条件成立:
(3.3.5)
那么具有非单调不连续激活函数(3.3.1)和DRNN(2.1.1)至少有
个平衡点,其中
个平衡点是局部指数稳定的。
证明:与定理3.2.1的证明方法类似,因此省略证明。
4. 数值仿真
我们将列举一个例子来说明本文理论结果的有效性。
例4.1:考虑2维时滞递归神经网络,其中
,
,以及
定义激活函数为:
(4.1.1)
激活函数(4.1.1)有两个峰值
和
。上述参数满足定理3.2.1的条件。根据定理3.2.1,DRNN(2.1.1)存在
个平衡点,其中有
个平衡点是局部指数稳定的。事实上,仿真结果也验证了理论结果的正确性。
和
的瞬态行为如图1所示。图2显示了具有500个随机初始值的DRNN(2.1.1)的解轨迹,其中16个红色填充的圆圈表示局部指数稳定的平衡点。我们可以发现这500个随机初始值经过一段时间都收敛到了局部稳定平衡点。图2中解的轨迹满足本文对稳定平衡点的证明,因此本文的结论是有效的。

Figure 1. Transient behavior of x1 and x2 in Example 4.1
图1. 例4.1中x1和x2的瞬态行为

Figure 2. Phase diagrams of
in Example 4.1
图2. 例4.1中
的相位图
5. 结论
为增加稳定平衡点的数量,本文提出了一类不连续非单调激活函数,并探索相应的DRNN(2.1.1)的多稳性。首先证明了具有这种激活函数的DRNN(2.1.1)在某些条件下可以产生
个平衡点,其中
个是局部指数稳定的。进一步,通过增加激活函数峰值点的数量k,DRNN(2.1.1)可以产生
个平衡点,其中
个是局部指数稳定的。与现有文献中的分段线性函数不同,本文采用的激活函数是不连续非单调分段函数,可以大大增加现有神经网络稳定平衡点的数量和记忆存储容量。