1. 引言
关于非线性规划问题,已有不少不可行稳定点和算法。例如Byrd,Curtis与Nocedal [1]提出了SQP算法,在一组条件下可以保证算法超线性收敛到一个
-范数度量的不可行稳定点。Burke,Curtis与Wang [2]考虑具有等式和不等式约束的一般非线性规划问题,证明了他们所提的SQP算法可以全局并且快速收敛到KKT点,或者超线性或二次收敛到
-范数度量的不可行稳定点。Dai,Liu与Sun [3]提出了一个原始–对偶内点方法,并证明了该内点方法当原始问题可行时,在一定条件下超线性或二次收敛到问题的KKT点;当问题不可行时,则超线性或二次收敛到
-范数度量的不可行稳定点。
这些算法都是求解约束条件不可行性度量的某个稳定点,这样的稳定点与原问题的目标函数没有任何关系,并不是最小约束违背优化问题的解[4]。因此有必要考虑在最小约束违背的点集上极小化目标函数。Dai和Zhang [5]依据Lipschitz连续优化的最优性理论,提出了L-稳定点的概念,并构造了求解最小约束违背的非线性凸规划问题的惩罚函数方法和用于求解最小约束违背的非线性凸优化问题等价MPCC问题的光滑Fischer-Burmeister函数方法。
然而,惩罚函数方法并不是精确的,当惩罚参数较大时,惩罚函数方法会出现计算困难,并且光滑函数方法只能收敛到问题的L-稳定点。由于约束规范不同导致无法确定L-稳定点和S-稳定点之间的关系。为了克服惩罚函数方法和光滑函数方法在求解最小约束违背优化问题的局限性,对最小约束违背凸优化问题值得重新考虑新的理论和算法。Chiche和Gilbert [6]的研究为我们提供了有价值的线索,他们证明了增广拉格朗日方法可以处理一个不可行的凸二次规划问题,这促使我们考虑用增广拉格朗日方法来处理最小约束违背的非线性凸优化问题。
本文采用增广拉格朗日方法求解最小约束违背优化等价的MPCC问题,进而达到求解最小约束违背优化问题的目的,并证明了增广拉格朗日方法生成的点列收敛到该等价MPCC问题的W-稳定点。
2. 基于不可行性度量的数学规划模型
本节考虑如下形式的非线性规划问题
(2.1)
其中用
,
,
。记问题(2.1)的可行域:
基于上述非线性规划问题,为后续讨论需要,引入问题的不可行性度量。
定义2.1 [5]函数
称为约束
的不可行度量,如果存在递增连续函数
满足
,使得
其中
是由
到
在
的范数
下的距离。
显然,
依赖于函数
和范数
。本文中采用
,范数
采用标准的欧式范数,即
-范数。
在上述不可行性度量下,引入在具有最小约束违背点集上极小化目标函数
的数学模型。
定义2.2 [5]对于约束
的一个不可行度量
,与
相联系的最小约束违背的极小化目标函数
的数学模型定义为
(2.2)
显然,如果可行域
非空,那么
,
,问题(2.2)恰好就是原始问题(2.1)。因此,问题(2.2)可以被视为原始问题(2.1)的拓广。
在定义2.2中,没有阐述
的含义,要看具体情况如何约定。如果
是凸函数,显然这一集合就是全局极小点的集合。然而,如果
是非凸函数(比如问题是可行的,当
是非凸时就是这一情形)。
可以理解为局部极小点,甚至是稳定点集。在非凸优化的情形,不可行性检测是非常难的问题。
对
,
,约束的最小违背定义为下述问题的最优值
(2.3)
最小约束违背的点集定义为
在S上极小化f的问题是
(2.4)
用
记问题(2.4)的下层问题,即
利用与
的关系,有
其中
,
,其中
,
。容易验证,
是问题(2.1)的一个不可行性度量。问题
的最优解可表示为
所以,问题(2.4)可等价地表示为
(2.5)
容易验证,如果h和g是可微的,则
是可微的,且满足
(2.6)
以下讨论最小约束违背的非线性凸优化问题,将从模型(2.5)出发,并利用公式(2.6)解决该问题。
3. 最小约束违背非线性凸优化
3.1. 最小约束违背非线性凸优化等价的MPCC问题
考虑下述非线性凸优化问题
(3.1)
其中f是一光滑的凸函数,
,
,且每一个
都是凹的光滑函数。此种情况下,函数
是凸函数,从而问题(2.5)是凸优化问题,可被简化为
(3.2)
尽管问题(3.2)是一个凸优化问题,其约束处理并不容易,因为这些约束是非光滑的等式,需要将约束转化为光滑约束,构造数值算法。通过引入辅助向量
,可将(3.2)中的约束表示为
为讨论方便,定义
,上述系统可以表示为
其中
(3.3)
因此,问题(2.5)等价地表示为
(3.4)
映射F在
的Jacobian矩阵具有形式
(3.5)
为后续讨论方便,我们记
,
。
用
记问题(3.4)的可行域,即
那么问题(3.4)可被简化为如下的MPCC问题
(3.6)
3.2. 等价MPCC问题的必要性最优性条件
本节主要讨论MPCC (3.6)的最优性条件,下面我们首先来回顾一些符号和定理。定义下述指标集合
为了得到
的显示表达式,我们首先给出抽象约束集合的切锥、法锥形式。
定理3.1 [7]设
,则对
,有
进而有
在基本约束规范成立的条件下,抽象约束集合的切锥、法锥形式具体如下:
定理3.2 [8] MPCC (3.6)的可行域为
,其中
是一个闭集合,
是一个光滑连续可微映射,
,
,则:
1)
.
2) 如果基本约束规范在
处成立,即:
则
。
3) 当
时,
在
处正则,
在
处正则,则
在
处正则,得
。
下面给出在基本约束规范成立的条件下,MPCC问题的W-稳定点概念。
定理3.3 设
为MPCC (3.6)的局部最优解,且该点处基本约束规范成立,当
时,严格互补松弛条件成立,则
为W-稳定点。即存在
,满足
证明 由定理3.2可知,MPCC问题的可行域集合的法锥形式如下:
因为
,由基本最优性条件可得
所以存在
,有
由定理3.1可知,当
时,我们有
,那么如果
,有
;当
时,我们有
,那么如果
,有
。
由此可知
是W-稳定点。
4. 增广拉格朗日方法
对于等式约束优化问题
对这一等式约束优化问题,Powell [9]、Hestenes [10]在1969年提出用增广拉格朗日方法来求解,首先将上述问题转化为
的无约束优化问题,这里
是罚参数,
是增广拉格朗日乘子的近似。该方法可以通过对
进行迭代,得到近似最优解。
本节首先将问题(3.6)中的互补约束表示为拉格朗日函数的形式,它的拉格朗日函数
为
(4.1)
其中关于
的梯度和Hessian矩阵如下:
问题(3.6)的增广拉格朗日函数
为
(4.2)
其中
是一个罚参数,
表示欧几里得
-范数。则上述增广拉格朗日对偶问题为
(4.3)
求解该对偶问题的增广拉格朗日方法迭代格式如下:
定理4.1 [11]设
为
的一个稳定点,则对任意的
,
也是
的一个稳定点,而且
。反之也成立。
证明
的梯度表达式为
(4.4)
(4.5)
(4.6)
(4.7)
如果
是
的一个稳定点,那么有
因此,由(4.4) (4.5) (4.6) (4.7)可知,对任意的
,有
即
是
的一个稳定点。进一步,把
代入(4.2)即得
。
同样的,当
有
。
这说明
是
的一个稳定点。把
代入(4.2)就可以得到
最后,我们证明采用增广拉格朗日方法用于求解该等价MPCC问题所生成的点列收敛到该等价问题的W-稳定点。
定理4.2 设
为增广拉格朗日对偶问题(4.3)的KKT稳定点序列,假设
是它的聚点,在
处MPCC-LICQ成立,则当
时,
是问题MPCC (3.6)的W-稳定点。
证明 因为
为问题(4.3)的KKT稳定点序列,那么
记
,
可以推出
由上式可得
令
(4.8)
即
(4.9)
下证式(4.8)中的乘子序列
有界。如果
无界,那么存在一个子集K,对任意的
,
,有
。(4.9)式两边同时除以
并取极限,当
时,有
当
时,
当
时,
因为
与在
处满足MPCC-LICQ矛盾,所以
有界。
不失一般性,设
收敛于
设
当
时,
,
,
时,即
。同理,当
时,可得
。由H,G连续可微,对(4.9)取极限,得
,
即证得
是问题MPCC(3.6)的W-稳定点。
5. 结论
本文主要针对约束不相容的凸优化问题建立了最小约束违背优化模型。当约束相容时,模型退化为原始问题。当约束不相容时,模型可被重新表述为MPCC问题。并证明了该等价MPCC问题的W-稳定性。将增广拉格朗日方法用于求解该等价问题,证明了该方法生成的点列收敛到该等价问题的W-稳定点。
对于最小约束违背优化,还有许多问题值得研究。当不知道可行域是否为空集时,最小约束违背优化问题总是可行的,这是它的优点。如果约束问题是可行的,那么问题涉及的不可行性度量
通常是光滑的,但不是二次可微的,这会带来计算上的困难。本文只处理了最小约束违背的凸优化问题,增广拉格朗日方法能否处理最小约束违背的非凸优化问题需要继续思考和研究。