2. 基于不可行性度量的数学规划模型
本节考虑如下形式的非线性规划问题
(2.1)
其中用
,
,
。记问题(2.1)的可行域:
基于上述非线性规划问题,为后续讨论需要,引入问题的不可行性度量。
定义2.1
[5]
函数
称为约束
的不可行度量,如果存在递增连续函数
满足
,使得
其中
是由
到
在
的范数
下的距离。
显然,
依赖于函数
和范数
。本文中采用
,范数
采用标准的欧式范数,即
-范数。
在上述不可行性度量下,引入在具有最小约束违背点集上极小化目标函数
的数学模型。
定义2.2
[5]
对于约束
的一个不可行度量
,与
相联系的最小约束违背的极小化目标函数
的数学模型定义为
(2.2)
显然,如果可行域
非空,那么
,
,问题(2.2)恰好就是原始问题(2.1)。因此,问题(2.2)可以被视为原始问题(2.1)的拓广。
在定义2.2中,没有阐述
的含义,要看具体情况如何约定。如果
是凸函数,显然这一集合就是全局极小点的集合。然而,如果
是非凸函数(比如问题是可行的,当
是非凸时就是这一情形)。
可以理解为局部极小点,甚至是稳定点集。在非凸优化的情形,不可行性检测是非常难的问题。
对
,
,约束的最小违背定义为下述问题的最优值
(2.3)
最小约束违背的点集定义为
在S上极小化f的问题是
(2.4)
用
记问题(2.4)的下层问题,即
利用与
的关系,有
其中
,
,其中
,
。容易验证,
是问题(2.1)的一个不可行性度量。问题
的最优解可表示为
所以,问题(2.4)可等价地表示为
(2.5)
容易验证,如果h和g是可微的,则
是可微的,且满足
(2.6)
以下讨论最小约束违背的非线性凸优化问题,将从模型(2.5)出发,并利用公式(2.6)解决该问题。
3. 最小约束违背非线性凸优化
3.1. 最小约束违背非线性凸优化等价的MPCC问题
考虑下述非线性凸优化问题
(3.1)
其中f是一光滑的凸函数,
,
,且每一个
都是凹的光滑函数。此种情况下,函数
是凸函数,从而问题(2.5)是凸优化问题,可被简化为
(3.2)
尽管问题(3.2)是一个凸优化问题,其约束处理并不容易,因为这些约束是非光滑的等式,需要将约束转化为光滑约束,构造数值算法。通过引入辅助向量
,可将(3.2)中的约束表示为
为讨论方便,定义
,上述系统可以表示为
其中
(3.3)
因此,问题(2.5)等价地表示为
(3.4)
映射F在
的Jacobian矩阵具有形式
(3.5)
为后续讨论方便,我们记
,
。
用
记问题(3.4)的可行域,即
那么问题(3.4)可被简化为如下的MPCC问题
(3.6)
3.2. 等价MPCC问题的必要性最优性条件
本节主要讨论MPCC (3.6)的最优性条件,下面我们首先来回顾一些符号和定理。定义下述指标集合
为了得到
的显示表达式,我们首先给出抽象约束集合的切锥、法锥形式。
定理3.1
[7]
设
,则对
,有
进而有
在基本约束规范成立的条件下,抽象约束集合的切锥、法锥形式具体如下:
定理3.2
[8]
MPCC (3.6)的可行域为
,其中
是一个闭集合,
是一个光滑连续可微映射,
,
,则:
1)
.
2) 如果基本约束规范在
处成立,即:
则
。
3) 当
时,
在
处正则,
在
处正则,则
在
处正则,得
。
下面给出在基本约束规范成立的条件下,MPCC问题的W-稳定点概念。
定理3.3 设
为MPCC (3.6)的局部最优解,且该点处基本约束规范成立,当
时,严格互补松弛条件成立,则
为W-稳定点。即存在
,满足
证明 由定理3.2可知,MPCC问题的可行域集合的法锥形式如下:
因为
,由基本最优性条件可得
所以存在
,有
由定理3.1可知,当
时,我们有
,那么如果
,有
;当
时,我们有
,那么如果
,有
。
由此可知
是W-稳定点。
4. 增广拉格朗日方法
对于等式约束优化问题
对这一等式约束优化问题,Powell
[9]
、Hestenes
[10]
在1969年提出用增广拉格朗日方法来求解,首先将上述问题转化为
的无约束优化问题,这里
是罚参数,
是增广拉格朗日乘子的近似。该方法可以通过对
进行迭代,得到近似最优解。
本节首先将问题(3.6)中的互补约束表示为拉格朗日函数的形式,它的拉格朗日函数
为
(4.1)
其中关于
的梯度和Hessian矩阵如下:
问题(3.6)的增广拉格朗日函数
为
(4.2)
其中
是一个罚参数,
表示欧几里得
-范数。则上述增广拉格朗日对偶问题为
(4.3)
求解该对偶问题的增广拉格朗日方法迭代格式如下:
定理4.1
[11]
设
为
的一个稳定点,则对任意的
,
也是
的一个稳定点,而且
。反之也成立。
证明
的梯度表达式为
(4.4)
(4.5)
(4.6)
(4.7)
如果
是
的一个稳定点,那么有
因此,由(4.4) (4.5) (4.6) (4.7)可知,对任意的
,有
即
是
的一个稳定点。进一步,把
代入(4.2)即得
。
同样的,当
有
。
这说明
是
的一个稳定点。把
代入(4.2)就可以得到
最后,我们证明采用增广拉格朗日方法用于求解该等价MPCC问题所生成的点列收敛到该等价问题的W-稳定点。
定理4.2 设
为增广拉格朗日对偶问题(4.3)的KKT稳定点序列,假设
是它的聚点,在
处MPCC-LICQ成立,则当
时,
是问题MPCC (3.6)的W-稳定点。
证明 因为
为问题(4.3)的KKT稳定点序列,那么
记
,
可以推出
由上式可得
令
(4.8)
即
(4.9)
下证式(4.8)中的乘子序列
有界。如果
无界,那么存在一个子集K,对任意的
,
,有
。(4.9)式两边同时除以
并取极限,当
时,有
当
时,
当
时,
因为
与在
处满足MPCC-LICQ矛盾,所以
有界。
不失一般性,设
收敛于
设
当
时,
,
,
时,即
。同理,当
时,可得
。由H,G连续可微,对(4.9)取极限,得
,
即证得
是问题MPCC(3.6)的W-稳定点。