多集分裂等式问题作为分裂可行性问题的重要拓展,在图像重建、语言处理、地震探测等领域具有重要应用。本文针对欧氏空间中多输出集的分裂可行性问题进行研究,并提出了一种新颖的松弛方法。与传统方法不同,我们采用了对两个半空间交点的投影方法。在理论上,我们在特定条件下证明了该方法的收敛性。通过数值模拟实验,进一步证实了本算法在实际应用中的有效性。 The problem of multi-set splitting equations, an important extension of the split feasibility problem, has significant applications in fields such as image reconstruction, language processing, and seismic exploration. This paper investigates the split feasibility problem for multiple output sets in Euclidean spaces and proposes a novel relaxation method. Unlike traditional approaches, our method projects onto the intersection of two half-spaces. Theoretically, we prove the convergence of this method under certain conditions. Through numerical simulation experiments, the effectiveness of our algorithm in practical applications is further validated.
多集分裂等式问题作为分裂可行性问题的重要拓展,在图像重建、语言处理、地震探测等领域具有重要应用。本文针对欧氏空间中多输出集的分裂可行性问题进行研究,并提出了一种新颖的松弛方法。与传统方法不同,我们采用了对两个半空间交点的投影方法。在理论上,我们在特定条件下证明了该方法的收敛性。通过数值模拟实验,进一步证实了本算法在实际应用中的有效性。
多集分裂可行性问题,CQ算法,投影算法
Ya Zhu1, Yazheng Dang1*, Ding Ma1, Zhonghui Xue2
1Business School, University of Shanghai for Science and Technology, Shanghai
2Department of Information and Intelligent Engineering, Shanghai Publishing and Printing College, Shanghai
Received: Jan. 29th, 2024; accepted: Mar. 22nd, 2024; published: Mar. 29th, 2024
The problem of multi-set splitting equations, an important extension of the split feasibility problem, has significant applications in fields such as image reconstruction, language processing, and seismic exploration. This paper investigates the split feasibility problem for multiple output sets in Euclidean spaces and proposes a novel relaxation method. Unlike traditional approaches, our method projects onto the intersection of two half-spaces. Theoretically, we prove the convergence of this method under certain conditions. Through numerical simulation experiments, the effectiveness of our algorithm in practical applications is further validated.
Keywords:Multi-Set Split Feasibility Problem, CQ Algorithm, Projection Method
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
分裂可行性问题 [
x ∈ C , B x ∈ Q . (1)
基于以上问题,本文研究的是N维欧氏空间中的多集分裂可行性问题,设C和 Q i , i = 1 , ⋯ , N ,分别为H和 H i , i = 1 , ⋯ , N 中的非空、闭合且凸子集。对于给定上述的H, H i 和 B i ,多输出集的分割可行性问题(简称SFPwMOS) [
x * ∈ Γ : = C ∩ ( ∩ i = 1 N B i − 1 ( Q i ) ) ≠ ∅ , i = 1 , 2 , ⋯ , N . (2)
当 i = 1 时,修改后的问题等同于初始的分裂可行性问题。
多输出集的分割可行性问题(SFPwMOS)的研究及其在图像重建、语言处理、地震探测等领域的应用,体现了它跨学科的价值和广泛的应用前景。特别是在图像重建领域,该问题的解决方案极大地增强了对受噪声干扰图像处理的能力 [
近年来,有关此问题的研究不断深入,涌现出许多创新算法和理论。Reich [
x k + 1 : = α k f ( x k ) + ( 1 − α k ) P C ( x k − λ k ∑ i = 1 n B i T ( I − P Q i ) B i x k ) ,
其中, f : C → C 是H到其自身的严格压缩映射 [
x k + 1 = x k + λ k ( P C ( x k ) − x k ) . (3)
加速算法的收敛,其中 λ k 是控制迭代步长的外推因子。基于此基础,Zhaoa等人(2012)进一步优化了这种方法 [
λ k + 1 = min { λ max , x k − x k − 1 , x k − P C ( x k ) x k − P C ( x k ) 2 }
来增强算法的灵活性和应用范围。随着研究的深入,Cui等人(2013)转向探索分裂共同固定点问题(SCFP) [
x k + 1 = α k x k + ( 1 − α k ) T ( x k )
该方案在一些温和的假设下证明了其强收敛性。此外,Latif等人(2016)在无限维希尔伯特空间中为广义多集分裂可行性问题(GMSSFP)引入了基于粘度逼近方法的新算法 [
λ k = 〈 x k − P C ( x k ) , x k − x k − 1 〉 ‖ x k − P C ( x k ) ‖ 2 ,
旨在提高多集分裂可行性问题求解的实用性。为了进一步优化算法并提高其适应性,Taddele等人(2020)又提出了一种带有惯性外推的迭代算法 [
算子范数的迭代算法 x k + 1 = x k − λ k A ∗ ( A x k − b ) ,并证明了其强收敛性。
最近,Sunthrayuth等人(2021)在特定的巴拿赫空间框架内提出了一种求解多集分裂可行性问题的广义自适应方法 [
我们用H表示N维欧氏空间,用I表示上的恒等算子。对于可微函数f,用 ∇ f 表示f的梯度。给定序列 { x n } 在H中, ω w ( x n ) 分别表示 x n 的聚点集。 x n → x 意味着序列 { x n } 到x是收敛的。
定义 2.1. [
(1) 如果满足以下条件,则称算子T具备非扩张性(nonexpansive)
‖ T x − T y ‖ ≤ ‖ x − y ‖ , ∀ x , y ∈ D , (4)
(2) 如果满足以下条件,则称算子T为稳定非扩张性(firmly nonexpansive):
‖ T x − T y ‖ 2 ≤ ‖ x − y ‖ 2 − ‖ ( I − T ) x − ( I − T ) y ‖ 2 , ∀ x , y ∈ D , (5)
(3) 若存在一个正实数 ν > 0 ,使得下列条件成立,则称T具备v-逆强单调性(v-inverse strongly monotone,简称(v-ism):
〈 T x − T y , x − y 〉 ≥ ν ‖ T x − T y ‖ 2 , ∀ x , y ∈ D , (6)
对任意给定的点,定义对非空闭合凸集C的投影为:
P C x = argmin { ‖ y − x ‖ | y ∈ C } , (7)
投影 P C 具有以下性质。
引理2.2. 设 C ⊆ H 是一个非空闭凸子集。对于所有 x , y ∈ H 和 z ∈ C ,
(1) 〈 x − P C x , z − P C x 〉 ≤ 0 ;
(2) P C 和 I − P C 都是非扩张的;
(3) P C 和 I − P C 都是可逆强单调的;
定义 2.2. 设 f : H → ℝ 为特征函数, σ ∈ ( 0 , 1 ) :
(1) 若f满足以下条件,则称其为凸函数(convex):
f ( δ x + ( 1 − δ ) y ) ≤ δ f ( x ) + ( 1 − δ ) f ( y ) , ∀ x , y ∈ H , (8)
(2) 若f满足以下条件,并具有常数 σ (其中 σ > 0 ),则称其为强凸函数(strongly convex):
f ( δ x + ( 1 − δ ) y ) + σ 2 δ ( 1 − δ ) ‖ x − y ‖ 2 ≤ δ f ( x ) + ( 1 − δ ) f ( y ) , ∀ x , y ∈ H , (9)
(3) 如果一个向量满足以下条件,则称其为函数f在点x处的次梯度(subgradient):
f ( y ) ≥ f ( x ) + 〈 ω , y − x 〉 , ∀ y ∈ H , (10)
(4) 所有凸函数 f : H → ℝ 在点 x ∈ H 的次梯度的集合,记作 ∂ f ( x ) ,称为f的次微分(subdifferential),对于 y ∈ H 定义为:
∂ f ( x ) = { ω ∈ H : f ( y ) ≥ f ( x ) + 〈 ω , y − x 〉 } . (11)
若函数f是连续可微的,则其次微分等于其梯度,即 ∂ f ( x ) = { ∇ f ( x ) } 。凸函数在其定义域的每一点
都是次可微的。
引理2.3. [
f ( x ) = 1 2 ‖ ( I − P Q ) B x ‖ 2 . (12)
则有
(1) f是凸的和可微的
(2) ∇ f ( x ) = B ∗ ( I − P Q ) B x , x ∈ H ;
(3) f在H上是弱下半连续的;
(4) ∇ f 是 ‖ B ‖ 2 -Lipschitz:
‖ ∇ f ( x ) − ∇ f ( y ) ‖ ≤ ‖ B ‖ 2 ‖ x − y ‖ , x , y ∈ H .
引理 2.4. [
(1) 点 x ∗ 为分裂可行性问题(SFP)的解,即 x ∗ ∈ { x ∈ C : B x ∈ Q } 。
(2) 点 x ∗ 是映射 P C ( I − δ ∇ f ) 的不动点。
(3) 点 x ∗ 解决了关于f梯度的变分不等式问题,即找到一个点 x ∗ ∈ C ,使得
〈 ∇ f ( x ) , y − x 〉 ≥ 0 , ∀ y ∈ C , (13)
引理 2.5. [
x ˜ = P C ( x ˜ − τ B ∗ ( I − P Q ) B x ˜ ) .
引理 2.6. [
(I) { x n } 收敛到 x ∗ ∈ C 当且仅当 ω w ( { x n } ) ⊆ C ;
(II) 序列 { P C x n } 收敛;
(III) 如果 { x n } 收敛到 x ∗ ∈ C ,则 x ∗ = lim n → ∞ P C x n 。
在本节中,我们考虑了SFPwMOS的一般情形,其中非空闭凸的集合C和 Q i ( i = 1 , ⋯ , N ) 由凸函数的水平集给出。
在整个本节中,我们假设 c : H → ℝ 和 q i : H i → ℝ 是下半连续的凸函数,并且集合C和 Q i 由以下公式给出:
C : = { x ∈ H : c ( x ) ≤ 0 } Q i : { y ∈ H i : q i ( y ) ≤ 0 } , (14)
在 x k 处的松弛集合(半空间) C k 定义为:
C k : = { x ∈ H : c ( x k ) + 〈 ξ k , x − x k 〉 ≤ 0 } , (15)
其中 ξ k ∈ ∂ c ( x k ) 。
在 x k 处的松弛集合(半空间) Q i ( i = 1 , ⋯ , N ) 定义为:
Q i k : = { x ∈ H : c ( x k ) + 〈 ξ k , x − x k 〉 ≤ 0 } , { y ∈ H i : q i ( B i x k ) + 〈 η i k , y − B i x k 〉 ≤ 0 } (16)
其中 η i k ∈ ∂ q i ( B i x k ) 。由此可知,对于每个 k ≥ 0 ,都有 C ⊂ C k 和 Q ⊂ Q i k 。
我们得到以下(松弛的)邻近函数;对于 x ∈ H ,
g ( x ) : = 1 2 ∑ i = 1 N ( I − P Q i ) B i x 2 , (17)
因为 g ( . ) 是可微的,其梯度由以下公式给出:
∇ g ( x ) : = ∑ i N B i T ( I − P Q i ) B i x 2 , (18)
其中每个 Q i 是在上文中给出的半空间。我们注意到 g k 是弱下半连续的凸可微函数,且 ∇ g ( x ) 是Lipschitz连续的。
我们提出一个新的松弛CQ算法来求解SFPwMOS(1)。
算法1.
Step 1:初始化迭代。任选初始点 x 0 和 x 1 。
Step 2:对于给定的 x n ,计算下一个迭代点 x n + 1 如下:
x n + 1 = P C n 2 ( x n − ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n ) , (19)
其中 C n 2 、 Q n j 2 和 τ n 分别定义如下:
C n 2 = C n ∩ C n − 1 , Q i n 2 = Q i n ∩ Q i ( n − 1 ) , (20)
τ i n = ρ n ‖ ( I − P Q i n 2 ) B i x n ‖ 2 ‖ B j * ( I − P Q i n 2 ) B i x n ‖ 2 , ( i = 1 , 2 , ⋯ , n )
且满足 0 < ρ n < 2 [
Step 3:检查停止准则。如果 x n + 1 = x n ,则算法终止。
Step 4:更新迭代计数。设 n : = n + 1 。
Step 5:返回Step 2,计算下一个迭代。
注 3.3. (1) 由于 C n − 1 、 C n 和 Q j ( n − 1 ) 、 Q j n 均为半空间, C n 2 和 Q j n 2 都是两个半空间的交集,通过对两个半空间交集进行投影,算法能够在保持所有约束条件的同时,更直接地朝着问题的可行解区域前进,从而加快收敛速度,同时可以提高其在面对多约束和高维问题时的适应性和鲁棒性。
显然 C ⊂ C n − 1 , C ⊂ C n 以及 Q i ⊂ Q i ( n − 1 ) , Q i ⊂ Q i n 。因此我们有 C ⊂ C n 2 和 Q i ⊂ Q i n 2 。
定理 3.4. 在算法1中,如果对某个 n ≥ 0 ,有 x n + 1 = x n ,则 x n 是SFPwMOS (1)的解。
证明 从算法1,若 x n + 1 = x n ,则 x n 是SFPwMOS (1)的解。
从算法1得,若 x n + 1 = x n ,则有 x n = P C n 2 ( x n − ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n ) 。根据引理2.7,我们可以得出 x n ∈ C n 2 和 B i x n ∈ Q j n 2 。这意味着 x n ∈ C n 和 B i x n ∈ Q j n 。然后,我们有 x n ∈ C 和 B i x n ∈ Q i 。证明完成。
根据定理3.4,我们可以看到,如果算法1在有限(比如n)步迭代中终止,则 x n 是SFPwMOS(1)的解。因此,在本节的剩余部分中,我们假设算法1不会在有限次迭代中终止,因此会产生无限序列 { x n } 。
定理3.5. 假设 inf n ρ n ( 2 − ρ n ) > 0 。则由算法1生成的序列 { x n } 收敛到SFPwMOS(1)的解。
证明. 设 x * ∈ S 。令 y n = x n − ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n 。那么我们有:
‖ y n − x * ‖ 2 = ‖ ( x n − x * ) − ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n ‖ 2 = ‖ x n − x * ‖ 2 − 2 〈 ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n , ( x n − x * ) 〉 + ‖ ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n ‖ 2 ≤ ‖ x n − x * ‖ 2 − 2 〈 ∑ i = 1 n λ i τ i n B i * ( I − P Q i n 2 ) B i x n , ( x n − x * ) 〉 + ∑ i = 1 n λ i ‖ τ i n B i * ( I − P Q i n 2 ) B i x n ‖ 2 = ‖ x n − x * ‖ 2 − 2 ∑ i = 1 n λ i τ i n 〈 B i * ( I − P Q i n 2 ) B i x n , x n − x * 〉 + ∑ i = 1 n λ i ( τ i n ) 2 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 . (21)
注意到 I − P Q i n 2 是1-ism的。这意味着:
〈 B i * ( I − P Q i n 2 ) B i x n , x n − x * 〉 = 〈 ( I − P Q i n 2 ) B i x n , B i x n − B i x * 〉 = 〈 ( I − P Q i n 2 ) B i x n − ( I − P Q i n 2 ) B i x * , B i x n − B i x * 〉 ≥ ‖ ( I − P Q i n 2 ) B i x n ‖ 2 , (22)
因此,
‖ y n − x * ‖ 2 ≤ ‖ x n − x * ‖ 2 − 2 ∑ i = 1 n λ i τ i n ‖ ( I − P Q i n 2 ) B i x n ‖ 2 + ∑ i = 1 n λ i ( τ i n ) 2 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 = ‖ x n − x * ‖ 2 − 2 ∑ i = 1 n λ i ρ n ‖ ( I − P Q i n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 + ∑ i = 1 n λ i ρ n 2 ‖ ( I − P Q i n 2 ) B j x n ‖ 4 ‖ B j * ( I − P Q i n 2 ) B i x n ‖ 2 = ‖ x n − x * ‖ 2 − ρ n ( 2 − ρ n ) ∑ i = 1 n λ i ‖ ( I − P Q i n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 , (23)
由于 C ⊆ C n ,则 x * = P C ( x * ) = P C n 2 ( x * ) 。因此,我们有:
‖ x n + 1 − x * ‖ 2 = ‖ P C n 2 ( y n ) − P C n 2 ( x * ) ‖ 2 ≤ ‖ y n − x * ‖ 2 − ‖ ( I − P C n 2 ) y n ‖ 2 ≤ ‖ x n − x * ‖ 2 − ρ n ∑ i = 1 n λ i ‖ ( I − P Q i n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 − ‖ ( I − P C n 2 ) y n ‖ 2 . (24)
由于 inf n ρ n ( 2 − ρ n ) > 0 ,序列 { x n } 对S是Fejér单调的。这意味着序列 { x n } 是收敛的,因此 { x n } 是有界序列。此外,根据(24)和对 ρ n 的假设,我们可以立即得出:
∑ n = 0 ∞ ‖ ( I − P C n 2 ) y n ‖ 2 < ∞ ,
和
∑ n = 0 ∞ ‖ ( I − P Q i n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 < ∞ . (25)
特别地,我们有:
lim n → ∞ ‖ ( I − P C n 2 ) y n ‖ = 0
和
lim n → ∞ ‖ ( I − P Q i n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q n 2 ) B i x n ‖ 2 = 0 , (26)
由于 I − P Q i n 2 是非扩张的,我们有:
‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 = ‖ B i * ( I − P Q i n 2 ) B i x n − B i * ( I − P Q i n 2 ) B i x * ‖ 2 ≤ ‖ B i ‖ 4 ‖ x n − x * ‖ 2 , (27)
这意味着 { ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 } 是有界的。然后根据(26),我们得出:
lim n → ∞ ‖ ( I − P Q i n 2 ) B i x n ‖ = 0 . (28)
根据引理2.6,为了证明 { x n } 对SFPwMOS (1)的解的收敛性,只需证明 ω w ( x n ) ⊆ S ,因为 { x n } 对S是Fejér单调的。现在设 x ¯ ∈ ω w ( x n ) 并且 { x n k } 是 { x n } 的一个子序列,满足 x n k → x ¯ 。接下来,我们证明 x ¯ ∈ S 。首先我们证明 B i x ¯ ∈ Q i 。由于 ∂ q i 在有界集上是有界的,存在一个常数 δ 1 > 0 ,使得 ‖ η n ‖ ≤ 1 对所有 n ≥ 0 成立。根据(16)和 P Q i n 2 ( B i x n ) ∈ Q i n 2 ⊆ Q i n ,可以得出:
q i ( B i x n ) ≤ 〈 η n , B i x n − P Q i n 2 ( B i x n ) 〉 ≤ δ 1 ‖ ( I − P Q i n 2 ) B i x n ‖ , (29)
根据 q i 下半连续性和(29)表明:
q i ( B i x ¯ ) ≤ lim inf k → ∞ q i ( B i x k n ) ≤ lim k → ∞ δ 1 ‖ ( I − P Q i n k 2 ) B i x k n ‖ = 0 , (30)
得到 B i x ¯ ∈ Q 。
接下来我们证明 x ¯ ∈ C 。根据 τ i 的定义,我们有:
‖ y n − x n ‖ 2 = ‖ ∑ i = 1 n τ i n λ i B i * ( I − P Q i n 2 ) B i x n ‖ 2 ≤ ∑ i = 1 n λ i ( τ i n ) 2 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 = ∑ i = 1 n λ i ρ n 2 ‖ ( I − P Q k n 2 ) B i x n ‖ 4 ‖ B i * ( I − P Q i n 2 ) B i x n ‖ 2 → 0 , , (31)
由于 ∂ c 在有界集上是有界的,存在一个常数 δ 2 > 0 ,使得 ‖ ζ n ‖ ≤ δ 2 对所有 n ≥ 0 成立。根据 C n 的定义和 P C n 2 ( y n ) ∈ C n 2 ⊆ C n 的事实,我们得到:
c ( x n ) ≤ 〈 ξ n , x n − P C n 2 y n 〉 = 〈 ξ n , ( x n − y n ) + ( I − P C n 2 ) y n 〉 ≤ δ 2 ( ‖ x n − y n ‖ + ‖ ( I − P C n 2 ) y n ‖ ) , (32)
同样,c的下半连续性和(32)表明
c ( x ¯ ) ≤ lim inf k → ∞ c ( x k n ) ≤ lim k → ∞ δ 2 ( ‖ x k n − y k n ‖ + ‖ ( I − P C n k 2 ) y k n ‖ ) = 0 , (33)
因此可以得到 x ¯ ∈ C 。我们可以的到 x ¯ ∈ S 。证毕。
在本节中,我们通过解决一些问题,展示了一些数值示例,以说明与现有结果相比,我们提出的方法的实施和效率。在我们的数值实验中,迭代次数(Iter. (n))代表迭代次数,CPU(s)代表以秒为单位的运行时间。
例1 考虑 H = ℝ 10 , H 1 = ℝ 20 , H 2 = ℝ 30 和 H 3 = ℝ 40 。找到一个点 p ∗ ∈ ℝ 10 ,使得
p ∗ ∈ Ω : = C ∩ B 1 − 1 ( Q 1 ) ∩ B 2 − 1 ( Q 2 ) ∩ B 3 − 1 ( Q 3 ) ≠ ∅ ,
其中集合C和 Q i ,以及线性有界算子 B i 由下式定义:
C = { x ∈ ℝ 10 : ‖ x − c ‖ 2 ≤ r 2 } , Q 1 = { A 1 x ∈ ℝ 20 : ‖ A 1 x − c 1 ‖ 2 ≤ r 1 2 } , Q 2 = { A 2 x ∈ ℝ 30 : ‖ A 2 x − c 2 ‖ 2 ≤ r 2 2 } , Q 3 = { A 3 x ∈ ℝ 40 : ‖ A 3 x − c 3 ‖ 2 ≤ r 3 2 } .
其中 c ∈ ℝ 10 , c 1 ∈ ℝ 20 , c 2 ∈ ℝ 30 , c 3 ∈ ℝ 40 , r , r 1 , r 2 , r 3 ∈ ℝ ,且 B 1 : ℝ 10 → ℝ 20 , B 2 : ℝ 10 → ℝ 30 , B 3 : ℝ 10 → ℝ 40 。在这种情况下,对于任何 x ∈ ℝ 10 ,我们有 c ( x ) = ‖ x − c ‖ 2 − r 2 和 q i ( A i x ) = ‖ A i x − c i ‖ 2 − r i 2 , i = 1 , 2 , 3 。根据(22)和(23),集合 C n 和 Q i n ( i = 1 , 2 , 3 ) 的半空间C和 Q i ,分别在点 x n 和 B i x n 处确定:
C n 2 = { x ∈ ℝ 10 : ‖ x n − c ‖ 2 − r 2 ≤ 2 〈 x n − c , x n − x 〉 } , Q 1 n 2 = { y ∈ ℝ 20 : ‖ B 1 x n − c 1 ‖ 2 − r 1 2 ≤ 2 〈 B 1 x n − c 1 , B 1 x n − y 〉 } , Q 2 n 2 = { y ∈ ℝ 30 : ‖ B 2 x n − c 2 ‖ 2 − r 2 2 ≤ 2 〈 B 2 x n − c 2 , B 2 x n − y 〉 } , Q 3 n 2 = { y ∈ ℝ 40 : ‖ B 3 x n − c 3 ‖ 2 − r 3 2 ≤ 2 〈 B 3 x n − c 3 , B 3 x n − y 〉 } .
接下来,我们可以轻松计算出对半空间 C n 2 和 Q i n 2 ( i = 1 , 2 , 3 ) 的正交投影。代表矩阵 B i 的元素是在闭区间 [ − 5 , 5 ] 中随机生成的,中心点 c , c 1 , c 2 , c 3 的坐标是在闭区间 [ − 1 , 1 ] 中随机生成的,半径 r , r 1 , r 2 , r 3 是分别在闭区间 [ 10 , 20 ] , [ 20 , 40 ] , [ 30 , 60 ] , [ 40 , 80 ] 中随机生成的。为了简化,初始向量用 e 1 = ( 1 , 1 , ⋯ , 1 ) T ∈ ℝ 10 表示。在这个例子中,我们通过解决一个数值问题来检验由我们的算法定义的序列 { x n } 的收敛性。
我们对比了所提出算法与广泛认可的经典方法——交替投影法(Alteration) [
x n + 1 = P C ( ⋯ ( P Q 2 ( P Q 1 ( x n ) ) ) ⋯ )
其中, Q 1 , Q 2 , ⋯ , Q n , C 表示一系列的闭合凸集, P Q i , P C 表示对集合 Q i 和C的投影操作。Douglas-Rachford Splitting Method在多输出集情况下需要对算法进行适当的修改或扩展,迭代更新公式为如下形式:
x n + 1 = x n + λ ( 1 m ∑ j = 1 m P C ( 2 P Q i ( x n ) − x n ) − P Q i ( x n ) ) ,
其中, P C 和 P Q i 分别是对集合C和 Q i 的投影操作, λ 是正的步长参数,此处取 λ = 1 ,m是输出集的总数,此处取 m = 3 。
由图1我们可以观察得到算法1具有较好的收敛性:
图1. E n 值随着迭代次数增加而变化
如图1所示,随着迭代次数增加,算法的 E n 值呈快速下降趋势,并在约20次迭代后趋于平稳。初期 E n 的显著减少表明算法在搜索最优解的过程中迅速逼近稳定状态,显示出良好的收敛性能。当迭代次数超过20次后, E n 值下降速度明显放缓,逐渐稳定在一个较小的数值范围内,这暗示算法可能已接近最优解或达到一个稳态解。相对于交替方向法,算法1具有更高的确度和更快的下降速度,由于 E n 值在后期迭代中的变化幅度较小,若考虑计算效率和资源消耗,可在满足一定收敛精度的前提下适当提前终止迭代过程。整体而言,所采用算法的性能表现符合预期目标,具备实际应用的潜力。
我们计算了算法的收敛速率,并与用于解决SFPwMOS的交替投影法 [
停止准则 | 算法1 | 交替投影法 | Douglas-Rachford | |
---|---|---|---|---|
E n < 1 e − 1 | 迭代次数(n) En 时间(s) | 7 0.093901 0.041583 | 17 0.099756 0.0006372 | 176 0.099991 0.038794 |
E n < 1 e − 2 | 迭代次数(n) En 时间(s) | 63 0.0095952 0.35159 | 218 0.0099805 0.0005377 | 302 0.0098862 0.060066 |
E n < 1 e − 3 | 迭代次数(n) En 时间(s) | 104 0.00097848 0.67112 | 550 0.00099545 0.0009584 | 387 0.00099855 0.076856 |
E n < 1 e − 4 | 迭代次数(n) En 时间(s) | 126 9.6614e−05 0.94914 | 638 9.917e−05 0.0008563 | 417 9.9505e−05 0.075674 |
E n < 1 e − 5 | 迭代次数(n) En 时间(s) | 137 9.9881e−06 1.1126 | 1253 9.9273e−06 0.0008379 | 937 9.9459e−06 0.14002 |
表1. 对于不同的 E n 算法1与交替投影法和Douglas-Rachford的比较
在多种迭代停止准则 E n < 1 e − 1 至 E n < 1 e − 5 下,通过比较三种算法——算法1、交替投影法和Douglas-Rachford算法——在收敛性( E n )、迭代次数(n)和运行时间(s)三个指标上的性能,可以观察到算法1在大多数情况下都表现出更高的效率和稳定性。具体来说,算法1能够以较少的迭代次数达到相同的精度要求,这说明算法1在求解速度上更具优势。同时,算法1所需的计算时间通常低于其他两种算法,特别是在更高精度要求的情况下,这一优势更为显著。此外,从表格中可以看出,随着精度要求的提高,Douglas-Rachford算法的迭代次数增长速度较快,这可能暗示了在处理更复杂或要求更高精度的问题时,其性能可能会受到限制。交替投影法在迭代次数和时间上的表现虽然优于Douglas-Rachford算法,但与算法1相比仍有差距。综上所述,算法1在所考察的性能指标上表现出了更佳的综合性能,对于需要快速准确解决问题的应用场景,是一种更可取的选择。
本文针对欧氏空间中的多集分裂可行性问题,提出了一种新颖的松弛算法。该算法通过对传统投影方法的改进,采用对两个半空间交集进行投影的策略,不仅在理论上展现了创新性,也在实际应用中证明了其有效性。我们对该算法的收敛性进行了严格的理论分析,确立了在特定条件下算法的稳定性和可靠性,为解决复杂的优化问题提供了一种有效的新途径。这一研究成果不仅丰富了多集分裂问题的求解方法,也为相关领域的实际应用开辟了新的可能。
朱 亚,党亚峥,马 丁,薛中会. 多集分裂可行问题的算法探究Algorithmic Research on the Multi-Set Splitting Feasibility Problem[J]. 理论数学, 2024, 14(03): 240-251. https://doi.org/10.12677/pm.2024.143102
https://doi.org/10.1007/BF02142692
https://doi.org/10.1016/j.amc.2012.08.005
https://doi.org/10.22436/jnsa.010.04.16
https://doi.org/10.1007/s11784-019-0684-0
https://doi.org/10.1137/130936269
https://doi.org/10.1007/s11590-020-01555-6
https://doi.org/10.1016/j.na.2007.02.029
https://doi.org/10.1155/2012/149508
https://doi.org/10.1016/j.laa.2012.05.018
https://doi.org/10.1186/1029-242X-2013-123
https://doi.org/10.2298/FIL1602459L
https://doi.org/10.1080/01630563.2019.1681000
https://doi.org/10.3390/mca25030047
https://doi.org/10.1186/s13660-020-02508-4
https://doi.org/10.37193/CJM.2020.01.01
https://doi.org/10.1007/s41980-021-00622-7
https://doi.org/10.1080/01630563.2022.2071939
https://doi.org/10.1007/978-1-4419-9467-7_1
https://doi.org/10.1088/0266-5611/20/1/006
https://doi.org/10.1088/0266-5611/28/8/085004
https://doi.org/10.1007/s10957-011-9837-z
https://doi.org/10.1016/S1570-579X(01)80010-0
https://doi.org/10.1080/02331934.2018.1485677
https://doi.org/10.1007/s10957-013-0502-6
https://doi.org/10.1007/978-3-030-84721-0_12