本文对带有PT对称势三阶五阶幂律非线性薛定谔方程提出了关于参数和势函数反演的两类反问题。对于参数反演问题,我们分别采用PINNs (Physics Informed Neural Networks)和传统的结合有限差分法与优化算法求解的方法进行比较。计算结果显示,在求解反问题时,传统方法每步参数优化需要数值求解非线性薛定谔方程,计算量较大。而PINNs的方法无需重复求解薛定谔方程,计算效率更高。对于PT对称势函数反演问题,通过在PINNs中嵌入自适应基函数,从而反演得到PT对称势。数值实验显示PINNs在算法计算反问题效率上优于传统微分数值求解和优化相结合的方法。 This paper proposes two types of inverse problems about parameter and potential function inversion for the third-order and fifth-order power-law nonlinear Schrödinger equation with PT-symmetric potential. For the parameter inversion problem, PINNs are used respectively, compared with the traditional method that combines the finite difference and optimization algorithms to solve the problem. The calculation results show that when solving the inverse problem, the traditional method needs to numerically solve the nonlinear Schrödinger equation for each step of parameter optimization, which requires a large amount of calculation. The PINNs method does not require repeatedly solving the Schrödinger equation, and the calculation efficiency is higher. For the inversion problem of the PT-symmetric potential function, the PT-symmetric potential is inverted by embedding adaptive basis functions in PINNs. Numerical experiments show that PINNs are superior to traditional methods that combine differential numerical solving and optimization in algorithmic calculation of inverse problems.
本文对带有PT对称势三阶五阶幂律非线性薛定谔方程提出了关于参数和势函数反演的两类反问题。对于参数反演问题,我们分别采用PINNs (Physics Informed Neural Networks)和传统的结合有限差分法与优化算法求解的方法进行比较。计算结果显示,在求解反问题时,传统方法每步参数优化需要数值求解非线性薛定谔方程,计算量较大。而PINNs的方法无需重复求解薛定谔方程,计算效率更高。对于PT对称势函数反演问题,通过在PINNs中嵌入自适应基函数,从而反演得到PT对称势。数值实验显示PINNs在算法计算反问题效率上优于传统微分数值求解和优化相结合的方法。
PT对称势,非线性薛定谔方程,PINNs,参数优化,反问题
Kun Zhang
School of Science, Zhejiang Sci-Tech University, Hangzhou Zhejiang
Received: Dec. 1st, 2023; accepted: Mar. 22nd, 2024; published: Mar. 29th, 2024
This paper proposes two types of inverse problems about parameter and potential function inversion for the third-order and fifth-order power-law nonlinear Schrödinger equation with PT-symmetric potential. For the parameter inversion problem, PINNs are used respectively, compared with the traditional method that combines the finite difference and optimization algorithms to solve the problem. The calculation results show that when solving the inverse problem, the traditional method needs to numerically solve the nonlinear Schrödinger equation for each step of parameter optimization, which requires a large amount of calculation. The PINNs method does not require repeatedly solving the Schrödinger equation, and the calculation efficiency is higher. For the inversion problem of the PT-symmetric potential function, the PT-symmetric potential is inverted by embedding adaptive basis functions in PINNs. Numerical experiments show that PINNs are superior to traditional methods that combine differential numerical solving and optimization in algorithmic calculation of inverse problems.
Keywords:PT-Symmetric, Nonlinear Schrödinger Equation, PINNs, Parameter Inversion, Inverse Problems
Copyright © 2024 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
为了解释光学系统中某些处于平衡状态的不寻常现象,例如方向依赖性、非局域非线性效应和光学相位变换点,Bender和Boettcher [
从20世纪80年代开始,学者们开展了非线性薛定谔方程(NLSE)的反问题研究,旨在通过已知的输入波场来推断NLSE中的非线性系数和势函数。这项研究为新型光学器件的设计提供了理论基础。在NLSE中,色散系数和非线性项系数的反演可以揭示光子的非线性传输过程,而势函数的反演可以提供量子系统实际的势阱形状信息,影响整个量子系统的性质和动力学行为。目前,对NLSE的反问题研究主要集中在数值理论和方程参数优化两个方面。在数值理论方面,Hogan等 [
近年来,新兴的神经网络方法为NLSE的正问题和反问题求解提供了新的途径 [
在具有PT对称势的NLSE方程中,涉及色散系数、衍射系数以及相应的势函数。其中,色散系数是影响光纤通信质量的一个主要因素,光纤色散会导致脉冲展宽,造成光信号畸变,影响传输距离的长短。衍射系数则是刻画非线性光学效应中介质的非线性偏振率,它决定了光波在传播时对自身产生的影响效应,使光波的包络发生聚焦或散焦。因此,研究色散系数和衍射系数平衡规律,以及具有良好性质的PT对称势,有助于理解光孤子在非线性光学系统中的稳定性。
本文则对带有PT对称势的NLSE提出了两类反问题。其中,第一类问题是色散系数和衍射系数的反演问题:通过已知的输入数据和势函数来推断,推断NLSE中的色散系数和非线性系数。第二类问题则是PT对称势函数的反演问题:通过部分测量数据和给定色散系数和衍射系数,恢复NLSE中的势函数,即量子系统中的势阱形状信息。这两类反问题的研究对于我们更好地理解带有PT对称势的NLSE中的非线性现象和光传播系统的性质具有重要意义。同时,它们也为光学器件设计和量子光学领域的进展提供了理论基础。进一步,在第一种有关反射系数和衍射系数的反问题的求解中,我们应用PINNs深度学习方法和经典粒子群算法(PSO)结合有限差分数值求解的方法分别进行求解,以期比较这两种算法对于这类反问题求解的计算效率。而对于第二种有关势函数的反问题中,我们提出一种带有自适应基函数的PINNs算法,以期通过在自适应基函数中引入sigmod和tanh函数来提高PINNs算法的计算精度。值得注意的是这种带有自适应基函数的PINNs算法不需要指定势函数的形式,也不需要提供先验信息,即可求解满足给定条件的势函数。
本文结构如下。在第2节中对带有PT对称势的三次和五次幂律NLSE分别提出两类反问题。第3节我们给出了两类反问题对应的损失函数,提出利用物理信息神经网络(PINNs)深度学习方法来求解所提出的两类反问题。第4节中给出数值实验。第5节中我们对本文的主要工作和贡献进行总结。
在本章中,我们先通过具有PT对称势NLSE正问题来构建两类反问题。
我们首先给出一维带有PT对称势的三次和五次幂律非线性薛定谔方程的正问题,即考虑如下形式的非线性薛定谔方程 [
其中, u : = u ( x , z ) 是具有缓慢变化电场包络的复值函数,代表光的传播,其中x代表横向坐标,z表示无量纲纵向传播距离。
我们将(1)的解定义在整个域 Ω = { ( x , z ) | x ∈ R , z > 0 } 上,其中 x → ± ∞ 。我们将初始域
{ u | z = 0 = ϕ ( x ) , u | Γ = Ψ ( − L , z ) = Ψ ( L , z ) (2)
其中, ϕ 和 ψ 是光滑函数。 Γ = { x = ± L } 表示 Ω i 的边界。
根据NLSE方程(1)~(2),如果我们已经确定了方程的参数 、 γ 3 、 γ 5 和具有PT对称性的势函数 v ( x ) ,那么我们就可以确定光束的传播状态。在这种情况下,我们需要思考的问题是,如果我们观察到部分光束的状态并且已知对称势函数 v ( x ) ,那么相应的色散系数 β 以及衍射系数 γ 3 和 会是什么样的?另外,我们还需要弄清楚如何确定这些非线性系数。进一步地,如果我们观察到部分光束的状态并且已知非线性系数 β 和 γ 3 、 γ 5 ,那么满足PT对称性的势函数 v ( x ) 会有怎样的特征?该如何找到适合这个光束状态的势函数呢?接下来,我们将逐步解决这些问题。
在符合具有PT对称性NLSE方程的光束传播中,如果色散系数远大于衍射系数,则色散效应起主导作用。过强的色散效应将导致光波包络衰减过快,难以长距离传播;而如果衍射系数远大于色散系数,则衍射效应起主导作用,在包络方程的演化过程中,会出现急剧的自聚焦现象,导致波函数在短距离内崩溃。而当二者的量级接近时,非线性色散效应将发挥作用。因此确定适当的色散和衍射系数对于保证通信质量至关重要。那么我们目前希望解决的是根据观测到的一部分光束数据,在已知对称势函数的情况下,确定色散系数和衍射系数,即色散系数和衍射系数的反演问题。
为了建立色散–衍射反问题,我们首先对正问题的传播进行分析。当色散系数、衍射系数以及对称势函数确定时,根据NLSE方程(1)~(2)确定的光束传播状态也将确定,并能够获得每个点处光束的确切数据。换种说法就是,如果我们已经测量到了部分光束的数据,那么对应的NLSE方程中的参数必定是预先给定的数据。然而,如果只有势函数相同而色散系数和衍射系数发生改变,那么产生的光束数据也会相应发生变化。因此,在势函数相同的情况下,我们可以根据测量到的部分光束数据来估计产生这些数据的参数,这可以通过比较测量数据和变换参数所导致的光束计算数据之间的差异来建立一个优化问题。这个优化问题的目标是将这两者的差异最小化,从而找到能够在NLSE方程中产生测量到的光束数据的相关参数。
假设 { x i , z i } , i = 1 , ⋯ , N ,其中表示N个测量点, u i 表示在这些测量点上得到的测量数据,而 则是在NLSE方程(1)~(2)的不同参数 β , γ 3 , γ 5 计算得到的数据。我们的目标是在 L 2 范数的意义下最小化这两者之间的差异。
可以将优化问题表述如下:
min β , γ 3 , γ 5 ∑ i = 1 N [ u ( x i , z i ) − u i ] 2 (3)
其中, | u ( x i , z i ) − u i | 2 表示计算数据和测量数据在点 { x i , z i } 处差异。通过对所有测量点处二者差异的和进行优化,我们希望找到一组最优的参数 β , γ 3 , γ 5 ,使得计算数据 u ( x i , z i ) 和测量数据 u i 的差异最小化。
带有PT对称势的NLSE方程中的对称势函数在研究和应用上具有多重重要作用。首先,对称势函数确保系统解的实数性,保证波函数和能量等物理量是实数,从而维持系统的稳定性和可行性。其次,对称势函数对系统的对称性起着关键作用,通过保持或调整系统在PT反演下的对称性,影响波函数、自旋翻转等量子行为,并决定系统的响应和性质。通过研究和理解对称势函数的特性,可以揭示它在系统行为中的影响,探索基于PT对称势的非线性薛定谔方程中的新的物理现象,例如新的能级结构、非线性激发和相互作用机制等,这对于发现和理解量子系统的新特性具有重要意义。此外,对称势函数的研究还有助于在材料设计和工程领域中找到具有特定PT对称性的势函数。这些设计可以用于调控光、声、电场和自旋等在材料中的传播和操控行为,为开发新型器件和应用提供理论基础。总之,理解和研究带有PT对称势的非线性薛定谔方程中的对称势函数对于深入理解系统行为、揭示潜在物理现象、指导材料设计和工程控制,并探索新的应用领域具有重要意义。下面我们探讨如何构建这个关于势函数的反问题,并且能够让这个势函数保持PT对称。
同构建关于散射–衍射系数反问题类似,如果当前可测量到部分光束数据,并且NLSE方程中的散射–非线性系数已知,我们想寻找合适的势函数满足这个光束的传播。即假设N个测量点 { x i , z i } , i = 1 , ⋯ , N 处的测量数据,以及NLSE方程(1)~(2)中色散系数 β ,非线性系数
可将优化问题表示如下:
min ϑ ∑ i = 1 N [ u ( x i , z i ) − u i ] 2 (4)
需要注意的是,与求解散射–衍射系数反问题(3)的情况不同,求解势函数反问题(4)时,我们需要确保势函数满足PT对称性。这样的限制条件使得问题更加复杂,需要使用合适的优化算法和策略来确保所得到的势函数具有所需的对称性。
下面我们将讨论如何对这两类反问题进行求解。
为了方便对散射–衍射系数反问题(3)和势函数反问题(4)进行求解,我们先根据NLSE方程(1)来构建一个新的函数。将复波函数u分解为实部p和虚部q,让 u ( x , z ) = p ( x , z ) + i q ( x , z ) ,其中 p ( x , z ) 和 q ( x , z ) 都是实值函数。引入一个隐函数 u ^ ( x , z ) ,定义函数 F ( x , z ) 如下:
F ( x , z ) : = i ∂ u ^ ∂ z + β 1 ∂ 2 u ^ ∂ x 2 + γ 3 | u ^ | 2 u ^ + γ 5 | u ^ | 4 u ^ + v ( x ) u ^ , (5)
其中,隐函数
针对NLSE的均方误差损失函数
由于 u ( x i , z i ) 满足薛定谔方程,即 F p ( x j , z j ) = 0 , F q ( x j , z j ) = 0 。进一步考虑到部分样本点 ( x i , z i ) 位于边界上,记这些点为
TL = TL I R + TL E + TL B (6)
其中
TL I R = 1 N ∑ j = 1 N ( | p ^ ( x j , z j ) − p ( x j , z j ) | 2 + | q ^ ( x j , z j ) − q ( x j , z j ) | 2 ) , TL E = 1 N ∑ j = 1 N ( | F p ( x j , z j ) | 2 + | F q ( x j , z j ) | 2 ) , TL B = 1 N B ∑ j = 1 N B | ψ ^ ( − L , z B j ) − ψ ^ ( L , z B j ) | 2 = 1 N B ∑ j = 1 N B ( | p ^ ( − L , z B j ) − p ^ ( L , z B j ) | 2 + | q ^ ( − L , z B j ) − q ^ ( L , z B j ) | 2 )
将原来(3)和(4)提出的反问题,转化为求解损失函数TL的最小值。得(3)对应的反问题
min β , γ 3 , γ 5 ∑ i = 1 N [ u ( x i , z i ) − u i ] 2 ⇔ min β , γ 3 , γ 5 ( TL I R + TL E + TL B ) (7)
(4)对应的反问题
min ϑ ∑ i = 1 N [ u ( x i , z i , ϑ ) − u i ] 2 ⇔ min ϑ ( TL I R + TL E + TL B ) (8)
通过最小化损失函数(7),求出NLSE方程的参数 θ = { β 1 , γ 3 , γ 5 } ;通过最小化损失函数(8),求出NLSE方程的PT对称势函数 。当 L O S S < ε (其中
图1. PINNs深度学习框架用于PT对称势场的反问题
步骤指导 |
---|
1构建具有初始化权重 w 和偏置 b 的全连接神经网络 N N ( x ; w , b ) 。 2在区域
|
表1. PINNs方法学习(5)中的 θ 或PT对称势 ϑ ( x )
对色散系数和非线性系数反问题使用PINNs求解,将 θ 、 [ F p , F q ] 和未知解 [ p ^ ( x , z ) , q ^ ( x , z ) ] 代入损失函数(7)中,最终实现参数反演。
为比较PINNs方法和传统求解反问题方法的计算效率,我们下面给出了结合有限差分法求解正问题和使用粒子群算法进行优化的算法。我们在附录中提出了求解NLSE的有限差分法。下面介绍优化问题的PSO算法,即算法1。
PSO方法是由Marini F [
假设目标搜索空间为D维,群体规模为M;第i个粒子的D维位置矢量为
v i d k + 1 = ω v i d k + c 1 r 1 ( p i d − z i d k ) + c 2 r 2 ( p g d − z i d k ) , z i d k + 1 = z i d k + v i d k + 1
式中: i = 1 , 2 , ⋯ , M ; d = 1 , 2 , ⋯ , D ;k为迭代次数; ω 为惯性因子; r 1 和 r 2 为[0, 1]之间的随机数; c 1 和 c 2 为学习因子。
在PSO结合有限差分算法中,只需将目标参数 θ = { β 1 , γ 3 , γ 5 } 作为优化参数即可。其中,Results可选择 最大 L 2 范数误差。
对PT对称势函数反问题,由于势函数与波函数u及其导数之间存在的高度非线性关系,使得直接反演势函数有一定困难。为了解决这个问题,我们提出了自适应基函数的PINNs算法。这个算法的核心是选择适当的基函数,使得神经网络模型能够更好地逼近复杂的解空间,提高对梯度信息的敏感度。
在PINNs中,基函数的选择需要根据对问题的理解和神经网络特性进行。对于PT对称势函数,考虑到其本身对称性要求,我们选择实部采用偶函数,虚部采用奇函数来作为基函数。这样既能有效覆盖解空间,又符合物理约束,有助于更好地捕捉势函数的特性。于是,令目标函数 ϑ ( x ) = { V ( x ) , W ( x ) } ,势函数 V ( x ) , W ( x ) 的基函数选取如下:
V ( x ) : sigmod ( x ) , 1 , 1 π cos x , 1 π cos 2 x , ⋯ , 1 π cos n x , W ( x ) : tanh ( x ) , x , 1 π sin x , 1 π sin 2 x , ⋯ , 1 π sin n x
其中n的个数根据精度要求,采用自适应的原则选取。如果使用三角基函数无法达到理想的误差,我们可以在实部和虚部基函数中,分别引进两个激活函数,即sigmod函数
假设(1)的参数
V ( x ) = 0.7 ∗ sech 2 ( x ) + 1.7161 ∗ sech 4 ( x ) , W ( x ) = 0.3 ∗ sech ( x ) tanh ( x )
则式(1)的精确解为:
u ( x , z ) = 2 − 0.7 + 0.3 2 / 9 γ 3 sech ( x ) exp { i ( z + 0.3 3 arctan ( sinh x ) ) }
根据精确解,我们在区域 x ∈ [ − 2 , 2 ] , z ∈ [ 0 , 2 ] 内选取出测量数据。将解的实部和虚部分别表示为
存储在NLSE.mat文件中,以便导入到PINNs模型中。我们使用拉丁超立方体(LHS)采样策略生成模型训练所需的采样点数据,接下来以此为例子验证提出的两种反问题的求解方法。
首先考虑用PINNs和PSO结合附录中提出的有限差分法两种方法反演两个参数的情形。
在PINNs模型中,我们选取N个内部训练点,NB个边界训练点,网络是5个隐藏的层,每层有100个节点,如表2;粒子群算法的参数选取为 ω = 1.2 , c 1 = 1.5 , c 2 = 1.5 。表3比较了PINNs ( N = 81 ,
N | NB | E r r o r γ 3 | E r r o r γ 5 | E r r o r p | E r r o r q | LOSS | Time |
---|---|---|---|---|---|---|---|
20 | 2 | 2.070% | 1.184% | 1.233e−03 | 1.677e−03 | 5.824e−06 | 34 |
40 | 4 | 0.357% | 0.533% | 5.142e−03 | 4.627e−03 | 4.373e−06 | 49s |
81 | 5 | 0.208% | 0.229% | 3.421e−03 | 3.151e−03 | 3.231−05 | 47s |
162 | 10 | 0.480% | 0.611% | 2.213e−03 | 1.970e−03 | 3.794e−05 | 49s |
243 | 15 | 0.111% | 0.109% | 4.429e−03 | 2.649e−03 | 5.769e−05 | 76s |
324 | 20 | 0.186% | 0.255% | 4.958e−03 | 2.274e−03 | 7.726e−05 | 92s |
405 | 25 | 0.087% | 0.061% | 3.165e−03 | 2.372e−03 | 9.001e−05 | 96s |
810 | 40 | 0.045% | 0.058% | 4.980e−03 | 1.506e−03 | 3.013e−05 | 226s |
表2. 在不同的N和NB下 γ 3 , γ 5 预测误差,以及p,q训练误差,损失函数和运行时间
PINNs | PSO | |||||
---|---|---|---|---|---|---|
计算值 | 误差 | 运行时间 | 计算值 | 误差 | 运行时间 | |
γ 3 = 1 γ 5 = − 1 | 1.00208 −1.00229 | 0.20802% 0.22880% | 41.308s | 1.00487 −1.00486 | 0.48729% 0.48616% | 1778.29s |
L o s s = 3.231 e − 05 | R e s u l t s = 2.141 e − 04 |
表3. PINNs与PSO算法比较:同时反演两个参数,其中 N = 81 , N B = 5
接下来用两种方法分别反演三个参数的情形。在PINNs模型中,我们选取N个内部训练点,NB个边界训练点,如表4。表5展示了我们利用PINNs ( N = 162 , N B = 10 )同时进行反演色散系数 β 和非线性参数 γ 3 和 γ 5 ,预测误差仍能控制在10−3之内。但使用PSO ( k = 100 )粒子群算法同时反演三个目标参数会导致陷入局部最优,无法寻找准确的目标参数。
在PINNs和传统方法解决NLSE反问题时,传统方法基于数学模型和物理定律,具有精确性和数学理论基础,但局限于简单两个以内参数反演问题和高计算复杂度,求解参数反问题时容易陷入局部最优问题;而PINNs不依赖特定数学模型,适用性广,计算效率高,虽然需要数据来训练模型,但灵活性和适应性更强,不易陷入局部最优。因此选择PINNs能更好地解决复杂非线性问题。
N | NB | E r r o r β | E r r o r p |
|
LOSS | Time | ||
---|---|---|---|---|---|---|---|---|
20 | 2 | 2.655% | 16.809% | 21.061% | 1.753e−02 | 2.677e−02 | 3.264e−05 | 46s |
40 | 4 | 0.139% | 0.871% | 1.187% | 3.412e−03 | 1.627e−03 | 4.373e−06 | 55s |
81 | 5 | 0.318% | 0.464% | 0.148% | 2.845e−03 | 2.749e−03 | 1.292e−05 | 52s |
162 | 10 | 0.109% | 0.095% | 0.078% | 1.415e−03 | 1.776e−03 | 2.601e−05 | 68s |
243 | 15 | 0.274% | 0.345% | 0.026% | 2.402e−03 | 8.205e−04 | 3.416e−05 | 75s |
324 | 20 | 0.106% | 0.524% | 0.640% | 2.318e−03 | 1.856e−03 | 2.687e−05 | 131s |
405 | 25 | 0.186% | 0.834% | 1.006% | 2.050e−03 | 1.635e−03 | 2.911e−05 | 147s |
810 | 40 | 0.022% | 0.199% | 0.238% | 8.116e−04 | 1.193e−03 | 3.645e−05 | 270s |
表4. 在不同的N和NB下 β , γ 3 , γ 5 预测误差,以及p,q训练误差,损失函数和运行时间
PINNs | PSO | |||||
---|---|---|---|---|---|---|
β = 1 | 计算值 1.00109 | 误差 0.10878% | 运行时间 | 计算值 1.12120 | 误差 12.12084% | 运行时间 |
γ 3 = 1 γ 5 = − 1 | 1.00095 −1.00078 | 0.09507% 0.07812% | 68.381s | 1.33809 −0.53508 | 33.89937% 46.39131% | 8836.776s |
L o s s = 2.601 e − 05 | R e s u l t s = 0.31489 |
表5. PINNs与PSO算法比较:同时反演三个参数,其中 N = 162 , N B = 10
根据章节3.2中提出的方法,构造PT对称势函数,(8)中 ϑ = ( V 1 ( x ) , W 1 ( x ) )
V 1 ( x ) + i W 1 ( x ) = [ l 1 ∗ 1 + l 2 cos x π + l 3 ∗ cos 2 x π + ⋯ + l n ∗ cos ( n − 1 ) x π ] + i ∗ [ l n + 1 ∗ x π + l n + 2 ∗ sin x π + l n + 3 ∗ sin 2 x π + ⋯ + l 2 n ∗ sin ( n − 1 ) x π ] (9)
在不添加激活函数的情况下,我们采用自适应基函数选择方法。根据精度要求,基函数中的 n = 7 ,得到的计算结果在不同的N、NB情况下,6层网络,每层100个节点,如表6,其中 E r r o r V 和 E r r o r W 分别为PT对称势实部与虚部的最大误差。表7即为PT对称势最优情况下,自适应基函数系数。
图2为反演PT对称势函数的结果,其中图2(a)为实部和虚部绝对误差,误差分别达到10−2和10−3;图2(b) (左)为实部虚部预测值和真实值,图2(b) (右)为 u = p ^ ( x ) 2 + q ^ ( x ) 2 绝对误差。可以看出反演的PT对称势最大误差0.011671,精度仅为10−2量级。这说明在自适应基函数选择方法中,仅使用三角函数作为基函数无法对PT势函数进行高精度反演,这与我们理想目标还存在一定差距。
N | NB | E r r o r p | E r r o r q | E r r o r V | E r r o r W | LOSS | Time |
---|---|---|---|---|---|---|---|
20 | 2 | 1.024e−01 | 1.151e−02 | 0.4477 | 0.1003 | 7.346e−06 | 84 s |
81 | 5 | 2.785e−03 | 2.935e−03 | 0.2295 | 0.2002 | 2.724e−05 | 113 s |
162 | 10 | 5.740e−03 | 7.081e−03 | 0.4088 | 0.2472 | 7.324e−05 | 140 s |
243 | 15 | 5.801e−03 | 5.669e−03 | 0.3171 | 0.0201 | 9.151e−05 | 197 s |
405 | 25 | 4.319e−03 | 5.546e−03 | 0.0669 | 0.258 | 1.115e−05 | 177 s |
810 | 50 | 2.894e−03 | 6.355e−03 | 0.0117 | 0.0040 | 1.596e−04 | 288 s |
1620 | 100 | 1.207e−02 | 1.410e−02 | 0.0368 | 0.1282 | 2.364e−04 | 396 s |
3240 | 100 | 1.385e−02 | 1.311e−02 | 0.6875 | 0.0519 | 5.736e−04 | 611 s |
表6. 在不同的N和NB下 V 1 ( x ) 和 W 1 ( x ) 预测误差,以及p,q训练误差,损失函数和运行时间
V 1 ( x ) | l 1 | l 2 | l 3 | l 4 | l 5 | l 6 | l 7 |
---|---|---|---|---|---|---|---|
0.58494 | 1.64574 | 0.91757 | 0.41337 | 0.18816 | 0.04280 | 0.01732 | |
W 1 ( x ) | l 8 | l 9 | l 10 | l 11 | l 12 | l 13 | l 14 |
−0.00718 | 0.23614 | 0.08342 | 0.02636 | 0.01301 | 0.00216 | 0.00214 |
表7. PINNs运行(9)自适应基函数系数结果, N = 810 , N B = 50
图2. (a)左为实部预测误差(a)右为虚部预测误差,(b)左为真实值和预测值比较(b)右为真实值与预测值的绝对误差
为进一步降低结果误差,使其绝对误差可以达到更小。接下来考虑加上激活函数,即(8)中
ϑ ( x ) = ( V 2 ( x ) , W 2 ( x ) ) 为
V 2 ( x ) + i W 2 ( x ) = [ l 1 ∗ 1 + l 2 cos x π + ⋯ + l n − 1 ∗ cos ( n − 2 ) x π + l n ∗ 1 1 + e − 4 x 2 ] + i ∗ [ l n + 1 ∗ x π + l n + 2 ∗ sin x π + ⋯ + l 2 n − 1 ∗ sin ( 2 n − 1 ) x π + l 2 n ∗ tanh ( x ) ] (10)
在添加激活函数的情况下,根据精度要求,选择基函数中的 n = 8 ,得到的计算结果在不同的N、NB情况下如表8。表9即为PT对称势最优情况下,自适应基函数系数。
N | NB | E r r o r p |
|
E r r o r V | E r r o r W | LOSS | Time |
---|---|---|---|---|---|---|---|
20 | 2 | 5.970e−02 | 2.379e−02 | 0.9660 | 0.7740 | 1.455e−05 | 87s |
81 | 5 | 3.165e−03 | 1.521e−03 | 0.8642 | 0.1970 | 6.936e−05 | 118s |
162 | 10 | 6.309e−03 | 6.939e−03 | 0.9047 | 0.1891 | 9.544e−05 | 156s |
243 | 15 | 3.681e−03 | 4.329e−03 | 0.9266 | 0.2311 | 5.736e−05 | 197s |
405 | 25 | 3.791e−03 | 4.553e−03 | 0.0511 | 0.1316 | 7.536e−05 | 215s |
810 | 50 | 1.161e−03 | 1.832e−03 | 0.0067 | 0.0023 | 1.530e−04 | 308s |
1620 | 100 | 1.852e−02 | 1.895e−02 | 0.6633 | 0.2296 | 2.272e−04 | 476s |
3240 | 100 | 3.681e−02 | 4.329e−02 | 0.9778 | 0.5770 | 5.736e−04 | 735s |
表8. 在不同的N和NB下 V 2 ( x ) 和 W 2 ( x ) 预测误差,以及p,q训练误差,损失函数和运行时间
V 1 ( x ) | l 1 | l 2 | l 3 | l 4 | l 5 | l 6 | l 7 | l 8 |
---|---|---|---|---|---|---|---|---|
0.31992 | 1.70996 | 0.99577 | 0.45058 | 0.20802 | 0.04988 | 0.02700 | 0.29601 | |
W 1 ( x ) | l 9 | l 11 | l 12 | l 13 |
|
l 15 | l 16 | |
−0.11932 | 0.21541 | 0.02221 | 0.05082 | −0.00453 | 0.00520 | −0.00001 | 0.12959 |
表9. PINNs运行(10)自适应基函数系数结果, , N B = 50
图3. (a)左为实部预测误差(a)右为虚部预测误差,(b)左为真实值和预测值比较(b)右为真实值与预测值的绝对误差
图3为反演PT对称势函数的结果。其中图3(a)为实部和虚部绝对误差,其误差都达到10−3。图3(b)为实部虚部预测值和真实值,以b(右)为 u = p ^ ( x ) 2 + q ^ ( x ) 2 绝对误差。可以看出反演的PT对称势最大误差达到0.0066802,精度为10−3量级。这说明在自适应基函数选择方法中,使用三角函数和激活函数作为基函数对PT势函数可进行高精度反演,这与我们理想目标一致。
图4. PINN学习解与表9中 x = 1.90 和2.00处PT-对称势能的精确解之间的绝对误差
图4是在反演PT对称势(10)的情况,使用数据训练得到的PINNs学习解,可以看出,在我们所反演的PT对称势函数时,PINNs的学习解和数值解的绝对误差达到10−3。在未添加激活函数情况下(9)和在添加激活函数情况下(10)在PINNs运行程序结果数据选取和结果见表10所示。
N | NB | 网络层数 | E r r o r p | E r r o r q | E r r o r | V + i W | | Time | |
---|---|---|---|---|---|---|---|
表7 | 810 | 50 | 2 + 100*6 + 2 | 1.596e−04 | 2.894e−03 | 1.167e−02 | 288.58 |
表8 | 810 | 50 | 2 + 100*6 + 2 | 1.530e−04 | 1.613e−03 | 6.795e−03 | 307.97 |
表10. PINNs求解(1)的N,NB,网络层数和运行结果
对于未添加激活函数的情况(表格中的表7),使用了810个数据点和100个边界点。神经网络的层数为 2 + 100 ∗ 6 + 2 ,这表示神经网络输入层和输出层各有2个节点、隐藏层一共有6层,每层含有100个节点。损失函数的数值为1.596e−04,表示模型在训练过程中能够较好地拟合目标函数。学习解与数值解在方程p和q上的绝对误差分别为2.894e−03和6.355e−03,这表示学习解与数值解在相应方程上的差异较小。方程势函数VPT的平方和误差为1.167e−02,这也说明学习解与数值解在整个方程系统上的拟合程度较好。运行时间为288.58s,表示训练模型所需的时间较短。
对于添加激活函数的情况(表9),使用了相同数量的数据点和边界点(810个数据点和100个边界点)。神经网络的层数仍为 2 + 100 ∗ 6 + 2 ,与未添加激活函数的情况相同。损失函数的数值略低,为1.530e−04,表明模型的拟合效果略好于未添加激活函数的情况。学习解与数值解在方程p和q上的绝对误差分别为1.613e−03和1.832e−03,说明学习解与数值解的差异较小。方程势函数VPT的平方和误差为6.795e−03,表明整体的拟合效果仍然较好。运行时间为307.97 s,与未添加激活函数的情况相比稍长一些。
综合上述分析,我们可以看出:
- 添加激活函数可以在一定程度上提高模型的拟合效果,减小损失函数的数值和方程误差;
- 不同的实验设置可能会对结果产生影响,比如数据点和边界点的数量、网络结构等;
- 在给定的实验条件下,使用的数据点和边界点数量相对较多,导致模型能够较好地拟合目标函数,但相应地运行时间也稍长。
需要注意的是,以上结论是基于给定表格中的数据进行分析的,具体结果可能因实验设置和数据集的不同而有所变化。因此,这些分析仅供参考,并需要进一步实验和验证。
在本文中,我们提出了带有PT对称势的NLSE的参数反演和势函数反演两类反问题,并采用PINNs方法求解。计算结果显示,PINNs具有较强的泛化能力,可以实现两类反问题的反演。
在对NLSE方程系数进行反演时,我们将PINNs方法和粒子群算法进行了比较。传统的PSO算法在每次更新参数时,都需要利用有限差分法重新求解一次NLSE方程,因此效率较低,计算速度慢。当需要反演的系数过多时,容易陷入局部最优解。而PINNs方法在求解反问题时比传统方法要快,因为它不需要反复计算NLSE方程的数值解,所需计算时间更短。PINNs还可以用于识别物理方程中的隐藏参数,以及分析不同参数之间的非线性依赖关系。
在反演具有PT对称性的势函数时,我们构造了带有自适应基函数的PINNs,该方法无需指定势函数的具体形式,也不依赖于任何先验模型。自适应基函数的选取使得PINNs能够在训练过程中自动调整基函数的形式,提高了反演PT势函数的精度和准确性,为光学领域中NLSE反问题研究提高了新的思路和方法。未来,我们还可以对PINNs算法进行存在性、唯一性、收敛性和稳定性分析,并利用PINNs算法求解更高维或更高阶的NLSE反问题。
张 坤. 带有PT对称势的非线性薛定谔方程的两类反问题Two Types of Inverse Problems of the Nonlinear Schr?dinger Equation with PT Symmetric Potentials[J]. 理论数学, 2024, 14(03): 117-134. https://doi.org/10.12677/pm.2024.143091
下面给出带有初边值条件的NLSE方程(1)的有限差分格式。
为了用差分格式求解(1)~(2),将求解区域 [ − L , L ] × [ 0 , Z ] 作剖分,取正整数 M , N 。将 [ − L , L ] 作M等分,将 [ 0 , Z ] 作N等分。 h = 2 L / M , τ = Z / N ; x p = x l + p h , 0 ≤ p ≤ M ; z n = n τ , 0 ≤ n ≤ N ; Ω h = { x p | 0 ≤ p ≤ M } , Ω τ = { z j | 0 ≤ j ≤ N } , Ω h τ = Ω h × Ω τ ,记 , z j + 1 2 = 1 2 ( z j + z j + 1 ) ,令
记
设 υ ∈ V h ,引进如下记号:
δ x 2 υ p j = 1 h x 2 ( υ p − 1 j − 2 υ p j + υ p + 1 j ) .
记
S τ = { ω | ω = ( ω 0 , ω 1 , ⋯ , ω N ) 是 Ω τ 上 的 网 格 函 数 }
设
ω p j + 1 2 = 1 2 ( ω p j + 1 + ω p j ) , ω p j ¯ = 1 2 ( ω p j + 1 + ω p j ) , δ z ω p j + 1 2 = 1 τ ( ω p j + 1 − ω p j ) , Δ z ω p j = 1 2 τ ( ω p j + 1 − ω p j ) .
设 u = { u p j | 0 ≤ p ≤ M , 0 ≤ j ≤ N } 为 Ω h τ 上的网格函数,则 v = { u p j | 0 ≤ p ≤ M } 为 Ω h 上的网格函数,
在点 ( x p , z 1 2 ) 处考虑(1),于是有
i u z ( x p , z 1 2 ) + β 1 u x x ( x p , z 1 2 + γ 3 | u ( x p , z 1 2 ) | 2 u ( x p , z 1 2 ) ) + γ 5 | u ( x p , z 1 2 ) | 4 u ( x p , z 1 2 ) + v p u ( x p , z 1 2 ) = 0, p ∈ I M 0 (11)
由泰勒公式展开
∂ 2 ∂ x 2 u ( x p , z j + 1 2 ) = δ x 2 U ( x p , z j + 1 2 ) + O ( h 2 ) , p ∈ I M 0 , j ∈ T N 0 , (12)
∂ 2 ∂ x 2 u ( x p , z j + 1 2 ) = δ x 2 U ( x p , z j + 1 2 ) + O ( h 2 ) , p ∈ I M 0 , j ∈ T N 0 , (13)
由微分公式可得
i δ z U p 1 2 + β 1 δ x 2 U p 1 2 + ( γ 3 | u ¯ p | 2 + γ 5 | u ¯ p | 4 + v p ) U p 1 2 = R p 0 , p ∈ I M 0 (14)
其中
u ¯ p = u ( x p ,0 ) + τ 2 u z ( x p ,0 ) , p ∈ I M 0
u z ( x p , 0 ) 可以通过方程(1)结合初值条件(2)可求得。在点 ( x p , z j ) 处考虑(1),有
i u z ( x p , z j ) + β 1 u x x ( x p , z j ) + γ 3 | u ( x p , z j ) | 2 u ( x p , z j ) + γ 5 | u ( x p , z j ) | 4 u ( x p , z j ) + v p u ( x p , z 1 2 ) = 0, p ∈ I M 0 , j ∈ T N 0 (15)
将(12)和(13)代入(15)中,可得
i Δ z U p j + β 1 δ x 2 U p j ¯ + ( γ 3 | U p j | 2 + γ 5 | U p j | 4 + v p ) U p j ¯ = R p j , p ∈ I M 0 , j ∈ T N 0 (16)
| δ z R p j | ≤ C 2 ( h 2 + τ 2 ) , p ∈ I M 0 , 2 ≤ j ≤ N − 2
由初边值条件(2),并且忽略(14)和(16)小量项,对问题(1)~(2)建立如下线性差分格式
i δ z u p 1 2 + β 1 δ x 2 u p 1 2 + ( γ 3 | u ¯ p | 2 + γ 5 | u ¯ p | 4 + v p ) u p 1 2 = 0, p ∈ I M 0 , i Δ z u p j + β 1 δ x 2 u p j ¯ + ( γ 3 | u p j | 2 + γ 5 | u p j | 4 + v p ) u p j ¯ = 0, p ∈ I M 0 , j ∈ T N 0 , u p 0 = ϕ ( x p ) , p ∈ I M 0 , u 0 j = ψ ( 0, z j ) , u M x j = ψ ( M , z j ) , j ∈ T N (17)
首先根据初始和边界条件计算 u 1 的值,记
u k = ( u 0 k , u 1 k , ⋯ , u M − 1 k , u M k )
由初值条件可知第0层上的值 u 0 ,根据差分格式
i δ z U p 1 2 + β 1 δ x 2 U p 1 2 + ( γ 3 | u ¯ p | 2 + γ 5 | u ¯ p | 4 + v p ) U p 1 2 = 0, p ∈ I M 0
则关于第1层值的差分格式为
在(18)中,将第1层写在方程左边,第0层写在方程右边,令
a = β 1 2 h 2 , b = i τ − β 1 h 2 + γ 3 2 | ϕ ( x p ) + τ 2 u z ( x p ,0 ) | 2 + γ 5 2 | ϕ ( x p ) + τ 2 u z ( x p ,0 ) | 4 + v p 2 , c = i 2 τ + β 1 h 2 − γ 3 2 | ϕ ( x p ) + τ 2 u z ( x p ,0 ) | 2 − γ 5 2 | ϕ ( x p ) + τ 2 u z ( x p ,0 ) | 4 − v p 2
可写成如下矩阵形式
( b a a b a ⋱ ⋱ ⋱ a b a a b ) × ( u 1 1 u 2 1 ⋮ u M − 2 1 u M − 1 1 ) + ( a u 0 1 0 ⋮ 0 a u M 1 ) = ( c − a − a c − a ⋱ ⋱ ⋱ − a c − a − a c ) × ( u 1 0 u 2 0 ⋮ u M − 2 0 u M − 1 0 ) + ( − a u 0 0 0 ⋮ 0 − a u M 0 ) ,
求解以上代数系统,可以得到关于u的第1层数值解
计算出 u 1 后,接下来我们建立u的三层格式。假设已确定出了第
i Δ z u p j + β 1 δ x 2 u p j ¯ + γ 3 | u p j | 2 u p j ¯ + γ 5 | u p j | 4 u p j ¯ + v p u p j = 0, p ∈ I M 0 , j ∈ T N 0 ,
则关于第 j + 1 层值的差分格式为
令
f = β 1 2 h 2 , e = i 2 τ − β 1 h 2 + γ 3 2 | u p j | 2 + γ 5 2 | u p j | 4 + v p 2 , f = i 2 τ + β 1 h 2 − γ 3 2 | u p j | 2 − γ 5 2 | u p j | 4 − v p 2
将第
( e d d e d ⋱ ⋱ ⋱ d e d d e ) × ( u 1 j + 1 u 2 j + 1 ⋮ u M − 2 j + 1 u M − 1 j + 1 ) + ( d u 0 j + 1 0 ⋮ 0 d u M j + 1 ) = ( f − d − d f − d ⋱ ⋱ ⋱ − d f − d − d f ) × ( u 1 j − 1 u 2 j − 1 ⋮ u M − 2 j − 1 u M − 1 j − 1 ) + ( − d u 0 j − 1 0 ⋮ 0 − d u M j − 1 ) (19)
由此我们得到求解本文中NLSE方程的有限差分格式,格式中步长取值越小,数值解越精确。
https://doi.org/10.1103/PhysRevLett.80.5243
https://doi.org/10.1016/j.spmi.2017.03.014
https://doi.org/10.1016/j.ijleo.2019.05.027
https://doi.org/10.1016/j.rinp.2020.103798
https://doi.org/10.1016/j.ijleo.2019.04.118
https://doi.org/10.1038/s41563-019-0304-9
https://doi.org/10.1016/j.jmaa.2023.127016
https://doi.org/10.1088/1361-6420/abd7cb
https://doi.org/10.1088/0266-5611/18/6/307
https://doi.org/10.1038/s41557-020-0544-y
https://doi.org/10.1016/j.jcp.2018.10.045
https://doi.org/10.1016/j.physleta.2020.127010
https://doi.org/10.1016/j.physd.2023.133729
https://doi.org/10.1016/j.optcom.2015.05.051
https://doi.org/10.1016/j.chemolab.2015.08.020