Gaussian Process Methods for Solving Nonlinear Partial Differential Equations
The solving of nonlinear partial differential equations (NPDEs) finds wide applications in fields such as fluid mechanics and financial mathematics. Given the difficulty in obtaining analytical solutions for NPDEs, this study extensively explores Gaussian process-based methods for solving partial differential equations: GPPDE method and TD-GPsolver method. Considering the complexity of nonlinear systems in NPDEs, we extend the GPPDE method and TD-GPsolver method to two representative nonlinear partial differential equations—Allen-Cahn equation and Cahn-Hilliard equation, and compare them with the Physics-Informed Neural Network (PINN) method to evaluate their performance under different discretization conditions. The results indicate that the TD-GPsolver method demonstrates high computational efficiency and stability when dealing with large-scale discretized datasets while maintaining a low error rate. The GPPDE method offers higher accuracy when handling small-scale datasets, ensuring a balance between computational efficiency and accuracy. Although the PINN method significantly improves numerical accuracy under high discretization settings, its longer computational time limits its practicality.
Nonlinear Partial Differential Equations
科学计算现已随着计算机科学的迅速进展,并肩于理论研究和实验方法,成为科学探索的三大支柱之一
90年代末,高斯过程(Gaussian process, GP)作为统计学习领域的一种重要工具
GPPDE方法和TD-GPsolver方法常被应用在热方程、波动方程等线性偏微分方程中,这些方程由于其数学结构的简洁性使得传统方法可以有效求解。然而,非线性偏微分方程由于解的多样性和非线性动态的存在使得线性方法难以直接适用或效果不佳。本文将GPPDE方法和TD-GPsolver方法扩展到非线性偏微分方程(Allen-Cahn方程和Cahn-Hilliard方程)的求解中,并将两种方法与PINN方法进行比较。
本文的其余部分结构如下:在第2节中,我们详细阐述了基于高斯过程的GPPDE算法和TD-GPsolver算法,并探讨了物理信息神经网络PINN算法;在第3节中我们进行一系列数值实验,将各算法应用到两种非线性偏微分方程中,并对比分析结果,评估了方法的有效性;最后一节对文章进行总结和讨论。
假设数据点服从多元高斯分布,其中协方差是其次且平稳的,并且取决于两点之间的距离。对于训练点x和测试点 使用的高斯协方差函数为,
(1)
其中 是第j个自变量的长度,观测值具有独立且同分布的噪声,假设其服从均值为零的正态分布,真实值为 ,
(2)
x包含所有自变量 , 包含所有观测值 ,且服从高斯分布 , 是x的先验均值, 是协方差矩阵。
使用最大边际似然法
(3)
使用BFGS算法
(4)
将偏微分方程以隐函数形式给出,
(5)
其中u是状态变量, 是自变量,a是偏微分方程的一组参数,GPPDE方法对高斯过程的状态值建模,并估计其在偏微分方程中涉及的导数,通过最小化偏微分方程在观测点的残差完成求解。
考虑有界域 ,其中 。非线性偏微分方程给出形式,
(6)
其中,P是非线性算子,B是边界算子,分别对应f和g。利用在
上的有限配置点集合
上满足偏微分方程约束的高斯过程逼近真解
,其中
的内点,边界点为
,令U为二次Banach空间,相关协方差算子
,考虑最优化问题
(7)
在上述假设下,可以定义泛函 ,同时定义测量向量 也是高斯的,且 。矩阵 为方阵矩阵,其中 。定义
(8)
(9)
(10)
针对解决无约束优化问题,TD-GPsolver方法采用高斯–牛顿算法的一种有效变体,其中采用自适应块金项与底层核矩阵的离线Cholesky分解一起进行正则化。
考虑偏微分方程
(11)
其中 代表未知函数, 代表由 参数化的非线性微分算子。方程的定义域为 。边界条件初值条件分别是 和 ,其中边界条件可以是Dirichlet边界条件,Neumann边界条件,Robin边界条件或混合边界条件。
PINN使用一个被一系列参数化的深度神经网络去近似偏微分方程的未知函数 ,即 。可以通过最小化方程损失(MSEf),边界损失(MSEb)和初值损失(MSEi)来学习得到。
本章节采用平均相对 来评估模型的精度,其计算方式如下,
其中 代表真实值, 的是预测值,N是观测值的数量。
在科学研究领域,Allen-Cahn方程作为一种经典的相场模型,起源于Allen和Cahn关于结晶固体反相位边界运动的描述
考虑Allen-Cahn方程的一维形式如下,
(12)
初始条件和边界条件如下,
(13)
数量 |
Method |
Time(s) |
L2error |
M = 50 |
GPPDE |
15 |
1.20E−01 |
GPsolver |
9 |
3.33E−01 |
|
PINN |
600 |
1.45E−01 |
|
M = 100 |
GPPDE |
430 |
8.52E−02 |
GPsolver |
10 |
9.01E−02 |
|
PINN |
670 |
6.38E−02 |
|
M = 250 |
GPPDE |
- |
- |
GPsolver |
11 |
4.39E−02 |
|
PINN |
520 |
2.19E−03 |
|
M = 500 |
GPPDE |
- |
- |
GPsolver |
13 |
2.35E−02 |
|
PINN |
700 |
4.23E−03 |
求解精度方面,在离散点数为M = 50 (时间步数T = 20)时,GPPDE、TD-GPsolver和PINN的L2误差分别为0.12、0.333和0.145。将离散点增至M = 100 (时间步数T = 40),GPPDE、TD-GPsolver和PINN的L2误差分别调整为0.0852、0.0901和0.0638。进一步增加至M = 250 (时间步数T = 100),GPPDE方法未能求解,TD-GPsolver的L2误差改善至0.0439,PINN的误差最低,为0.00219。在M = 500 (时间步数T = 200)时,GPPDE方法仍未完成求解,TD-GPsolver和PINN的L2误差为0.0235和0.00423。
结果表明针对Allen-Cahn方程,尽管GPPDE在较高离散点数时因计算资源限制无法求解,但其在低离散点设置下展现出可观的求解精度。相较之下,TD-GPsolver方法不仅在低至高的各种离散点数设置中保持了显著的计算效率,而且随着离散点数的增加求解精度显著提高,证明了其在处理大规模和复杂非线性偏微分方程时的强大能力。需要注意的是,PINN方法随着离散点数量增加出现了过拟合现象,这可能是因为数据量与网络容量平衡和优化算法的快速收敛等因素共同作用。
Cahn-Hilliard方程,由John W. Cahn和John E. Hilliard于1958年提出
(14)
初始和边界条件如下,
(15)
数值实验结果见
求解精度方面,在离散点数为M = 50 (时间步数T = 20)时,GPPDE、TD-GPsolver和PINN的L2误差分别为0.0214、0.263和0.073。将离散点增至M = 100 (时间步数T = 40),GPPDE、TD-GPsolver和PINN的L2误差分别调整为0.0117、0.207和0.225。进一步增加至M = 250 (时间步数T = 100),GPPDE方法未能求解,TD-GPsolver的L2误差改善至0.199,PINN的误差最低,为0.0154。在M = 500 (时间步数T = 200)时,GPPDE方法未能完成求解,TD-GPsolver和PINN的L2误差为0.196和0.0476。
针对Cahn-Hilliard方程,GPPDE方法处理小规模数据集时仍能提供满意的精度,在处理大规模问题上计算资源受限需进行进一步的优化。TD-GPsolver方法凭借其在各种离散点设置下的快速计算能力和较为稳定的精度表现,证明了高斯过程方法是求解非线性偏微分方程的有效工具。PINN方法则在高离散点数设置下展现出较优的求解精度,但对计算资源和计算时间要求较高。
数量 |
Method |
Time(s) |
L2error |
M = 50 |
GPPDE |
14 |
2.14E−02 |
GPsolver |
8 |
2.63E−01 |
|
PINN |
160 |
7.03E−02 |
|
M = 100 |
GPPDE |
660 |
1.17E−02 |
GPsolver |
9 |
2.07E−01 |
|
PINN |
300 |
2.25E−01 |
|
M = 250 |
GPPDE |
- |
- |
GPsolver |
11 |
1.99E−01 |
|
PINN |
300 |
1.54E−02 |
|
M = 500 |
GPPDE |
- |
- |
GPsolver |
12 |
1.96E−01 |
|
PINN |
540 |
4.76E−02 |
本文重点分析了两种基于高斯过程的数值解法(TD-GPsolver方法和GPPDE方法)在处理复杂NPDEs中的应用。通过对Allen-Cahn方程和Cahn-Hilliard方程的求解进行数值实验,我们评估了这两种方法在不同离散化水平下的求解精度(以L2范数误差衡量)和计算效率(以计算时间为指标),并以PINN方法作为对比。TD-GPsolver方法利用时间动态的高斯过程优化了计算过程,并在维持低误差率的同时显著提高了求解速度,表现出在处理大规模数据集时拥有的高效率和稳定性。另一方面,GPPDE虽然在高离散点数量下表现不佳,但在处理小规模数据集时仍能提供较高精度,特别是在对概率分布有详细要求的应用场景中。PINN方法需要大量计算资源和计算时间,适合应用精度要求极高的场景中。
总结来说,TD-GPsolver和GPPDE方法都体现了高斯过程在数值求解非线性偏微分方程中的独特价值和潜力。未来研究可以进一步探索TD-GPsolver方法在其他类型的偏微分方程求解中的应用,以及如何通过算法优化进一步提升其在低离散化水平下的精度表现。此外,结合TD-GPsolver的高效性与PINN的高精度特性,开发新的算法以应对更广泛的科学和工程问题,也是未来研究的重要趋势。
作者感谢主编、编委会和匿名审稿人提出许多宝贵意见,这些意见对促进文章有重大改进。作者对撰写文章时提供帮助的师生表示感谢。