← 返回首页

基于自适应小波的PINN求解局部高强度源问题

arXiv: 2604.28180v1

论文信息

标题: An adaptive wavelet-based PINN for problems with localized high-magnitude source

作者: Himanshu Pandey, Ratikanta Behera

发布日期: 2026-04-30

arXiv ID: 2604.28180v1

PDF链接: 下载PDF

背景与研究动机

物理信息神经网络(Physics-Informed Neural Networks, PINNs)通过将微分方程残差纳入损失函数,使神经网络在无需大量标注数据的情况下直接学习物理规律。然而,标准PINNs存在两个核心缺陷:一是神经网络固有的频谱偏差(spectral bias),即网络倾向于优先学习低频成分,难以捕捉高频或局部剧烈变化;二是多尺度现象带来的损失不平衡问题,不同损失项(如偏微分方程残差、边界条件、初始条件)的量级可能相差悬殊,导致优化困难。当求解对象包含局部高强度源项(例如点热源、点电荷或局部冲击力)时,这种不平衡会急剧恶化——源项所在区域产生的高幅值残差主导了总体损失,迫使网络忽略其他区域的物理约束。此时方程残差与边界损失之比甚至可达 1010:110^{10}:1,传统PINNs几乎无法收敛到有意义的解。因此,如何在保持全局物理一致性的同时,精准解析局部极端特征,是科学计算领域的一个重大挑战。

AW-PINN的核心方法

针对上述问题,该论文提出了自适应小波物理信息神经网络(Adaptive Wavelet-based PINN, AW-PINN)。其根本思想是用自适应的小波基函数替代标准神经网络的神经元,并让基函数的尺度与平移参数随训练动态演化,从而集中表示能力在局部高梯度区域。

小波表示与导数计算

AW-PINN将待求函数 u(x)u(\mathbf{x}) 表示为一系列小波基函数的线性组合:

u^(x)=j=1Ncjψsj,τj(x),\hat{u}(\mathbf{x}) = \sum_{j=1}^{N} c_j \, \psi_{s_j, \boldsymbol{\tau}_j}(\mathbf{x}),

其中 ψs,τ(x)=sd/2ψ((xτ)/s)\psi_{s, \boldsymbol{\tau}}(\mathbf{x}) = s^{-d/2} \psi\left( (\mathbf{x} - \boldsymbol{\tau})/s \right) 是经过尺度 ss 和平移 τ\boldsymbol{\tau} 调整的母小波。与传统PINN不同,这里的每一组 (sj,τj)(s_j, \boldsymbol{\tau}_j) 与权重系数 cjc_j 都是可训练参数。小波基函数的一个关键优势是其导数具有解析表达式,因此计算PDE残差时可以直接求取 u^\nabla \hat{u}Δu^\Delta \hat{u},完全无需依赖自动微分(automatic differentiation)。这不仅消除了构建计算图的内存开销,还显著提升了训练速度,尤其是当高阶导数频繁出现时。

两阶段自适应训练

AW-PINN的训练分为预训练和自适应细化两个阶段。

预训练阶段: 首先固定一系列较粗粒度的尺度和均匀分布的平移参数,在全体训练点上进行少量迭代。该阶段的主要目的是识别哪些小波族对损失贡献最大,即哪些尺度范围与当前物理问题的特征频率最为匹配。通过评估每个基函数所关联的残差或监督损失梯度,筛选出活跃小波族,并将其作为后续自适应细化的种子。

自适应细化阶段: 仅在选中的活跃小波族内进行精细化操作。对于每个候选基函数,算法根据其局部残差大小,动态调整尺度和平移:在高残差区域,减小尺度以增加局部分辨率,同时平移参数向该区域中心聚拢;在残差平缓区域,则合并或删除冗余基函数。这种按需细化的策略避免了对整个定义域维护高分辨率基函数,极大地减少参数数量,从而缓解了内存压力。更新后的基函数集合再与损失函数同步优化,逐步形成“源头精细、背景粗放”的非均匀表达结构。

损失函数本身由PDE残差项、边界条件项和初始条件项组成,每项均依据各自区域的小波基计算。自适应算法会持续监控各项损失的比值,并通过重新分配基函数来抑制极端不平衡。当局部源项引起残差异常飙升时,算法会在该处迅速增加高尺度、小位移的小波,使得网络能够以极高精度刻画源项附近的尖锐梯度。

理论洞见:高斯过程极限与NTK

论文还给出了重要的理论支撑:在适当假设下,AW-PINN的输出收敛于一个具有特定核函数的高斯过程(Gaussian Process),并推导出对应的神经正切核(Neural Tangent Kernel, NTK)结构。这一结论表明,该自适应小波模型有着与核方法一致的泛化性质,保证了在极小损失下的收敛稳定性,也解释了为何它能从全局角度协调多个尺度。

创新点与贡献

AW-PINN的贡献主要体现在以下几个方面:

  1. 自适应的多尺度基函数:首次在小波PINN框架内实现尺度与平移的在线自适应,解决了固定基函数难以匹配局部源项的问题。
  2. 极端损失不平衡的解决:通过动态资源分配,成功处理了损失比例高达 1010:110^{10}:1 的算例,使网络能同时满足全局平滑与局部奇异性。
  3. 无自动微分的加速训练:利用小波的解析导数计算,消除了反向传播中对计算图的依赖,训练效率大幅提升。
  4. 坚实的理论基础:将AW-PINN纳入高斯过程框架,给出了收敛性保证和NTK分析,为后续改进提供了理论依据。

实验结果分析

作者在四类典型物理问题上对AW-PINN进行了评估,所有问题均包含局部高强度源项,损失不平衡比从 105:110^5:11010:110^{10}:1

  • 瞬态热传导:一维细杆中点处施加脉冲热源,温度场在源附近随时间急剧变化。标准PINN因频谱偏差几乎无法捕捉热峰,L2L^2 相对误差超过 5×1015\times 10^{-1};而AW-PINN经自适应细化后,在源附近自动聚集了大量细尺度小波,误差降至 1.2×1031.2\times 10^{-3},且边界条件损失仍保持极小。
  • 高度局部化泊松问题:右端项为狄拉克-δ\delta 型点源,解在源点处呈对数奇异性。AW-PINN通过生成极小尺度的小波成功解析出尖峰,同时其余区域仅需十几个粗尺度基函数即可满足方程,整体参数利用率极高。
  • 振荡流方程:包含高频强迫项的那维-斯托克斯方程,频率差异导致多尺度效应。AW-PINN自动选择不同尺寸的基函数分别处理高、低频区域,避免了过参数化。
  • 点电荷源麦克斯韦方程:电磁场在点电荷附近呈 1/r21/r^2 发散,电场残差损失项与边界条件之比达到 1010:110^{10}:1。AW-PINN依然准确恢复出库仑场分布,而其他自适应采样方法则因损失不平衡而发散。

所有实验中,AW-PINN在精度和参数量两方面均显著优于传统PINN、多尺度PINN以及基于残差的重采样方法。尤其在极端的损失比值下,只有AW-PINN能稳定收敛,展现出在局部源项问题上的绝对优势。

实践应用建议与未来发展方向

AW-PINN的方法论可以拓展到量化交易、量子计算和人工智能等多个前沿领域。

量化交易: 在奇异期权定价中,收益的跳跃、障碍水平或局部波动率常常导致定价偏微分方程存在局部高强度源项。例如,跳扩散模型下的期权定价方程含有非局部积分项,其残差可能在行权价附近呈现极大值。使用AW-PINN可以直接求解该PIDE,自适应小波在行权价周围精细布点,从而准确捕捉期权价格的凸性突变和跳跃影响,提升定价与希腊值计算的效率。

量子计算: 多体薛定谔方程在电子-电子汇聚点存在库仑尖点,波函数的局部导数急剧变化。AW-PINN可以学习波函数的一种自适应多尺度表示,在核附近密集采样小尺度基,同时维持远程分子轨道的粗粒度表达。这有望为量子化学中的变分蒙特卡洛方法提供更高效的试验波函数,或加速量子动力学模拟。

人工智能: 从机器学习的视角,AW-PINN本质上是一种具备在线结构学习的元模型。它根据损失信号动态调整感受野,类似于注意力机制,但完全基于物理反馈。这种思路可应用于多尺度物理模拟、气候建模以及需要处理极端事件的代理模型,提升模型在稀少数据下的外推能力。

未来,AW-PINN仍有诸多发展方向:一是高维扩展,通过可分离小波或张量积基函数缓解维数灾难;二是将自动小波选择与贝叶斯推理结合,以量化预测不确定性;三是利用GPU对小波变换进行更高效的并行实现;四是开发更通用的自适应准则,使该方法能直接耦合至工业级仿真软件中。

总结与展望

AW-PINN通过引入自适应小波基函数,优雅地解决了物理信息神经网络在局部高强度源项问题中的极端损失不平衡瓶颈。其两阶段训练策略与无自动微分机制在保证高精度的同时实现了内存和计算效率的双重优化。实验证明,即便面对损失比例高达 1010:110^{10}:1 的挑战,AW-PINN仍能稳健、精确地给出物理场分布。这项工作不仅为科学计算中的多尺度难题提供了新的解决思路,更有望推动PINN复杂工程问题中的实际落地,并启发跨领域的自适应学习架构设计。