【数值分析】有限元法（FEM）数值不稳定性分析：$L^2$ 与 $H_0^1$ 空间的对比实验

张

张建站

2026/4/9 1:43:42

10分钟阅读

【数值分析】有限元法（FEM）数值不稳定性分析：$L^2$ 与 $H_0^1$ 空间的对比实验

科研入门从数学系本科生的视角拆解有限元法背后的力学逻辑总起相信每个搞数值模拟的同学都有过类似的心理创伤代码里模型搭得好好的咱们吃着火锅唱着歌正期待着漂亮的云图呢。结果突然一个网格畸形局部应力瞬时爆表——紧接着就像多米诺骨牌一样误差传遍全局整个仿真瞬间炸成一团乱码。这种‘闹心’的底层原因往往在于我们离散化的数学模型在物理和数学契合度上出了岔子。本文就从函数空间的视角切入聊聊为什么在H01H_0^1H01空间中建模能为有限元提供天然的稳定性以及它是如何通过对‘能量’的刻画让模拟不再轻易‘原地爆炸’的。”学习路线理解连续介质力学中的基本对象学习位移梯度和应变、应力在L2L^2L2和H01H_0^1H01中建模搞清楚为什么L2L^2L2会炸一个直观的数值例子1. 连续介质力学中的基本对象位移场uuu在开始之前要先从高中的思维转变过来。高中物理里一个质点就是一个点给它一个力它就动。但连续介质力学研究的对象是由无数个质点组成的连续体比如一块钢板、一团橡皮泥。我们关心的不是某一个质点而是整个连续体里每一个点在受力后跑到哪里去了。这就引出了位移场的概念u(x,y,z)[ux(x,y,z)uy(x,y,z)uz(x,y,z)]u(x,y,z) \begin{bmatrix} u_x(x,y,z) \\ u_y(x,y,z) \\ u_z(x,y,z) \end{bmatrix}u(x,y,z)ux(x,y,z)uy(x,y,z)uz(x,y,z)输入是连续体里某个质点的坐标(x,y,z)(x, y, z)(x,y,z)输出是这个质点在受力后的位移量。注意这里uuu是一个向量场连续体里每一个点都对应一个位移向量。扩展知道位移就能算应变知道应变通过本构关系能算应力知道应力就能写平衡方程∇⋅σb0\nabla \cdot \sigma b 0∇⋅σb0这就建立了偏微分方程接下来要么在 Sobolev 空间里找弱解要么用有限元数值求解2. 从位移到应力位移梯度、应变、本构关系2.1 位移梯度有了位移场uuu下一步是对它求导得到位移梯度∇u∂u∂x[∂ux∂x∂ux∂y∂ux∂z∂uy∂x∂uy∂y∂uy∂z∂uz∂x∂uz∂y∂uz∂z]\nabla \boldsymbol{u} \frac{\partial \boldsymbol{u}}{\partial \boldsymbol{x}} \begin{bmatrix} \frac{\partial u_x}{\partial x} \frac{\partial u_x}{\partial y} \frac{\partial u_x}{\partial z} \\ \frac{\partial u_y}{\partial x} \frac{\partial u_y}{\partial y} \frac{\partial u_y}{\partial z} \\ \frac{\partial u_z}{\partial x} \frac{\partial u_z}{\partial y} \frac{\partial u_z}{\partial z} \end{bmatrix}∇u∂x∂u∂x∂ux∂x∂uy∂x∂uz∂y∂ux∂y∂uy∂y∂uz∂z∂ux∂z∂uy∂z∂uz这是一个3×33\times33×3的矩阵描述的是连续体在某点附近局部的变形情况。2.2 应变张量取位移梯度的对称部分得到柯西应变张量ε(u)12(∇u∇u⊤)\varepsilon(u) \frac{1}{2}(\nabla u \nabla u^\top)ε(u)21(∇u∇u⊤)取对称部分是因为我们只关心纯变形不关心刚体转动——反对称部分描述的是转动不产生内力。扩展这里的ε(u)\varepsilon(u)ε(u)是小变形假设下的线性化应变适用于柯西应力框架处理大变形时线性化失效需要引入变形梯度张量FI∇u\mathbf{F} \mathbf{I} \nabla uFI∇u并使用格林-拉格朗日应变张量2.3 本构关系与应力有了应变通过本构关系推导出应力σ(u)C:ε(u)\sigma(u) \mathbb{C} : \varepsilon(u)σ(u)C:ε(u)C\mathbb{C}C是四阶弹性张量就是写代码时那个包含杨氏模量EEE、泊松比ν\nuν的矩阵:::是双点积表示两个张量在对应维度上缩并求和整个链条就是u→∇u→ε(u)→σ(u)→∇⋅σb0u \rightarrow \nabla u \rightarrow \varepsilon(u) \rightarrow \sigma(u) \rightarrow \nabla \cdot \sigma b 0u→∇u→ε(u)→σ(u)→∇⋅σb0。注意这里有个关键依赖应力σ\sigmaσ的存在依赖于∇u\nabla u∇u的存在。这个依赖关系正是接下来问题的根源。3. 在哪个函数空间建模L2L^2L2会炸H01H_0^1H01才稳3.1 为什么L2L^2L2不行L2L^2L2空间的定义只有一个要求函数本身平方可积即∫∣u∣2 dx∞\int |u|^2 \, dx \infty∫∣u∣2dx∞听起来挺合理。但问题在于L2L^2L2对导数没有任何约束。一个L2L^2L2函数完全可以在某些点上有奇异性弱导数根本不存在。回想一下上面的本构链σ∼C:ε∼∇u\sigma \sim \mathbb{C} : \varepsilon \sim \nabla uσ∼C:ε∼∇u。如果∇u\nabla u∇u不存在或者不可积那么应变ε\varepsilonε没有意义应力σ\sigmaσ没有意义系统总应变能∫σ:ε dx\int \sigma : \varepsilon \, dx∫σ:εdx直接发散这就是为什么L2L^2L2方案在网格加密时应力会一直涨——函数空间根本没有保证导数是可控的网格越细奇异性就越被看见算出来的应力就越大。3.2 为什么H01H_0^1H01更稳H1H^1H1是一个 Sobolev 空间它的要求比L2L^2L2多了一条一阶弱导数也必须平方可积即u∈L2且∇u∈L2u \in L^2 \quad \text{且} \quad \nabla u \in L^2u∈L2且∇u∈L2下标000即H01H_0^1H01表示在边界上施加齐次狄利克雷条件也就是物体边界被固定、位移为零的物理情形。强制要求u∈H01u \in H_0^1u∈H01就自动保证了∇u∈L2\nabla u \in L^2∇u∈L2从而应变ε∈L2\varepsilon \in L^2ε∈L2应力σ∈L2\sigma \in L^2σ∈L2系统总应变能∫σ:ε dx\int \sigma : \varepsilon \, dx∫σ:εdx有限有物理意义由Lax-Milgram 定理保证弱解存在且唯一有限元刚度矩阵条件数可控误差分析收敛4. 一个直观的数值例子光说不练假把式来看数值实验。完整代码https://colab.research.google.com/drive/1u8I2STixmTuEeof99jcgqoiuuT5gHxju#scrollToMvlRX1c-M4XH对同一个弹性体问题分别用L2L^2L2和H01H_0^1H01近似随着网格加密NNN增大网格尺寸hhh减小看最大应力的变化对比L2 与 H01 近似的最大应力 N h L2最大应力 H01最大应力 20 0.05000 4.922136e00 4.750000e-01 40 0.02500 6.799555e00 4.875000e-01 80 0.01250 9.431772e00 4.937500e-01 160 0.00625 1.314286e01 4.968750e-01结果很直接L2L^2L2近似网格越细最大应力越大根本没有收敛的意思。这在物理上毫无意义——你观察得越仔细材料就越危险H01H_0^1H01近似最大应力始终有界单调收敛于真实上界0.50.50.5稳如老狗这就是函数空间选择的代价。不是数值方法写错了不是网格质量不够好是从一开始问题就建错了。总结从位移场uuu出发经过位移梯度∇u\nabla u∇u、应变ε\varepsilonε、本构关系最终建立平衡方程∇⋅σb0\nabla \cdot \sigma b 0∇⋅σb0。这条链上每一步都依赖导数的存在性。L2L^2L2只管函数本身导数爱咋样咋样——结果就是应力爆炸、数值发散。H01H_0^1H01把导数也纳入管控Lax-Milgram 定理给你兜底弱解存在唯一有限元老老实实收敛。所以下次再遇到数值炸了先别急着调参、换网格。问自己一句我的问题是在哪个函数空间里建的下一节‘水课’我们想可以写如何从H01H_0^1H01空间出发利用测试函数推导弱解并深入探讨弱收敛Weak Convergence在变分问题中的角色。还有梯度求解和网格细分的内容也会尽快更新