
1. 项目概述当机器学习“遇见”分子动力学我们如何看清锂枝晶的生长在锂金属电池的研究中锂枝晶的生长问题就像一个挥之不去的幽灵它直接关系到电池的安全性和循环寿命。我们总在说“枝晶刺穿隔膜导致短路”但这句话背后的微观世界究竟发生了什么原子们是如何“商量”着聚集、成核最终长成那危险的针状结构的传统的实验手段很难实时捕捉这个瞬息万变的动态过程而纯粹的第一性原理计算又受限于其巨大的计算成本难以模拟足够长的时间尺度和足够大的体系。这正是计算模拟特别是分子动力学MD大显身手的地方。但传统的分子动力学力场在描述电化学界面这种涉及电荷转移、电势变化的复杂体系时往往力不从心。要么是固定电荷模型无法反映动态的电荷极化要么是反应力场如ReaxFF计算耗时且长程静电处理精度有待商榷。我们需要一个既能准确描述电荷响应又能保持计算效率的“两全其美”之策。最近我们团队的一项工作将机器学习力场MLFF与一种改进的电荷平衡方法QEq相结合构建了一个“机器学习增强的恒电位分子动力学框架”。这个框架的核心目标非常明确在原子尺度上实时、动态地模拟在外加电势驱动下锂金属-电解质界面处锂枝晶的成核与生长全过程。这不仅仅是把两个时髦的技术拼在一起而是为了解决一个实实在在的科学难题——如何让模拟中的电极“活”起来能够像真实电池一样随着充放电过程发生氧化还原反应并最终诱导出我们最关心的枝晶生长现象。简单来说这个方案就像给分子动力学模拟装上了“智能电荷感应器”和“外部电压控制器”。机器学习力场负责快速且准确地计算原子间的短程相互作用化学键、范德华力等而增强的QEq方法则实时计算每个原子在周围静电环境下的动态电荷。最关键的一步我们引入了“恒电位”约束条件模拟了对电极施加不同电压的场景从而驱动锂离子在界面处的沉积与溶解。最终我们首次在模拟中直接“看到”了锂原子如何在固态电解质界面层中不均匀地聚集、成核并最终生长为枝晶的完整动态图像。这对于理解枝晶的初始形成机制、评估不同电解质或界面修饰策略的抑晶效果提供了前所未有的原子视角和理论工具。2. 核心原理拆解为什么是“机器学习 QEq 恒电位”要理解这个框架的价值我们需要拆解其三个核心组成部分机器学习力场、电荷平衡方法以及恒电位约束。它们各自解决了传统模拟中的哪些痛点又是如何协同工作的。2.1 机器学习力场从“经验公式”到“数据驱动”的精度飞跃传统分子动力学力场依赖于预设的解析函数形式如Lennard-Jones势、谐波键势来描述原子间相互作用。这些函数形式简单、计算快但参数通常基于有限的数据拟合对于复杂的化学反应、电荷转移过程其精度和迁移性常常不足。机器学习力场的核心思想是“用数据说话”。我们首先使用高精度的第一性原理计算如密度泛函理论DFT生成一个涵盖目标体系各种可能构型体相、界面、反应中间体等的数据集包含每个构型的能量、原子受力等信息。然后用一个深度神经网络模型去学习从原子构型邻居原子的种类、距离、角度等到系统总能量和原子受力的复杂映射关系。一旦模型训练完成它在预测新构型时的速度可以比DFT快数个数量级而精度却与DFT相当。在我们的工作中我们训练了一个名为“DP-QEq”的模型。这里的“DP”指的是Deep Potential一种广泛应用且高效的机器学习力场架构。“QEq”则意味着这个力场专门集成了电荷平衡计算模块。一个关键技巧是我们将总能量分解为短程部分和长程静电部分。机器学习模型只负责学习短程相互作用DP_short而长程静电部分则由接下来要讲的QEq方法显式计算。这种分解既保证了静电相互作用的物理准确性又让机器学习模型专注于学习复杂的化学键合行为提高了训练效率和模型精度。2.2 电荷平衡方法让电荷“动”起来的关键在电化学界面电荷分布不是一成不变的。电极表面的原子在电势驱动下会失去或得到电子电解液中的离子也会发生极化。固定的原子电荷模型显然无法描述这一动态过程。电荷平衡方法QEq提供了一种解决方案。其核心是能量最小化原则对于一个给定的原子构型系统会通过调整每个原子的电荷使得包括静电能在内的总能量达到最低。QEq的能量表达式通常包含两部分库仑能描述所有带电荷原子之间的静电相互作用。** onsite能**描述原子自身获得或失去电荷的“代价”与原子的电负性和硬度参数有关。我们的框架对传统QEq做了重要改进精确的长程静电处理我们采用了粒子网格EwaldPME方法来计算周期边界条件下的库仑相互作用并加入了高斯电荷分布校正项和偶极校正项。这确保了在具有真空层或非均质界面的平板模型中静电计算的准确性避免了因截断而产生的非物理效应。高效求解器直接求解QEq的最小化问题需要构造和求逆一个巨大的矩阵Hessian矩阵计算量随原子数平方增长难以用于大体系。我们创新性地使用了投影梯度算法结合JAX库的自动微分功能只需计算能量对电荷的梯度而无需显式构造Hessian矩阵。再利用LBFGS优化器进行迭代求解并将上一步MD模拟的电荷结果作为下一步的初始猜测极大地提升了计算效率实现了接近线性的计算标度。实操心得初始猜值的重要性在动态模拟中体系构型是连续变化的。我们发现将上一个分子动力学步长如1飞秒收敛后的原子电荷作为当前步长QEq迭代求解的初始值可以显著减少LBFGS优化器的迭代次数通常能在10步以内收敛。这比每一步都从零或均匀电荷开始猜计算效率提升了一个数量级。这是保证百皮秒级长时间模拟可行的关键技巧之一。2.3 恒电位约束模拟真实电化学环境的“方向盘”这是整个框架的灵魂也是区别于绝大多数传统MD模拟的关键。在真实的电池中我们通过外电路对电极施加一个固定的电势恒电位从而驱动氧化还原反应。在我们的模拟中如何实现“恒电位”定义电极原子首先需要区分哪些原子属于“电极”。我们通过计算锂原子的配位数CN来判断。如果一个锂原子的Li-Li配位数超过块体金属锂的典型值例如CN 8我们就认为它处于金属电极内部反之则可能是在电解质或SEI中。施加电势偏移对于被判定为电极内部的原子我们在其 onsite能项上增加一个外部电势项φ_i * Q_i。这相当于在能量最小化过程中给这些原子一个“偏好”阳极的原子倾向于带正电φ为负促进氧化Li^0 - Li^阴极的原子倾向于带负电φ为正促进还原Li^ - Li^0。保持整体电中性尽管对电极施加了偏压但模拟的超级元胞整体必须保持电中性这是周期边界条件的要求。我们通过拉格朗日乘子法将总电荷为零作为约束条件加入到QEq的能量最小化中。这里有一个极其重要的物理细节在早期的“玩具模型”两片锂金属电极之间是真空验证中阴极表面确实出现了负电荷积累Li^0 - Li^-。但在真实的“电解质模型”中情况完全不同。电解液和SEI层中存在大量的Li^离子。当阴极被施加还原电位时系统为了平衡电荷不是将阴极金属锂变成Li^-而是还原附近电解液中的Li^离子使其沉积为中性锂原子Li^ - Li^0。这个机制上的区别正是我们的模拟能够重现真实锂沉积过程而非产生非物理假象的基础。注意事项电势参数的选择论文中尝试了多组{φ_阳极, φ_阴极}值最终发现{-2 V, 6 V}的组合能在模拟的时间尺度内百皮秒驱动可观测的锂沉积。这个电压差8 V远大于实际电池的工作电压~3-4 V。这是因为分子动力学模拟的时间尺度皮秒到纳秒远小于真实沉积过程秒到小时为了在有限的计算时间内观察到现象必须施加一个更强的驱动力即更大的过电位。这属于计算模拟中常用的“加速采样”策略其目的是定性揭示机理而非定量复现绝对速率。3. 模拟流程与关键实现步骤理解了原理我们来看如何一步步将这个框架搭建并运行起来。整个过程可以概括为“数据准备 - 模型训练 - 模型验证 - 恒电位模拟 - 结果分析”。3.1 数据集的构建与模型训练这是所有机器学习应用的基石质量决定上限。第一性原理计算使用DFT软件如VASP、ABACUS对目标体系进行大规模采样计算。我们的采样范围包括体相材料块体金属锂、碳酸乙烯酯EC液体、LiPF6盐。界面模型构建不同厚度、不同初始构型的Li金属/ECLiPF6电解质界面模型。反应中间体与产物通过运行短时间的经典MD或反应力场MD捕捉可能的分解路径对生成的构型如Li2O, LiF, Li2CO3, C2H4, CO2等进行DFT计算。主动学习与数据集迭代我们采用DP-GEN等主动学习框架。先用一个小的初始数据集训练一个初步的DP模型然后用这个模型去驱动MD模拟。在模拟过程中如果模型遇到不确定的构型如原子受力方差大则将这些构型挑选出来进行DFT计算并加入训练集重新训练模型。如此迭代多轮直到模型在广泛的相空间内都表现稳定。DP-QEq模型训练从DFT计算的总能量和原子受力中减去由QEq方法计算出的长程静电贡献得到“短程能量”和“短程力”。用这个“短程”数据集去训练DP_short模型。这个模型学习的是扣除静电后纯粹的近程化学相互作用。最终DP_short模型与QEq静电模块在模拟运行时动态结合构成完整的DP-QEq力场。3.2 模型验证双重保险确保可靠性在投入正式的生产模拟前必须对训练好的模型进行严格验证。能量与力的一致性检验在独立的测试数据集上比较DP-QEq模型预测的总能量、原子受力与DFT基准值。如图2a所示我们的模型在测试集上力的均方根误差RMSE可以低至~0.1 eV/Å这对于分子动力学模拟来说精度已经相当高。电荷分布的合理性检验将QEq方法计算的原子电荷与DFT计算后再通过Hirshfeld、CM5等方法进行电荷布居分析的结果进行对比。如图S10所示QEq预测的电荷分布在趋势上与主流的DFT电荷分析方案定性吻合特别是在金属电极内部电荷趋于零这是符合物理预期的。恒电荷模拟验证在施加恒电位之前先进行一段时间的“恒电荷”模拟。在此条件下系统总电荷固定为零且不施加外部电势偏移。运行数百皮秒的NVT或NPT模拟观察体系是否稳定SEI组分是否按已知机理如EC开环分解生成Li2CO3和C2H4PF6-分解生成LiF生成。这验证了力场在描述基础化学反应方面的可靠性。3.3 恒电位分子动力学模拟实战经过验证的模型就可以用于核心的恒电位模拟了。初始构型准备从一个经过充分平衡的Li/电解质界面模型开始。在锂金属板的中间“切一刀”构造一个包含一对对电极的双界面模型。一侧定义为阳极另一侧定义为阴极。固定上下电极最外部的几层锂原子例如4层以模拟块体金属电极的支撑作用同时允许中间层的原子和界面原子自由运动。模拟参数设置积分器使用速度Verlet算法。系综通常采用NVT系综使用Nosé-Hoover热浴将温度控制在300 K。时间步长0.5 到 1.0 飞秒。由于QEq迭代需要时间步长不宜过大。静电计算使用PME方法实空间截断半径通常设为9-12 ÅFFT网格间距约1.0 Å。QEq求解每个MD步都调用前述的投影梯度LBFGS算法求解动态电荷收敛阈值设为1e-6 e。偏压设置对符合电极原子条件的Li原子在QEq的 onsite能项中分别添加φ_anode -2 V和φ_cathode 6 V的偏移。循环模拟与观测我们进行了多轮如4轮连续的恒电位模拟每轮100 ps。模拟中我们实时监测阴极表面附近的锂原子数变化这是锂沉积最直接的证据。原子电荷的空间分布观察电荷在界面处的聚集与耗散。局部锂-锂配位数的演化识别锂原子团簇枝晶前驱体的形成。SEI组分的空间分布变化枝晶倾向于在SEI的薄弱或特定组分区域形核。3.4 结果分析与机理揭示通过上述模拟我们得以在原子尺度上“观看”一部锂枝晶生长的纪录片。成核位点模拟清晰地显示锂枝晶并非直接在光滑的电极表面均匀成核。锂原子首先在固态电解质界面层内部聚集形成小的团簇。这些初始团簇往往位于SEI中无机成分如Li2O, LiF的晶界或缺陷处这些位置的离子电导率可能较高或者机械强度较低为锂的穿透提供了通道。生长过程一旦形成稳定的核在外加阴极电势的持续驱动下电解液中的Li^离子被不断还原并优先添加到这些已有的团簇上导致其沿着特定的晶体学方向如111方向快速生长形成针状或苔藓状的突起。生长前沿的锂原子电荷接近中性而根部与电极相连的部分则存在电荷梯度。SEI的 roleSEI并非一个静态的屏障。我们的模拟显示枝晶的生长会挤压、破坏原有的SEI结构。同时新暴露的锂金属表面又会与电解液反应生成新的SEI形成一个动态的、相互竞争的界面演化过程。不均匀的SEI组分分布是导致锂沉积不均匀的根本原因之一。4. 技术细节、避坑指南与常见问题在实际操作这套框架时会遇到许多技术挑战和选择。这里分享一些关键细节和踩过的坑。4.1 QEq参数的选择与影响QEq方法的核心参数是各元素的电负性χ^0和硬度J。这些参数通常从已有文献或反应力场参数中获取如表S1。但需要注意参数的可转移性从简单分子或块体材料中拟合的参数在复杂的电化学界面中可能不完全适用。如果条件允许可以考虑用DFT计算小分子簇或界面模型的电荷分布对这些参数进行微调。高斯宽度σ用于计算高斯电荷校正项公式S6。通常取元素的共价半径。这个参数对短程静电修正有影响但对长程行为影响不大。保持与主流力场一致即可。4.2 恒电位实施中的“电极原子”判定如何定义“电极原子”是恒电位模拟成败的关键。我们采用基于配位数的判定法# 伪代码示例判断锂原子是否为电极原子 def is_electrode_Li(atom_index, system, cn_cutoff3.5, bulk_cn_threshold8): coord_num calculate_li_li_coordination(atom_index, system, cutoffcn_cutoff) if coord_num bulk_cn_threshold: return True # 属于电极内部 else: return False # 属于SEI或电解液截断半径的选择Li-Li配位数的计算需要一个截断半径。我们测试了3.3 Å和3.5 Å块体Li中最近邻距离约3.0 Å。只要这个值能合理区分块体Li和表面/孤立Li模拟的核心结论枝晶成核是稳健的。“死”电极层固定最外几层电极原子是必要的这模拟了集流体的机械支撑和电子导电作用。但固定层数不宜过多否则会限制电极表面的结构弛豫。通常4-6层是一个平衡的选择。4.3 计算性能与优化DP-QEq模拟的主要计算开销在于每一步的QEq迭代求解和PME长程静电计算。GPU加速充分利用JAX的JIT编译和GPU并行能力。我们的测试表明在NVIDIA V100上对于16000个原子的体系一步QEq计算仅需约0.4秒这使得百皮秒级的模拟成为可能。PME参数调优PME的实空间截断半径和FFT网格尺寸需要在精度和速度间权衡。通常实空间截断取9-12 ÅFFT网格间距~1.0 Å在保证能量守恒的前提下能获得较好的性能。并行策略对于更大的体系可以考虑将DP短程力的计算和QEq/PME计算进行任务级并行。DP模型本身具有良好的并行扩展性。4.4 常见问题与排查模拟中体系能量发散或原子飞溅可能原因1MLFF力场在未知区域预测不准。检查是否在主动学习阶段充分探索了相空间特别是界面反应和枝晶生长可能涉及的高能过渡态构型。回顾训练集和测试集的误差分布看是否存在系统性偏差。可能原因2QEq迭代不收敛。降低MD时间步长如从1 fs降至0.5 fs。检查QEq求解器的收敛容差是否设置过松建议1e-6或更紧。确保上一步的电荷作为下一步的初始猜值。可能原因3PME参数设置不当导致静电能量计算错误。检查体系是否有明显的长程偶极矩。确保使用了偶极校正对于平板模型至关重要。增大实空间截断或加密FFT网格进行测试。施加偏压后没有观察到预期的沉积/溶解可能原因1电势偏移φ设置不当。尝试增大阴阳极之间的电势差。检查判定为“电极原子”的标准是否过严或过松确保偏压施加在了正确的原子上。可能原因2模拟时间不够长。枝晶成核是一个统计性的、可能比较缓慢的过程。尝试延长单次模拟时间或进行多轮重复模拟以增加采样。可能原因3SEI层过厚或致密。初始构型中如果SEI层已经非常完整且坚硬可能会在模拟时间尺度内阻挡锂离子传输和沉积。这本身可能就是一个有趣的发现说明理想SEI的抑晶作用。电荷分布结果看起来不物理如金属内部电荷不为零首先与DFT电荷分析结果对比。使用相同的构型用DFT计算后再用Hirshfeld、CM5等方法分析电荷与QEq结果交叉验证。如果DFT结果也显示金属内部有微小电荷波动可能是界面效应导致的屏蔽不完全如果差异巨大则需检查QEq参数或静电求解设置。检查整体电中性约束。确保在QEq求解中拉格朗日乘子法正确实施了总电荷为零的约束。模拟过程中可以监控总电荷的浮动它应该严格保持在零附近如 1e-10 e。如何分析模拟结果特别是识别枝晶团簇分析使用OVITO等可视化软件中的团簇分析工具Common Neighbor Analysis, CNA 或 基于距离的聚类识别出中性锂原子电荷接近0形成的团簇。跟踪这些团簇的大小、数量和位置随时间的变化。序参数监控定义局部序参数如阴极表面特定区域如距离表面5 Å内的中性锂原子数、该区域的平均锂-锂配位数。这些量的突增往往对应着成核事件。可视化观察这是最直观的方法。将原子按电荷值着色如用蓝-白-红的渐变色表示负-中-正电荷在模拟轨迹中你可以清晰地看到阴极附近如何从弥漫的Li^蓝色中“生长”出中性锂白色的团簇和枝晶。这个机器学习增强的恒电位框架就像为研究电化学界面动力学打开了一扇新的窗户。它不仅仅适用于锂枝晶其原理可以推广到任何涉及电极-电解质界面的体系如钠金属电池、固态电池、电催化表面反应等。将物理驱动的模型与数据驱动的机器学习相结合或许是解决复杂材料体系“多尺度、高精度”模拟挑战的一条必由之路。当然这个框架仍在发展中例如如何更物理地确定施加的电势值、如何耦合更复杂的溶剂化模型等都是未来值得探索的方向。但至少现在我们有了一个强大的工具能够以前所未有的清晰度去窥探那些决定电池生死的界面奥秘。