DeepMD-kit项目中能量模型混合测试失败的排查与分析

2025-07-10 00:39:07作者：蔡丛锟

问题现象

在DeepMD-kit项目的持续集成测试过程中，发现了一个关于能量模型混合测试的间歇性失败问题。测试用例TestEnergyModelHybrid.test在执行过程中出现了张量比较失败的情况，具体表现为：

测试比较了两个计算结果（ret0和ret1）中的"virial"张量
9个元素中有1个元素不匹配（11.1%的失败率）
最大绝对差异为1.929×10⁻¹⁰（允许误差为1×10⁻¹⁰）
最大相对差异为5.051×10⁻⁸（允许误差为1×10⁻¹⁰）

技术背景

DeepMD-kit是一个基于深度学习的分子动力学模拟工具，它使用神经网络来模拟原子间的相互作用势能。在分子动力学模拟中，"virial"张量是一个重要的物理量，它描述了系统的应力状态，对于模拟材料的力学性质至关重要。

测试用例TestEnergyModelHybrid验证的是混合能量模型的正确性，即确保不同实现方式（如直接计算和自动微分）得到的结果在数值上是等价的。

问题分析

从错误信息可以看出，这是一个典型的数值精度问题。具体表现为：

数值不稳定性：虽然差异非常小（10⁻¹⁰量级），但已经超过了测试设置的容差（1×10⁻¹⁰）
间歇性出现：问题不是每次都会出现，说明可能与计算顺序、并行计算或随机初始化等因素有关
特定张量问题：问题出现在virial张量上，而不是能量或力，说明可能涉及二阶导数的计算

在深度学习框架中，这种微小的数值差异可能源于：

浮点运算顺序的不同
并行计算中的线程调度差异
自动微分实现的细微差别
硬件层面的浮点运算优化

解决方案

针对这类数值精度问题，通常有以下几种解决策略：

放宽测试容差：对于这种极小的数值差异，可以适当放宽测试的容差标准
数值稳定性改进：检查计算过程中是否有数值不稳定的操作
确定性计算：确保计算过程是确定性的，避免并行计算带来的不确定性

在DeepMD-kit项目中，开发者选择了第一种方案，通过调整测试的精度要求来解决这个问题。这是因为：

差异极其微小（10⁻¹⁰量级），在实际物理模拟中可以忽略不计
这种差异不会影响模型的物理正确性
严格的数值比较在分布式计算环境下可能不切实际

经验总结

这个案例为我们提供了几个重要的工程实践启示：

数值测试的设计：对于涉及浮点运算的测试，需要合理设置容差，既要保证正确性，又要考虑实际计算中的数值波动
持续集成的稳定性：间歇性失败的测试会影响CI/CD管道的可靠性，需要及时修复
物理意义的考量：在科学计算中，应该更多关注结果的物理意义，而非绝对的数值相等

在分子动力学模拟领域，这种微小的数值差异通常不会影响模拟的物理结果，因此调整测试容差是一个合理且实用的解决方案。这也反映了科学计算软件测试中的一个重要原则：测试应该关注物理正确性，而不仅仅是数学上的严格相等。

deepmd-kit

A deep learning package for many-body potential energy representation and molecular dynamics

项目地址：https://gitcode.com/gh_mirrors/de/deepmd-kit

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.38 K

781