OpenCV新图引擎中LSTM层重复前向传播的Bug分析

2025-04-29 16:47:04作者：齐添朝

问题背景

在OpenCV 5.x版本的深度学习模块中，当使用新图引擎(NGE)运行LSTM层时，发现一个值得注意的问题：如果对同一个LSTM层进行两次前向传播计算，第二次计算会得到错误的结果。这个问题在传统引擎下不会出现，仅在新图引擎中存在。

通过一个简单的测试案例可以重现这个问题：

测试代码显示，第一次前向传播的结果与ONNX Runtime一致，但第二次前向传播的结果出现了偏差。在C++版本的测试中同样可以复现这个问题。

经过深入排查，发现问题根源在于LSTM2LayerImpl::forward()方法的实现。该方法在处理输入时，错误地修改了输入张量input[1]和input[2]，这违反了深度学习框架中前向传播的基本原则。

在深度学习中，前向传播函数应该是纯函数，即：

而当前的实现破坏了这些原则，导致重复调用时产生不一致的结果。

修复方案相对直接：确保forward()方法不修改任何输入参数。具体需要：

这样就能保证无论调用多少次forward()，只要输入相同，输出就一定相同。

该问题影响：

对于单次前向传播或使用传统引擎的情况不受影响。

在使用OpenCV的dnn模块时，特别是涉及循环神经网络时，建议：

这个案例展示了深度学习框架实现中保持函数纯正性的重要性。框架开发者需要特别注意不修改输入参数，确保计算的可重复性。对于用户来说，了解这类问题有助于更好地使用框架并规避潜在风险。

登录后查看全文