Hubris嵌入式系统SP更新失败问题分析与解决方案

2025-06-26 04:25:30作者：劳婵绚Shirley

问题现象

在Hubris嵌入式系统的实际部署中，特别是在colo和dogfood环境中，系统平台(SP)在更新至R11版本时出现了间歇性的更新失败问题。故障表现为更新过程中返回错误代码7，对应UpdateError::ReadProtErr错误类型。

通过分析系统日志和Hubris内存转储数据，可以观察到更新过程在EraseEnd阶段后停滞不前。系统内存转储显示，FLASH_SR2寄存器中的RDPERR位被意外置位，导致闪存操作失败。

该问题涉及STM32H7系列微控制器的闪存子系统特性。该系列芯片采用双bank闪存架构，具有以下关键特性：

经过深入调查，发现问题根源在于Cortex-M7内核的指令预取单元行为。该单元会对系统内存区域(0x1FF00000-0x1FF7FFFF)进行推测性指令获取，而这一区域由闪存控制器解码。当发生此类访问时，闪存控制器会设置RDSERR标志表示异常。

在Hubris系统中，我们观察到的是RDPERR而非RDSERR标志被置位，但两者可能具有相似的根源。值得注意的是：

为验证问题假设，我们进行了以下实验：

我们还发现：

基于问题分析，我们确定了两种解决路径：

最终采用了第二种方案，通过配置MPU将系统内存区域标记为Execute-Never，有效阻止了Cortex-M7内核对该区域的推测性访问。这一修改已通过PR#1905合并到主分支。

该案例提供了几个重要的嵌入式系统开发经验：

此问题的解决不仅修复了SP更新失败的问题，也为处理类似硬件特性引发的边缘情况提供了参考模式。

登录后查看全文