FluidNC项目中的文件执行导致系统重启问题分析与修复

2025-07-07 17:03:54作者：宣聪麟

问题背景

在FluidNC 3.9.0版本中，用户报告了一个严重问题：当尝试执行已知良好的G代码文件时，控制系统会意外重启。这个问题影响了多个用户，且在不同硬件配置上都可重现，表明这是一个普遍性缺陷而非个别现象。

用户在使用FluidNC 3.9.0版本时发现：

通过系统崩溃时的堆栈跟踪分析，问题出现在Job类的active()方法中。核心问题在于：

深入分析发现，问题源于对Job::active()方法的修改不当。该方法原本只检查任务队列是否为空：

bool Job::active() {
    return !job.empty();
}

被修改为同时检查activeChannel状态：

bool Job::active() {
    return !job.empty() || activeChannel;
}

这种修改虽然在Flowcontrol.cpp中的某些情况下是合理的，但在其他21处使用该方法的场景中却导致了问题。特别是当activeChannel为真而任务队列为空时，系统错误地认为有活动任务，进而访问无效内存导致崩溃。

经过社区协作，确定了以下修复方案：

修复后的代码通过了所有测试用例，包括专门的fixture测试套件，确认解决了文件执行导致的重启问题。

该问题影响FluidNC 3.9.0版本，已在3.9.1版本中修复。建议所有使用3.9.0版本的用户尽快升级到修复版本。

对于嵌入式运动控制系统开发，建议：

这个问题展示了即使是看似简单的逻辑修改，在实时嵌入式系统中也可能导致严重后果，强调了全面测试和谨慎变更的重要性。

登录后查看全文