XiangShan项目中的指令追踪差异问题分析

2025-06-03 17:20:15作者：咎竹峻Karen

在RISC-V处理器开发过程中，指令执行的精确追踪是验证处理器正确性的重要手段。本文针对XiangShan开源RISC-V处理器项目中出现的指令追踪差异现象进行深入分析，探讨其背后的技术原因和解决方案。

跳转指令执行差异分析

在测试过程中发现，当执行到地址0x80000b9c处的jalr指令时，XiangShan处理器与Spike模拟器表现出不同的行为。XiangShan处理器在执行该指令后，程序计数器(PC)跳转至0x8000e946并触发中断，而Spike模拟器则跳转至0x8000e940。

经过深入分析，这种差异并非XiangShan处理器的设计缺陷。实际上，在差分测试环境下，XiangShan和Spike的指令流是完全一致的。差异产生的原因在于单独运行时，XiangShan和Spike的架构状态初始化可能不一致，导致后续执行路径出现分歧。

CSR寄存器访问指令缺失现象

另一个观察到的现象是，在指令追踪日志中，XiangShan或NEMU模拟器会遗漏某些PC地址的指令记录，而这些指令在Spike的日志中可以找到。特别是涉及mcycle和minstret等CSR寄存器的访问指令（如csrrw指令）。

这种现象源于XiangShan与NEMU的差分测试实现机制。目前，XiangShan项目尚未完全支持所有CSR寄存器的比较功能。当遇到这些特定CSR寄存器的访问指令时，NEMU会选择跳过这些指令的执行，直接从XiangShan复制架构状态。因此，这些指令不会出现在NEMU的指令序列日志中，直到下一条可执行指令才会重新同步。

技术建议与最佳实践

差分测试优先原则：建议开发者始终使用差分测试来验证处理器行为，而非单独运行后比较结果。这能确保架构状态的一致性，避免因初始化差异导致的执行路径分歧。
CSR寄存器支持扩展：对于需要完整指令追踪的场景，可以考虑修改NEMU代码以记录被跳过的CSR访问指令，或者扩展差分测试框架对更多CSR寄存器的支持。
初始化状态一致性检查：特别注意处理器复位后的初始状态，XiangShan复位后PC从0x10000000开始，执行三条指令后跳转至0x80000000，这一过程可能与其他模拟器存在差异。

通过理解这些现象背后的技术原理，开发者可以更有效地使用XiangShan处理器进行开发和验证工作，确保处理器的正确性和可靠性。

XiangShan

Open-source high-performance RISC-V processor

项目地址：https://gitcode.com/GitHub_Trending/xia/XiangShan

登录后查看全文