Selfie项目中RISC-V指令解码问题的分析与修复

2025-07-01 05:15:17作者：鲍丁臣Ursa

An educational software system of a tiny self-compiling C compiler, a tiny self-executing RISC-V emulator, and a tiny self-hosting RISC-V hypervisor.

项目地址：https://gitcode.com/gh_mirrors/sel/selfie

问题背景

在Selfie项目的Rotor组件中，研究人员发现其RISC-V指令解码功能存在若干问题。具体表现为对于某些特定指令类型（如lui、andi和auipc等），解码后显示的立即数值与标准工具riscv64-unknown-elf-objdump的输出结果不一致。

问题现象分析

通过对比测试发现，Rotor解码器在以下三种情况下会产生错误的立即数输出：

高位扩展问题：对于lui和auipc指令，Rotor输出的立即数会在标准值后面附加"000"。例如，当objdump显示0x1时，Rotor会显示0x1000。
符号扩展问题：同样针对lui指令，当处理负值时，Rotor会输出类似"FFFFFFFF?000"的格式，而实际上应该显示符号扩展后的完整32位值。
完全错误值：对于andi指令，Rotor有时会输出完全错误的立即数值，且这种错误没有明显的模式可循。

技术原因探究

经过深入分析，这些问题主要源于以下几个方面：

立即数移位处理不当：RISC-V架构中，lui和auipc指令的立即数需要左移12位。Rotor在解码时可能错误地保留了移位后的值，而非原始立即数。
符号扩展缺失：对于需要符号扩展的指令，Rotor没有正确处理符号位，导致负值显示不正确。
位域提取错误：andi指令的立即数位于指令编码的不同位置，可能在位域提取过程中存在错误。

解决方案

针对上述问题，开发团队实施了以下修复措施：

修正移位处理：对于需要移位的指令，确保在显示时使用原始立即数值而非移位后的值。
完善符号扩展：在解码过程中增加符号扩展处理，确保负值能够正确显示。
重新验证位域提取：仔细检查所有指令类型的位域提取逻辑，特别是andi等I-type指令的立即数提取。

验证与测试

修复后，通过以下方法验证改进效果：

使用标准测试用例编译生成RISC-V二进制文件
同时使用riscv64-unknown-elf-objdump和修复后的Rotor进行反汇编
对比两者的输出结果，确认立即数显示一致
特别关注原先存在问题的指令类型

遗留问题

尽管大部分问题已解决，但lui指令在某些情况下仍存在显示问题。这可能是由于：

特殊情况的处理逻辑不够完善
32位与64位环境下的处理差异
边缘案例（如最大/最小值）的测试覆盖不足

总结与建议

RISC-V指令解码是工具链中的重要基础功能，其准确性直接影响后续的分析和调试工作。针对此类问题，建议：

建立更完善的测试用例集，覆盖各种指令类型和边界值
实现自动化测试框架，定期与标准工具的输出进行比对
加强对RISC-V指令编码规范的理解，特别是立即数的各种编码方式
考虑引入更结构化的指令解码框架，降低人为错误的可能性

通过这次问题的分析和修复，不仅解决了具体的解码错误，也为提高整个项目的稳定性和可靠性积累了宝贵经验。

An educational software system of a tiny self-compiling C compiler, a tiny self-executing RISC-V emulator, and a tiny self-hosting RISC-V hypervisor.

项目地址：https://gitcode.com/gh_mirrors/sel/selfie

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端