Chisel3中Verilator模拟器对initial语句处理问题的分析与解决
2025-06-14 11:34:00作者:史锋燃Gardner
问题背景
在数字电路设计中,Chisel3是一个基于Scala的硬件构造语言,它能够生成Verilog代码。当使用Verilator进行仿真时,开发人员发现了一个关于initial语句执行顺序的重要问题。
问题现象
当Chisel3生成的Verilog代码中包含需要随机初始化的存储器(Mem)时,仿真过程中出现了初始化失效的情况。具体表现为:
- 存储器模块中包含了使用
initial块实现的随机初始化逻辑 - 测试平台(testbench)中也包含了一个
initial块来启动仿真 - 在Verilator仿真时,测试平台的
initial块先于存储器初始化的initial块执行 - 导致整个仿真过程在存储器初始化完成前就已经运行完毕
技术分析
Verilog初始块执行机制
在Verilog/SystemVerilog中,initial块用于在仿真开始时执行一次性的初始化操作。标准规定:
- 所有
initial块在仿真开始时并行执行 - 执行顺序没有严格定义,由仿真器决定
- 不同仿真器可能有不同的调度策略
Verilator的特殊性
Verilator作为Verilog到C++的转换器,其调度策略与传统的Verilog仿真器有所不同。在转换过程中:
- 它会将所有
initial块转换为C++代码 - 执行顺序可能受到转换过程的影响
- 特别是当涉及DPI-C接口调用时,顺序问题更加明显
解决方案探讨
初步建议方案
最初提出的解决方案是将测试平台的启动代码从initial块改为final块:
final begin
simulation_body();
end
这种方案的优点:
- 确保初始化完成后才运行仿真
- 实现简单直接
但这种方案存在潜在问题:
final块的执行顺序同样没有严格定义- 如果有多个
final块,统计信息可能无法正确收集 - 不符合常规的测试平台设计模式
最终采纳方案
经过深入分析,开发团队采用了更健壮的解决方案:
- 在测试平台中使用显式的状态机
- 将仿真启动代码放在
always块中 - 通过一个初始块设置启动标志
核心代码如下:
reg simulation_start = 0;
initial begin
simulation_start = 1;
end
always @(posedge simulation_start) begin
simulation_body();
end
这种方案的优点:
- 明确控制执行顺序
- 不依赖仿真器的调度策略
- 保持代码的可读性和可维护性
- 兼容各种仿真器环境
对Chisel3用户的影响
这一修复对Chisel3用户意味着:
- 存储器随机初始化功能现在可以正常工作
- 仿真结果更加可靠
- 不需要用户自行修改测试平台代码
- 提高了使用Verilator进行验证的可信度
最佳实践建议
基于这一问题的解决,建议Chisel3用户:
- 当使用存储器随机初始化时,确保使用最新版本的Chisel3
- 在测试平台设计中,避免过度依赖
initial块的执行顺序 - 对于关键初始化逻辑,考虑使用显式的状态控制
- 在跨仿真器验证时,特别注意初始化顺序问题
总结
Chisel3团队通过引入显式状态机的方式,优雅地解决了Verilator仿真器中initial语句执行顺序的问题。这一改进不仅修复了存储器初始化失效的bug,也为Chisel3生成的代码在各种仿真环境下的可靠运行提供了更好的保障。这体现了Chisel3项目对代码质量和仿真一致性的高度重视,也展示了开源社区通过协作解决问题的有效模式。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0117
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
omega-aiOmega-AI:基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多线程与GPU运算,GPU支持CUDA,CUDNN。Java04
llm-universe本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/Jupyter Notebook08
项目优选
收起
暂无描述
Dockerfile
764
4.97 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.92 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
678
1.33 K
Ascend Extension for PyTorch
Python
719
876
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
455
437
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.09 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
150
252
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
302
117
昇腾LLM分布式训练框架
Python
178
220