RISC-V ISA手册中Smcdeleg与Ssccfg扩展的技术解析
背景介绍
在RISC-V特权架构中,Smcdeleg和Ssccfg是一对密切相关的扩展,它们共同为计数器委托机制提供了硬件支持。这两个扩展分别针对不同的特权级别:Smcdeleg是面向机器模式(M-mode)的扩展,而Ssccfg则是面向监管模式(S-mode)的扩展。
扩展定义与功能划分
Smcdeleg扩展("Sm"代表特权架构和机器级扩展,"cdeleg"代表计数器委托)为硬件线程(hart)添加了所有相关的CSR寄存器,并修改了所有特权级别的行为。这个扩展提供了完整的计数器委托功能,包括:
- 机器级环境配置寄存器(menvcfg)中的CDE位
- 计数器委托相关的控制和状态寄存器
- 跨特权级别的行为修改
Ssccfg扩展("Ss"代表特权架构和监管级扩展,"ccfg"代表计数器配置)则提供了对委托计数器的访问权限,以及新的监管级状态。具体功能包括:
- 访问委托计数器的权限
- 新增的监管级状态寄存器
- 虚拟化支持(包括scountovf和LCOFIs)
实现关系
在标准的RISC-V硬件平台上,Smcdeleg和Ssccfg必须同时实现。这种设计遵循了RISC-V特权架构的常见模式,即一个完整的扩展通常包含机器级部分和监管级部分。类似的例子还包括Smaia/Ssaia和Smcsrind/Sscsrind等扩展对。
这种设计允许:
- 机器模式固件通过menvcfg.CDE位控制是否向监管模式暴露计数器委托功能
- 监管模式软件可以独立检测和使用Ssccfg扩展,无需了解底层机器模式的实现细节
- 保持架构的层次性和可扩展性
技术细节
当监管模式软件(如操作系统内核)通过设备树(DT)或ACPI发现Ssccfg扩展存在时,它可以:
- 访问scountinhibit寄存器
- 通过sireg*寄存器选择计数器(当siselect寄存器值为0x40..0x5F时)
- 使用虚拟化支持功能,包括scountovf和LCOFI(监管级计数器溢出中断)
值得注意的是,即使硬件实现了Smcdeleg扩展,如果机器模式固件将menvcfg.CDE位设为0,监管模式软件将无法看到Ssccfg扩展的功能。
未来架构考虑
虽然当前RISC-V特权规范要求所有硬件平台必须实现机器模式,但架构设计上已经预留了可能性,允许未来出现不依赖机器模式的纯监管模式执行环境。这种前瞻性设计体现在:
- Ssccfg等监管级扩展的独立命名
- 功能上的清晰划分
- 为可能的仿真或非标准实现场景提供支持
这种设计理念确保了RISC-V架构的长期灵活性和适应性,同时也为各种实现场景提供了明确的技术规范。
总结
Smcdeleg和Ssccfg扩展共同构成了RISC-V计数器委托机制的基础,它们的设计体现了RISC-V架构的几个关键特点:
- 特权级别的清晰划分
- 硬件功能的灵活配置
- 当前实现与未来扩展的平衡
- 不同特权级别软件的独立检测和使用能力
理解这对扩展的关系和实现要求,对于开发RISC-V系统的固件和操作系统内核都具有重要意义。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00