RISC-V ISA手册20250508版本发布:特权与非特权架构全面更新
RISC-V作为一种开源指令集架构,其规范文档的持续演进对于整个生态系统的健康发展至关重要。2025年5月8日,RISC-V国际基金会正式发布了ISA手册的20250508版本,这是继2024年4月11日版本后的又一次重要更新。本次更新涵盖了特权架构(Privileged Architecture)和非特权架构(Unprivileged Architecture)两大部分,引入了多项新特性并对现有规范进行了大量优化和澄清。
架构规范更新概览
RISC-V ISA手册作为指导处理器设计的权威文档,分为特权和非特权两大部分。特权架构定义了处理器在不同特权级别下的行为规范,包括异常处理、内存管理、CSR寄存器等核心机制;非特权架构则包含了基础指令集、扩展指令集等编程者可见的指令规范。
20250508版本中,特权架构部分主要更新了指针掩码(Pointer Masking)机制、双陷阱处理(Double Trap)规范、计数器性能监控等关键特性。非特权架构部分则重点完善了位操作扩展(Bitmanip)、浮点扩展、向量扩展等模块的描述,同时对指令编码和伪指令定义进行了多处修正。
特权架构关键更新
指针掩码是本次更新引入的重要安全特性,它允许软件通过配置特定CSR寄存器来隐藏指针的高位地址,从而增强内存安全性。这一机制特别适用于需要隔离不同安全域的场景,如浏览器沙箱、虚拟化环境等。
双陷阱处理机制(Smdbltrp/Ssdbltrp)的加入解决了处理器在异常处理过程中再次发生异常的复杂情况。规范明确了当处理器在处理一个异常时又遇到第二个异常时的精确行为,这对构建高可靠系统至关重要。
计数器性能监控方面,新增了Smctr/Sscctr扩展,提供了更精细的性能计数器控制能力。同时修正了原有计数器溢出异常的行为描述,使其更加准确和完整。
非特权架构重要改进
位操作扩展(Bitmanip)部分进行了大规模重组,将原先分散的Zbkb、Zbkc和Zbkx子扩展整合到统一章节中。这种调整使得位操作指令集的描述更加系统化,便于开发者理解和使用。
浮点扩展方面,新增了BF16(bfloat16)浮点格式支持章节,这种16位浮点格式在机器学习领域有广泛应用。同时修正了多处浮点指令的伪代码描述,确保与实现行为一致。
向量扩展(Vector Extension)部分进行了多处澄清,特别是明确了向量寄存器索引必须与LMUL/EMUL对齐的要求。此外还修正了向量加密扩展中的几处描述错误,并增加了对向量指令数值示例的准确性改进。
规范澄清与修正
本次更新包含了大量技术澄清和错误修正,体现了RISC-V社区的严谨态度。在特权架构方面,明确了MXR( Make eXecutable Readable)位仅影响显式内存访问的行为,修正了mtime到time寄存器的传播延迟描述,澄清了保护检查也适用于失败的SC(Store Conditional)操作等。
非特权架构方面,修正了C.NOP提示指令的条件描述,统一了"pseudo"伪指令术语的使用,简化了sext/zext指令的总结描述,并修正了多处指令编码图的错误。这些修正虽然看似细微,但对于确保不同实现之间的兼容性具有重要意义。
工具链与构建系统改进
除了规范内容本身的更新,本次发布还包含了对文档构建系统的多项改进。新增了EPUB3格式支持,使手册更便于在移动设备上阅读;优化了并行构建能力,显著缩短了文档生成时间;增加了预提交钩子检查,确保代码质量。
构建系统现在支持将特权和非特权架构作为独立部分构建,也可以整合为完整手册,这种灵活性满足了不同用户的需求。同时移除了硬编码的页码和章节引用,使文档维护更加方便。
总结
RISC-V ISA手册20250508版本的发布标志着这一开源指令集架构的持续成熟。从新增的安全特性到现有规范的精细化描述,从架构概念的澄清到构建系统的优化,本次更新全方位提升了规范文档的质量和实用性。
对于处理器设计者,这些更新提供了更明确的实现指导;对于软件开发人员,修正后的指令描述有助于编写更可靠的代码;对于学术研究者,规范的演进反映了计算机体系结构领域的最新实践。随着RISC-V生态的不断发展,其规范文档的定期更新将继续推动这一开放架构在各个领域的创新应用。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00