RISC-V ISA手册中PMA与PBMT机制深度解析
2025-06-16 06:16:10作者:乔或婵
物理内存属性(PMA)基础概念
RISC-V架构中的物理内存属性(PMA)是描述物理内存区域特性的重要机制。PMA定义了内存区域的基本访问特性,包括但不限于:
- 可缓存性(Cacheable)
- 共享性(Shareable)
- 内存类型(普通内存/设备内存)
- 访问权限(读/写/执行)
PMA具有以下关键特征:
- 静态配置:通常在系统启动时由硬件或固件预先定义
- 区域粒度:以连续物理地址区域为单位配置,而非按页配置
- 全局有效:适用于所有特权级和地址转换模式
- 基础属性:为所有内存访问提供默认属性配置
页基内存类型(PBMT)扩展机制
PBMT是RISC-V的可选扩展,通过页表项(PTE)中的专用字段实现对PMA的细粒度覆盖。其核心特点包括:
- 页级控制:允许以单个内存页(通常4KB)为单位覆盖PMA属性
- 两阶段支持:在虚拟化环境中同时作用于VS-stage和G-stage转换
- 属性覆盖:只能强化PMA属性,不能弱化原有约束
PBMT在PTE中占用2位(62-61),编码四种类型:
- 00: 无覆盖(使用原始PMA)
- 01: 非缓存(NC)
- 10: I/O设备(IO)
- 11: 保留
PMA与PBMT的交互规则
单阶段转换场景
- 当satp.MODE=Bare或PBMT=00时,直接使用PMA定义的内存属性
- 当启用分页且PBMT≠00时,使用PTE中PBMT指定的属性覆盖PMA
两阶段转换场景
-
G-stage处理:
- 若hgatp.MODE≠Bare且PBMT_G≠00,则中间属性=PBMT_G
- 否则中间属性=PMA原始属性
-
VS-stage处理:
- 若vsatp.MODE≠Bare且PBMT_VS≠00,则最终属性=PBMT_VS
- 否则最终属性=G-stage产生的中间属性
关键设计原理分析
- 安全隔离:Hypervisor通过G-stage PBMT控制Guest OS可见的内存属性
- 属性强化:PBMT只能施加更严格的访问约束,确保不会绕过PMA的安全限制
- 虚拟化透明:Guest OS的VS-stage PBMT在Hypervisor控制的中间属性基础上进一步限制
典型应用场景
-
设备内存映射:
- PMA定义大范围设备区域为I/O属性
- PBMT可精细控制特定设备页的缓存策略
-
性能优化:
- 对频繁访问的数据页启用缓存
- 对DMA缓冲区标记为非缓存
-
虚拟化场景:
- Hypervisor控制物理设备的内存类型
- Guest OS管理其虚拟设备的内存属性
实现注意事项
- 一致性保障:当同一物理地址通过不同属性访问时,需要适当的内存屏障和缓存维护操作
- 访问错误处理:对PMA标记为"不可访问"的区域,PBMT不应使其变为可访问
- 虚拟化支持:需要正确处理menvcfg和henvcfg中的PBMTE控制位
RISC-V的PMA+PBMT机制提供了灵活而安全的内存属性管理方案,既支持粗粒度的物理区域配置,又允许细粒度的页级控制,特别适合现代异构计算和虚拟化环境的需求。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0171
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook090
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
BitCPM-CANN-8BBitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值化)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速,覆盖了从自定义三值算子到基于昇腾 910B 的分布式并行训练的完整训练栈。Python00
MiniCPM5-1BMiniCPM5-1B,这是 MiniCPM5 系列的首款模型。它是一个专为端侧、本地部署和资源受限场景打造的 10 亿参数密集型 Transformer 模型,达到了 10 亿参数级开源模型的 SOTA 水平Jinja00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0239
项目优选
收起
暂无描述
Dockerfile
748
4.85 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
640
1.26 K
Ascend Extension for PyTorch
Python
684
824
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
831
1.82 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
449
412
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.02 K
1.03 K
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.49 K
171
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
927
553
暂无简介
Dart
995
256
昇腾LLM分布式训练框架
Python
172
211