Drgn项目s390x架构虚拟地址转换问题的分析与修复

2025-07-07 17:45:54作者：何将鹤

在Linux内核调试工具Drgn的最新开发中，发现了一个影响s390x架构的重要问题：从Linux 6.10内核版本开始，s390x架构的直接映射（direct mapping）区域的内核虚拟地址不再等同于物理地址。这一变更导致Drgn的虚拟地址转换功能在该架构上完全失效。

问题背景

s390x架构（IBM Z系列主机的64位架构）在Linux内核6.10版本之前有一个特殊的设计：内核虚拟地址空间中的直接映射区域（即线性映射区域）的地址值直接对应物理内存地址。这种设计简化了虚拟地址到物理地址的转换过程。

然而，在Linux 6.10版本中，内核提交c98d2ecae08f02bd2dccd24e7e485e9f0211db65改变了这一行为。现在，s390x架构的直接映射虚拟地址需要通过页表转换才能得到对应的物理地址。这一变更虽然提高了安全性，但破坏了Drgn原有的地址转换逻辑。

问题表现

当用户尝试在Linux 6.10+内核上使用Drgn的地址转换功能时，会遇到大量错误，典型表现为：

_drgn.FaultError: could not find physical memory segment: 0x3fffff84000

这些错误出现在各种内存操作场景中，包括但不限于：

识别slab缓存对象
虚拟内存到物理内存的转换
页框号到虚拟地址的转换
vmalloc区域操作

技术分析

Drgn原有的s390x架构支持代码假设可以直接通过虚拟地址访问页表内容。具体来说，在linux_kernel_pgtable_iterator_next_s390x()函数中，它尝试通过物理地址读取页表项。这种实现在旧内核版本中有效，因为虚拟地址和物理地址相同。

然而，在新的内核版本中，这种直接访问方式不再可行，因为：

页表本身也位于内核的直接映射区域
直接映射区域的虚拟地址不再等同于物理地址
访问页表需要通过正确的虚拟地址路径

解决方案

修复方法相对简单直接：修改页表遍历逻辑，确保总是通过虚拟地址访问页表内容。具体来说，需要更新linux_kernel_pgtable_iterator_next_s390x()函数，使其：

使用内核的虚拟地址空间来定位和访问页表
正确处理新的地址转换规则
保持与其他架构一致的页表遍历行为

影响范围

该问题影响：

所有运行Linux 6.10+内核的s390x系统
Drgn的所有内存分析功能
依赖于地址转换的调试操作

修复验证

修复后，所有原先失败的测试用例都能正常通过，包括：

虚拟地址到物理地址的转换
slab缓存识别
页框号转换
vmalloc区域操作

总结

这次修复展示了内核底层变更对调试工具的影响。随着内核安全性和架构设计的演进，调试工具也需要相应调整其内存访问策略。对于s390x架构用户，升级到包含此修复的Drgn版本后，将恢复完整的调试功能。

对于开发者而言，这个案例也提醒我们：当内核改变其内存管理策略时，需要同步检查调试工具的相关假设是否仍然成立。

drgn

Programmable debugger

项目地址：https://gitcode.com/gh_mirrors/dr/drgn

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271