首页
/ LTP项目中irqbalance01测试用例在RHEL9系统上的问题分析

LTP项目中irqbalance01测试用例在RHEL9系统上的问题分析

2025-07-01 02:40:39作者:冯爽妲Honey

在Linux内核测试项目(LTP)中,irqbalance01测试用例被设计用于验证系统中断负载均衡功能。最近在RHEL9.3系统上运行时出现了崩溃问题,表现为"realloc(): invalid next size"错误并导致测试被SIGABRT信号终止。

问题现象

测试在s390x架构的LPAR环境中运行时,首先成功收集了16个CPU和12个中断请求(IRQ)的信息,并打印出了中断分布统计表。但在尝试处理/proc/interrupts文件内容时,测试程序因内存分配错误而崩溃。

根本原因分析

通过深入调查发现,问题出在测试代码对/proc/interrupts文件格式的解析逻辑上。原始代码在处理中断编号时存在两个关键缺陷:

  1. 行计数器(row)的递增时机不当,导致数组越界访问
  2. 对文件格式的假设过于严格,未能正确处理现代内核中/proc/interrupts的实际输出格式

具体来说,代码在遇到冒号字符(':')时才会记录中断编号并递增行计数器,但在处理行尾时也会无条件递增行计数器。这种双重递增导致行计数超出预期,最终在内存分配时出现问题。

解决方案

修复方案调整了行计数器的递增逻辑:

  1. 仅在成功解析到中断编号后才递增行计数器
  2. 移除了在处理行尾时的无条件行计数器递增

这种修改确保了行计数与实际解析到的中断数量严格对应,避免了内存越界访问问题。

技术背景

/proc/interrupts是Linux内核提供的一个虚拟文件,它记录了系统中每个CPU处理的中断计数信息。现代内核版本中,这个文件的格式可能包含:

  • 标准硬件中断行
  • 软件中断行
  • 带有描述性名称的中断行
  • 多行格式的中断信息

测试代码需要能够灵活处理所有这些格式变体,而不是做出过于严格的格式假设。

结论

这个案例展示了在编写系统级测试工具时需要注意的几个重要方面:

  1. 对系统接口文件格式的解析必须足够健壮
  2. 内存管理操作必须与实际的解析结果严格对应
  3. 需要考虑不同架构和内核版本间的行为差异

通过这次修复,irqbalance01测试用例增强了对/proc/interrupts文件格式的兼容性,能够在更广泛的环境下可靠运行。

登录后查看全文
热门项目推荐
相关项目推荐