首页
/ fwupd项目中的文件描述符泄漏问题分析与解决方案

fwupd项目中的文件描述符泄漏问题分析与解决方案

2025-06-24 12:45:59作者:史锋燃Gardner

问题背景

在Linux系统的固件更新管理工具fwupd中,近期发现了一个严重的资源泄漏问题。该问题表现为系统日志中频繁出现"Too many open files"错误,最终导致fwupd守护进程崩溃。这一问题自2025年2月15日开始出现,主要影响长时间运行的fwupd服务。

问题现象分析

当fwupd守护进程运行时,系统管理员可以观察到以下典型症状:

  1. 系统日志中出现大量类似错误:

    failed to open /sys/devices/pci0000:00/0000:00:08.1/uevent: Too many open files
    
  2. 进程最终崩溃并生成核心转储文件

  3. 通过检查进程文件描述符可以发现异常:

    ls /proc/`pidof fwupd`/fd/ | wc -l
    

    结果显示文件描述符数量异常增多(通常超过100个)

根本原因

经过深入分析,发现问题源于fwupd对USB设备描述符文件的不当处理。具体表现为:

  1. 当系统中有USB集线器设备(特别是通过显示器内置的USB集线器)时,fwupd会持续监控这些设备

  2. 在显示器进入DPMS节能模式并唤醒时,USB设备会经历多次断开和重连过程

  3. fwupd在处理这些USB设备事件时,未能正确关闭已打开的设备描述符文件(位于/sys/devices/下的文件)

  4. 每次设备连接都会累积新的文件描述符,最终达到系统限制(通常为1024个)

技术细节

从核心转储分析可以看出,崩溃发生在GLib库尝试创建新的管道时失败。这是因为系统资源(文件描述符)已被耗尽。进一步检查发现,泄漏的文件描述符主要指向:

  • /sys/devices/pci*/usb*/descriptors
  • /sys/devices/pci*/usb*/*/descriptors
  • /sys/devices/pci*/usb*///descriptors

这些文件是Linux内核提供的USB设备信息接口,fwupd通过读取它们来获取USB设备详情。

解决方案

fwupd开发团队已经针对此问题发布了修复补丁,主要改进包括:

  1. 实现了更严格的资源管理机制,确保所有打开的文件描述符都能被正确关闭

  2. 优化了USB设备监控逻辑,减少不必要的文件操作

  3. 增加了资源使用监控,防止类似泄漏再次发生

用户应对措施

对于遇到此问题的用户,建议:

  1. 升级到包含修复补丁的fwupd版本

  2. 临时解决方案可以定期重启fwupd服务:

    systemctl restart fwupd
    
  3. 对于嵌入式或资源受限环境,可以考虑调整系统文件描述符限制:

    echo "fs.file-max = 65536" >> /etc/sysctl.conf
    sysctl -p
    

总结

文件描述符泄漏是系统级软件常见的资源管理问题。fwupd作为系统关键服务,其稳定性直接影响用户体验。此次问题的发现和解决过程展示了开源社区响应问题的效率,也提醒开发者需要特别注意系统资源的生命周期管理。对于终端用户而言,保持软件更新是避免此类问题的最佳实践。

对于开发者而言,这个案例也提供了宝贵的经验:在涉及频繁设备连接/断开的场景下,必须实现完善的资源清理机制,并考虑增加资源使用监控,以提前发现问题。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
23
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
225
2.27 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
flutter_flutterflutter_flutter
暂无简介
Dart
526
116
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
987
583
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
351
1.42 K
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
61
17
GLM-4.6GLM-4.6
GLM-4.6在GLM-4.5基础上全面升级:200K超长上下文窗口支持复杂任务,代码性能大幅提升,前端页面生成更优。推理能力增强且支持工具调用,智能体表现更出色,写作风格更贴合人类偏好。八项公开基准测试显示其全面超越GLM-4.5,比肩DeepSeek-V3.1-Terminus等国内外领先模型。【此简介由AI生成】
Jinja
47
0
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
JavaScript
212
287