Apache Traffic Server 9.2.6版本root用户启动问题分析

2025-07-07 04:40:00作者：庞队千Virginia

Apache Traffic Server（ATS）是一款高性能、模块化的网络代理和缓存服务器。在9.2.6版本中，用户发现了一个重要的权限管理问题：当以root用户身份启动时，服务会意外终止。

问题背景

在Linux系统中，以root权限运行服务通常被认为是不安全的做法。最佳实践是服务启动后立即降低权限级别，以非特权用户身份运行。ATS采用了这种安全策略，通过ImpersonateUser()函数实现权限降级。

问题根源

问题的根本原因在于权限降级过程中的执行顺序和权限检查机制。当traffic_manager进程（以root身份运行）首先调用ImpersonateUser()函数时，它会成功完成以下操作：

设置进程组ID
设置真实和有效组ID
设置真实和有效用户ID

然而，当traffic_server进程随后尝试同样的权限降级操作时，由于前一步已经降低了权限，此时进程不再具有root权限，导致setgroups系统调用失败并返回EPERM错误。

技术细节

在Linux系统中，setgroups系统调用有以下限制：

只有具有CAP_SETGID能力的进程才能成功调用setgroups
一旦进程放弃了root权限，就无法再修改组信息

ATS的权限降级流程中，traffic_manager和traffic_server都尝试执行相同的降级操作，这在设计上存在冗余。正确的做法应该是确保权限降级只执行一次，或者在第二次尝试时跳过已经完成的操作。

解决方案

开发团队提出了一个优雅的解决方案：在ImpersonateUser()函数中添加权限检查。只有当当前进程仍以root身份运行时，才执行initgroups操作。这样可以避免在已经降权的情况下再次尝试修改组信息。

修改后的代码逻辑如下：

if (geteuid() == 0) {
    if (initgroups(pwd->pw_name, pwd->pw_gid) != 0) {
        Fatal("switching to user %s, failed to initialize supplementary groups ID %ld", pwd->pw_name, (long)pwd->pw_gid);
    }
}

影响与启示

这个问题提醒我们，在涉及权限管理的系统编程中需要特别注意：

权限降级操作应该是单向且不可逆的
多个相关进程间的权限变更需要协调一致
系统调用的返回值必须仔细检查，特别是权限相关的操作

对于ATS用户来说，这个修复确保了系统可以继续按照预期以root身份启动并安全降权，同时保持了系统的安全性和稳定性。这也是开源社区快速响应和解决问题的典型案例。

trafficserver

项目地址：https://gitcode.com/gh_mirrors/traf/trafficserver

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781