Apache HugeGraph PD 日志滚动问题分析与解决方案

2025-06-29 16:51:58作者：齐添朝

问题背景

在Apache HugeGraph分布式图数据库系统中，PD(Placement Driver)组件负责集群的元数据管理和调度。在实际部署过程中，开发人员发现通过start-hugegraph-pd.sh脚本启动服务时，日志文件没有按照预期的滚动策略进行管理。

问题现象

当执行start-hugegraph-pd.sh脚本启动PD服务时，虽然配置了log4j2.xml文件定义了日志滚动规则，但实际生成的日志文件并未按照配置进行滚动切割。这会导致日志文件持续增长，可能带来以下问题：

单个日志文件过大，影响日志查看效率
磁盘空间被大量占用
历史日志无法自动清理
日志检索和管理困难

技术分析

经过深入分析，发现问题根源在于脚本与日志配置之间的不匹配。具体表现为：

脚本变量未与日志配置对齐：start-hugegraph-pd.sh脚本中定义了OUTPUT变量用于指定日志输出路径，但这个变量并未在log4j2.xml配置文件中被引用。
日志系统配置完整但未被正确应用：log4j2.xml中已经配置了完善的日志滚动策略，包括：
- 基于文件大小的触发策略(128MB)
- 基于时间的触发策略(每天)
- 日志保留策略(最多16个文件)
- 自动清理机制(超过2GB或100个文件时清理)
路径定义不一致：脚本和配置文件使用了不同的路径定义方式，导致日志系统无法正确应用配置的滚动规则。

解决方案

要解决这个问题，需要确保脚本和日志配置之间的协调一致。具体解决方案如下：

统一日志文件路径定义：
- 修改start-hugegraph-pd.sh脚本，确保OUTPUT变量值与log4j2.xml中定义的日志路径一致
- 推荐设置为："logs/hugegraph-pd.log"
验证日志配置：
- 检查log4j2.xml中的RollingRandomAccessFile配置
- 确认fileName和filePattern属性正确指向预期的日志路径

完整的日志滚动配置：

<RollingRandomAccessFile name="file" 
                        fileName="logs/hugegraph-pd.log"
                        filePattern="logs/$${date:yyyy-MM}/hugegraph-pd-%d{yyyy-MM-dd}-%i.log">
    <Policies>
        <SizeBasedTriggeringPolicy size="128MB"/>
        <TimeBasedTriggeringPolicy interval="1" modulate="true"/>
    </Policies>
    <DefaultRolloverStrategy max="16">
        <Delete basePath="logs" maxDepth="2">
            <IfFileName glob="*/*.log"/>
            <IfAny>
                <IfAccumulatedFileSize exceeds="2GB"/>
                <IfAccumulatedFileCount exceeds="100"/>
            </IfAny>
        </Delete>
    </DefaultRolloverStrategy>
</RollingRandomAccessFile>