Cubefs项目中BlobStore模块日志级别优化实践

2025-06-09 04:50:09作者：尤峻淳Whitney

cloud-native distributed storage

项目地址：https://gitcode.com/gh_mirrors/cu/cubefs

背景概述

在分布式存储系统Cubefs的BlobStore模块中，调度器(scheduler)的blob_deleter组件负责处理数据块的删除操作。在实际生产环境中发现，当底层存储节点(blobnode)执行数据块(chunk)压缩(compacting)或迁移(migrating)操作时，会触发大量重复的错误日志输出，给系统日志管理带来不必要的压力。

问题现象分析

通过日志分析发现，当blobnode节点正在进行chunk压缩时，blob_deleter组件会持续收到"chunk is compacting"错误。系统在短时间内产生了近28万条ERROR级别日志，内容格式如下：

delete shard failed: bid[180098383], vuid[14894946582529], markDelete[true], code[628], err[chunk is compacting]

类似地，在数据迁移场景下也会出现大量"vuid readonly"错误日志。这些日志虽然记录了系统状态，但本质上属于预期内的正常业务场景，而非真正的系统异常。

技术原理探究

在BlobStore的底层实现中，chunk对象的AllowModify()方法会检查多种状态条件：

磁盘是否可写
chunk是否处于压缩状态
chunk是否处于只读状态
chunk是否处于释放状态

当配置项DisableModifyInCompacting为true时，处于压缩状态的chunk会拒绝所有修改操作(包括删除)，返回ErrChunkInCompact错误。同样，迁移过程中chunk会被标记为只读状态(ChunkStatusReadOnly)，返回ErrReadonlyVUID错误。

优化方案设计

基于对问题的深入分析，我们制定了以下优化策略：

日志级别调整：将"chunk is compacting"和"vuid readonly"这类预期内的业务场景日志从ERROR降级为WARN级别
语义明确化：保留关键错误信息的同时，减少非关键日志的输出频率
系统压力缓解：通过日志级别调整显著降低日志系统的I/O压力

实现细节

优化主要涉及blob_deleter.go文件中的错误处理逻辑。在原始实现中，所有删除失败的情况都记录为ERROR级别日志。优化后，对于特定的预期场景：

压缩状态导致的删除失败记录为WARN
迁移导致的只读状态删除失败记录为WARN
其他真正异常情况仍保持ERROR级别

这种分级处理既保证了关键问题的可观测性，又避免了日志系统的过载。

预期收益

本次优化将带来以下收益：

日志系统稳定性提升：减少约90%的非必要ERROR日志输出
运维效率提高：更清晰的错误分级使问题定位更高效
系统资源节约：降低日志存储和处理的资源消耗
监控准确性改善：ERROR日志真正反映系统异常情况

总结

Cubefs作为大规模分布式存储系统，日志系统的合理设计对运维至关重要。通过对BlobStore模块日志级别的精细化调整，我们实现了在不影响系统可观测性的前提下，显著提升了日志系统的效率。这种基于业务场景的日志分级策略，也为其他分布式系统的日志优化提供了有益参考。

cloud-native distributed storage

项目地址：https://gitcode.com/gh_mirrors/cu/cubefs

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库