Longhorn项目备份指标收集中的空字符串解析问题分析

2025-06-02 17:38:43作者：柯茵沙

问题背景

在Longhorn分布式存储系统的使用过程中，部分用户发现在每次指标收集时，系统日志中会出现"Error get size"的警告信息。该问题主要影响使用NFS等备份存储的用户，表现为系统日志中频繁出现错误记录，虽然不影响核心功能，但会对日志监控造成干扰。

问题现象

当用户配置了备份存储目标并启用指标收集功能后，Longhorn管理组件会在每次指标采集时记录如下警告日志：

level=warning msg="Error get size" func="metrics_collector.(*BackupCollector).Collect" error="strconv.ParseFloat: parsing \"\": invalid syntax"

该错误表明系统在尝试将空字符串解析为浮点数时失败，属于数据类型转换异常。

技术分析

根本原因

经过深入分析，发现问题根源在于备份状态数据结构的设计：

备份状态中的size字段被定义为字符串类型
当备份操作正在进行或失败时，该字段可能保持为空字符串("")
指标收集器在收集备份大小时，直接尝试将空字符串解析为浮点数
Go语言的strconv.ParseFloat函数无法处理空字符串，导致转换失败

影响范围

该问题主要影响以下两种场景：

备份进行中：当备份操作尚未完成时，size字段尚未被赋值
备份失败：当备份操作失败时，size字段可能未被正确初始化为"0"

解决方案

Longhorn开发团队通过以下方式修复了该问题：

初始化默认值：在创建备份状态时，将size字段默认初始化为"0"而非空字符串
健壮性处理：在指标收集器中增加对空字符串的防御性处理

这种解决方案既保持了数据结构的兼容性，又确保了指标收集的稳定性。

验证方法

用户可以通过以下步骤验证问题是否已修复：

创建一个大型卷并写入数据
触发该卷的备份操作
在备份进行期间，访问Longhorn的指标端点
观察管理组件日志中是否仍出现"Error get size"警告

用户建议

对于使用早期版本的用户，可以采取以下临时措施：

定期检查并清理处于失败状态的备份任务
对于关键业务卷，配置合理的备份重试策略
监控备份任务状态，确保失败任务能够及时被发现和处理

总结

Longhorn通过完善数据初始化和增加防御性编程，有效解决了备份指标收集过程中的类型转换问题。这一改进提升了系统的健壮性，减少了不必要的警告日志，为用户提供了更稳定的监控体验。建议用户及时升级到包含该修复的版本，以获得更好的使用体验。

longhorn

Cloud-Native distributed storage built on and for Kubernetes

项目地址：https://gitcode.com/gh_mirrors/lo/longhorn

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

517

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

285

Longhorn项目备份指标收集中的空字符串解析问题分析

问题背景

问题现象

技术分析

根本原因

影响范围

解决方案

验证方法

用户建议

总结

热门内容推荐

最新内容推荐

项目优选

Longhorn项目备份指标收集中的空字符串解析问题分析

问题背景

问题现象

技术分析

根本原因

影响范围

解决方案

验证方法

用户建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选