Apache Pegasus 安全认证模块中的空指针问题分析与修复

2025-07-06 07:46:29作者：宣聪麟

问题背景

在分布式存储系统 Apache Pegasus 的最新版本中，当启用安全认证功能时，Replica 服务启动过程中出现了严重错误。系统在初始化安全认证模块时触发了一个断言失败，导致服务进程异常退出并生成核心转储文件。

错误现象

服务启动日志显示以下关键错误信息：

E2024-09-04 12:06:36.870 replica.default2.0201000500000008: compaction_filter_rule.cpp:109:create_from_bytes(): assertion expression: (s) != nullptr
F2024-09-04 12:06:36.870 replica.default2.0201000500000008: compaction_filter_rule.cpp:109:create_from_bytes(): null source pointer would lead to undefined behaviour

技术分析

通过分析核心转储文件的调用栈，我们发现问题的根源在于 SASL 认证过程中的内存处理不当。具体来说：

在 sasl_client_wrapper::step 函数中，调用了 SASL 库的 sasl_client_step 函数
该函数可能返回一个空指针作为认证消息内容（msg）
随后代码直接将这个可能为空的指针传递给 blob::create_from_bytes 函数
create_from_bytes 函数内部有严格的空指针检查，导致断言失败

根本原因

问题的本质在于对 SASL 库函数返回值的处理不够健壮。SASL 认证过程中，某些情况下（如认证失败或特定状态）确实会返回空指针作为消息内容。而 Pegasus 的 blob 创建函数设计上不允许接受空指针，这导致了系统崩溃。

解决方案

修复方案需要从两个层面考虑：

防御性编程：在调用 create_from_bytes 前检查指针是否为空
业务逻辑处理：正确处理 SASL 认证过程中可能返回空消息的情况

具体实现上，可以在 sasl_client_wrapper::step 函数中添加对返回消息的检查：

if (msg == nullptr || msg_len == 0) {
    output = blob();
} else {
    output = blob::create_from_bytes(msg, msg_len);
}

影响范围

该问题影响所有启用了安全认证功能的 Pegasus 集群，特别是在以下配置条件下：

enable_auth = true
使用 SASL/Kerberos 认证
在认证初始化阶段可能出现异常情况

预防措施

为避免类似问题，建议在代码开发中：

对所有外部库函数的返回值进行充分检查
对可能为空的指针参数进行防御性处理
在关键数据结构（如 blob）的接口文档中明确说明对参数的要求
增加单元测试覆盖各种边界条件

总结

这个问题的修复不仅解决了系统崩溃的紧急问题，更重要的是提醒我们在与外部库集成时需要特别注意接口契约和错误处理。在分布式系统的安全模块中，这种健壮性尤为重要，因为安全认证往往是系统启动的第一个关键路径。

incubator-pegasus

Apache Pegasus - A horizontally scalable, strongly consistent and high-performance key-value store

项目地址：https://gitcode.com/gh_mirrors/in/incubator-pegasus

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Apache Pegasus 安全认证模块中的空指针问题分析与修复

问题背景

错误现象

技术分析

根本原因

解决方案

影响范围

预防措施

总结

热门内容推荐

最新内容推荐

项目优选

Apache Pegasus 安全认证模块中的空指针问题分析与修复

问题背景

错误现象

技术分析

根本原因

解决方案

影响范围

预防措施

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选