libarchive项目中bsdtar工具对Zstd压缩包校验和的支持问题

2025-06-25 16:21:21作者：温艾琴Wonderful

Multi-format archive and compression library

项目地址：https://gitcode.com/gh_mirrors/li/libarchive

在文件压缩和归档领域，校验和(checksum)是一项重要的数据完整性保障机制。近期在libarchive项目中发现了一个关于bsdtar工具生成Zstandard(.zst)压缩包时缺失校验和的问题，这个问题影响了使用libarchive库的各种工具(如file-roller等)生成的Zstd压缩包。

问题背景

Zstandard(Zstd)是一种现代的高效压缩算法，由Facebook开发并开源。它支持多种校验和算法，默认使用XXH64哈希算法来验证数据完整性。然而，当使用bsdtar工具(基于libarchive)创建.tar.zst归档文件时，生成的压缩包中缺少了这项重要的校验信息。

技术细节分析

通过对比测试可以清楚地观察到这个问题：

直接使用bsdtar创建Zstd压缩包时，生成的归档文件没有校验和
通过管道将bsdtar输出传递给zstd命令行工具时，生成的归档文件包含XXH64校验和

根本原因在于libarchive的Zstd压缩过滤器(archive_write_add_filter_zstd.c)没有正确设置ZSTD_c_checksumFlag参数。这个参数控制着Zstd压缩过程中是否生成并嵌入校验和。

解决方案实现

libarchive开发团队迅速响应并解决了这个问题。解决方案的关键点包括：

在Zstd压缩初始化阶段设置校验和标志
不需要提供配置选项，直接默认启用校验和功能
保持与zstd命令行工具的行为一致

实现上，主要修改了archive_write_add_filter_zstd.c文件，在适当的位置设置了ZSTD_c_checksumFlag参数。这个修改确保了所有通过libarchive生成的Zstd压缩包都会包含校验和信息。

验证与影响

修改后的验证测试显示：

bsdtar生成的Zstd压缩包现在正确包含XXH64校验和
文件大小略有增加(从127B增加到131B)，这是加入校验和的正常开销
使用file-roller等图形界面工具生成的Zstd压缩包也同样受益

这项改进增强了数据完整性验证能力，使得通过libarchive生成的Zstd压缩包与直接使用zstd工具生成的文件具有相同的校验特性。对于依赖数据完整性的应用场景(如软件包分发、备份等)来说，这是一个重要的质量提升。

总结

libarchive项目团队快速响应并解决了Zstd校验和缺失的问题，展现了开源社区高效协作的优势。这个改进使得基于libarchive的工具链生成的Zstd压缩包更加可靠，与生态系统中的其他工具保持了一致性。对于用户而言，这意味着更好的数据安全保障，无需额外操作即可获得完整的数据校验能力。

Multi-format archive and compression library

项目地址：https://gitcode.com/gh_mirrors/li/libarchive

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统