ZSTD内存压缩优化：从LZ4m启发到ZSTD 1.5.7的性能突破

2025-05-07 03:40:24作者：尤辰城Agatha

内存压缩的特殊性挑战

内存压缩技术（如ZRAM/Zswap）对算法有着独特要求：需要极低的延迟和快速响应能力。传统压缩算法如ZSTD虽然提供优秀的压缩率，但在处理4KB内存页时存在性能瓶颈。这与内存数据的特性密切相关——内存页通常包含对齐的4字节数据结构（如指针、数组、变量），这种结构化特征为优化提供了可能。

LZ4m的创新启示

2017年韩国研究人员提出的LZ4m算法展示了针对性优化的潜力。其核心创新包括：

4字节粒度处理：以4字节为最小单位进行匹配，减少哈希查找次数
精简编码方案：利用4KB页限制优化字段编码（偏移量仅需10bit）
对齐假设优化：利用内存数据自然对齐特性简化处理流程

测试数据显示，LZ4m相比LZ4实现了60%的压缩加速和20%的解压加速，同时压缩率还略有提升。这种针对性的优化思路为ZSTD的改进提供了重要参考。

ZSTD的优化实践

ZSTD开发团队在1.5.7版本中实现了显著的内存压缩优化，主要改进包括：

性能提升数据（M1 Pro处理器）

级别	压缩比	1.5.6速度	1.5.7速度	提升幅度
-3	1.739x	553MB/s	616MB/s	+11.4%
-1	1.908x	420MB/s	498MB/s	+18.5%
3	2.356x	230MB/s	286MB/s	+24%

关键技术改进

小块数据处理优化：专门优化4KB数据块的压缩流水线
哈希匹配策略调整：针对内存数据结构优化匹配策略
快速模式增强：重点优化ZRAM常用的快速压缩模式

值得注意的是，这些优化在保持ZSTD原有压缩率的同时，显著提升了速度，使得ZSTD在内存压缩场景中的竞争力进一步增强。

架构兼容性考量

优化后的ZSTD保持了良好的通用性：

支持不同页面大小（4K/16K/64K）
兼容x86/ARM/RISC-V架构
保持与传统ZSTD的格式兼容性

对于透明大页（THP）场景，由于大页本身的压缩特性限制，建议仍使用常规内存页进行压缩交换。

未来发展方向

专用字典开发：针对不同架构的内存数据结构特征开发专用字典
硬件加速探索：利用现代CPU的SIMD指令进一步优化
自适应策略：根据数据类型动态选择处理粒度

这些优化将被集成到Linux内核的下一合并窗口，为ZRAM/Zswap等内存压缩技术带来直接性能提升。ZSTD在保持通用性的同时，正逐步成为内存压缩场景的更优选择。

zstd

Zstandard - Fast real-time compression algorithm

项目地址：https://gitcode.com/gh_mirrors/zs/zstd

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解