Valkey项目中新型哈希表的结构设计与优化

2025-05-10 17:25:37作者：范靓好Udolf

引言

在Valkey项目的开发过程中，哈希表作为核心数据结构之一，其性能优化一直是开发者关注的重点。近期开发团队针对哈希表实现进行了重要改进，移除了传统的字典(dict)结构，转而采用更高效的新型哈希表设计。本文将深入分析这一改进的技术细节和设计思路。

传统哈希表的局限性

传统Redis哈希表使用字典结构存储键值对，每个键值对都需要单独分配内存空间。这种设计虽然简单直接，但在内存使用效率和访问性能上存在优化空间。特别是在存储大量小型键值对时，内存碎片化和访问开销问题更为明显。

新型哈希表的设计目标

新型哈希表的设计主要围绕以下几个目标：

减少内存分配次数
提高内存局部性
降低访问延迟
保持灵活性以支持不同大小的值

嵌入式存储设计

新型哈希表采用了创新的嵌入式存储方案，针对字段名和值的不同特性进行了差异化设计：

字段名的存储优化

由于哈希表中的字段名在创建后通常不会改变，设计上采用了嵌入式存储：

直接内联存储字段名的SDS(简单动态字符串)结构
包含SDS头部信息和内容
以空字符结尾保证兼容性

这种设计避免了额外的指针解引用，提高了访问速度。

值的存储策略

考虑到值可能频繁变化且大小差异较大，设计上提供了两种存储方式：

嵌入式存储：适用于较小的值，与字段名一起内联存储
指针存储：适用于较大的值，通过指针引用

内存布局方案

开发团队考虑了多种内存布局方案，最终确定了两种主要形式：

完全嵌入式布局

+-----------------------------+-----------------------------+
| 字段名                      | 值                         |
| 头部大小 | 头部 | 内容 \0   | 头部大小 | 头部 | 内容 \0   |
+-----------------------------+-----------------------------+

这种布局适合字段名和值都较小的情况，提供了最佳的内存局部性。

混合式布局

+-------+-----------------------------+
| 值    | 字段名                      |
| 指针  | 头部大小 | 头部 | 内容 \0   |
+-------+-----------------------------+

这种布局将字段名内联存储，而值通过指针引用，适合值较大的情况。将指针前置保证了内存对齐，提高了访问效率。

类型标识方案

为了区分不同的存储格式，团队评估了多种方案：

指针标记方案：利用指针的最低有效位作为类型标识位
- 000表示值通过指针引用
- 001表示完全嵌入式存储
SDS头部标记方案：在字段名的SDS头部中预留类型标识位

最终实现选择了第二种方案，通过在SDS头部中存储类型信息，保持了代码的清晰性和可维护性。

性能优势分析

新型哈希表设计带来了多方面的性能提升：

内存效率提升：嵌入式存储减少了内存分配次数和内存碎片
访问速度加快：改善了内存局部性，提高了CPU缓存命中率
灵活性保持：混合式设计既优化了小对象的存储，又支持大对象的处理

实现考量

在实际实现过程中，开发团队特别注意了以下几点：

内存对齐问题，确保不同布局下的访问效率
与现有SDS实现的兼容性
类型标识的清晰界定
代码的可维护性和可扩展性

总结

Valkey项目中的新型哈希表设计通过创新的嵌入式存储方案，巧妙地平衡了内存效率、访问性能和实现复杂度之间的关系。这种设计特别适合Valkey这类高性能内存数据库的使用场景，为处理大量小型键值对提供了优化解决方案。这一改进不仅提升了当前版本的性能，也为未来的进一步优化奠定了良好的基础。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

465

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.08 K

216