Valkey项目中SCAN命令行为变更的技术解析

2025-05-10 17:27:16作者：郦嵘贵Just

SCAN命令的基本原理

在Valkey和Redis这类键值存储系统中，SCAN命令是一个非常重要的迭代器命令，它允许用户在不阻塞服务器的情况下逐步遍历数据库中的所有键。SCAN命令采用游标机制，每次调用返回一部分键和一个新的游标，当游标返回0时表示迭代完成。

问题背景

最近在Valkey项目中，一个代码提交(3eb8314be6af0777e69f852b65f933dd9186d30b)后，valkey-java客户端的回归测试出现了失败。具体表现为SCAN命令在使用TYPE参数过滤字符串类型键时，游标返回行为发生了变化。

行为变更分析

在变更前，当使用SCAN 0 COUNT 4 TYPE string命令时，即使所有匹配的键都能在一次扫描中返回，系统也会返回一个非零游标。而在变更后，系统会直接返回0游标，表示所有匹配项已经全部返回。

这种变化实际上是SCAN命令实现优化的结果。新的实现在能够一次性返回所有匹配项的情况下，会直接返回0游标，而不是像旧版本那样需要两次调用（第一次返回部分结果和非零游标，第二次返回空结果和0游标）。

技术实现细节

这种变化源于Valkey内部哈希表扫描算法的改进。新版本中，当扫描器发现当前哈希桶中所有匹配项都能满足请求的COUNT参数时，它会直接完成扫描，而不是像旧版本那样总是需要至少两次调用。

具体来说：

旧实现：采用保守策略，即使能一次性返回所有结果，也会保留部分游标状态
新实现：采用更高效的策略，当确定没有更多结果时直接返回0游标

兼容性考虑

虽然这种行为变化没有违反SCAN命令的官方文档约定（文档只规定0游标表示迭代完成），但它确实影响了某些依赖特定行为的客户端测试用例。这提醒我们：

不应该依赖SCAN命令返回特定非零游标值
测试用例应该设计为能处理各种合法的游标返回模式
客户端实现应该只关心0游标表示完成，非零游标表示可能还有更多数据

最佳实践建议

基于这次变更，我们建议开发人员在使用SCAN命令时：

始终正确处理0游标和非零游标两种情况
不要对返回的键顺序或游标值做任何假设
在编写测试用例时，考虑各种可能的合法返回模式
当使用TYPE过滤器时，理解结果集大小会影响游标行为

这次变更实际上是Valkey项目对SCAN命令实现的一次优化，虽然导致了某些测试用例失败，但从技术角度看是正确的行为改进。

valkey

A new project to resume development on the formerly open-source Redis project. We're calling it Valkey, like a Valkyrie.

项目地址：https://gitcode.com/GitHub_Trending/va/valkey

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140