Cachex项目中的ETS表类型优化：从set到ordered_set的性能探索

2025-07-10 21:50:24作者：房伟宁

背景介绍

在Erlang/Elixir生态系统中，Cachex作为一个高性能的缓存库，其底层默认使用ETS(Erlang Term Storage)的set类型表来实现键值存储。然而，在某些特定场景下，使用ordered_set类型表可能会带来更好的性能表现。

ETS表类型对比

ETS提供了几种不同的表类型，其中set和ordered_set是最常用的两种：

set表：基于哈希表实现，提供O(1)的平均访问时间，键的比较基于严格相等(=:=)
ordered_set表：基于平衡树实现，保持键的有序性，提供O(log n)的访问时间，键的比较基于排序(==)

为什么需要ordered_set支持

在时间序列数据缓存等场景中，数据通常按照时间戳排序。使用ordered_set表可以：

高效执行范围查询（如获取某时间范围内的所有数据）
快速获取最小/最大值（如最早/最晚的时间戳）
保持数据有序性，便于实现基于时间的淘汰策略

实现考量

为Cachex添加ordered_set支持需要考虑以下方面：

兼容性保证：set作为默认选项，确保现有应用不受影响
行为差异处理：处理set和ordered_set在键比较上的细微差别
性能权衡：ordered_set的写入性能略低于set，但读取范围数据时优势明显
API扩展：通过配置选项让用户选择表类型

技术实现建议

实现这一功能需要：

在缓存配置中添加表类型选项
修改ETS表创建逻辑，根据配置选择表类型
确保所有现有功能在两种表类型下都能正常工作
添加相关文档说明不同表类型的适用场景

性能影响评估

ordered_set表的引入会带来以下性能特征变化：

单键读写操作：ordered_set稍慢（O(log n) vs O(1)）
范围查询：ordered_set显著更快（可利用有序性）
内存使用：两者相当
并发性能：两者都支持并发读，写操作需要同步

适用场景推荐

建议在以下场景考虑使用ordered_set：

需要频繁执行范围查询的应用
基于时间或数值范围的数据缓存
需要维护数据有序性的场景
需要频繁获取最小/最大键的应用

总结

为Cachex添加ordered_set表类型支持是一个有价值的增强，它可以在不破坏现有功能的前提下，为特定使用场景提供更好的性能表现。这一改进体现了Erlang/Elixir生态中"让开发者选择合适工具"的哲学，同时也展示了Cachex作为缓存解决方案的灵活性。

cachex

A powerful caching library for Elixir with support for transactions, fallbacks and expirations

项目地址：https://gitcode.com/gh_mirrors/ca/cachex

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch