Shlink项目中短码索引在空域名下的性能问题分析

2025-06-18 17:55:24作者：戚魁泉Nursing

问题背景

在Shlink项目（一个自托管短链接服务）中，当短链接记录没有关联特定域名时（即domain_id字段为NULL），系统在重定向过程中出现了严重的性能下降。这一问题在Microsoft SQL Server数据库环境下尤为明显，当数据量达到160万条记录时，单次重定向查询耗时高达4秒。

数据库索引是提升查询性能的关键机制。在Shlink的实现中，原本设计了一个复合索引(domain_id, short_code)，用于加速短码查找。然而，这种设计存在两个关键问题：

索引列顺序不当：将domain_id放在首位，而该字段在大量记录中为NULL值，导致索引选择性降低。数据库优化器可能选择不使用这个索引。
过滤条件限制：在Microsoft SQL Server中，该索引被定义为只包含domain_id不为NULL的记录（WHERE [domain_id] IS NOT NULL），这使得所有domain_id为NULL的记录完全无法利用索引加速。

项目维护者最初通过调整索引列顺序来优化性能，将高基数的short_code列放在首位。这一变更在v4.3.1版本中发布，确实解决了部分场景下的性能问题。

然而，深入分析后发现：

针对类似场景，数据库设计应考虑：

通过添加仅包含short_code的辅助索引，查询时间从4秒降至36毫秒，性能提升超过100倍。这一案例充分展示了数据库索引设计对系统性能的关键影响。

Shlink项目中的这一性能问题展示了数据库索引设计的复杂性，特别是在处理NULL值和多条件查询时。开发者在设计数据访问层时，需要综合考虑业务逻辑、查询模式和数据库引擎特性，才能实现最优的性能表现。

登录后查看全文