Shlink项目中短链接访问统计的性能优化方案

2025-06-18 00:52:42作者：吴年前Myrtle

背景与问题分析

在现代短链接服务中，访问统计功能是核心需求之一。Shlink作为一个开源的短链接服务，在处理大量访问数据时遇到了性能瓶颈。具体表现为：当用户需要按照访问量排序短链接列表时，系统需要执行COUNT(DISTINCT visits)聚合查询，这在数据量大的情况下会导致严重的性能问题。

传统方案的局限性

传统方案直接通过SQL的COUNT聚合函数统计每个短链接的访问量，这种方案存在两个主要问题：

性能问题：当访问记录表(visits)数据量庞大时，COUNT操作需要扫描大量数据，导致查询响应时间显著增加。
并发问题：如果采用简单的计数器字段直接更新方案，高并发场景下会导致行锁争用，影响系统吞吐量。

优化方案：分槽计数器模式

Shlink团队提出了一种创新的解决方案——分槽计数器模式(Slotted Counter Pattern)，这种方案巧妙地平衡了性能与并发需求。

核心设计思想

数据分片：为每个短链接创建多个计数器槽位(如100个)，而不是单一的计数器。
随机更新：每次访问时随机选择一个槽位进行增量更新，分散写压力。
聚合统计：查询时通过SUM聚合各槽位值获取总访问量，避免直接COUNT原始访问记录。

技术实现细节

数据库表设计

CREATE TABLE short_url_visits_counts (
    id INT AUTO_INCREMENT PRIMARY KEY,
    short_url_id VARCHAR(255) NOT NULL,
    potential_bot BOOLEAN NOT NULL,
    slot_id INT NOT NULL,
    count INT NOT NULL,
    UNIQUE KEY (short_url_id, potential_bot, slot_id)
);

访问计数更新策略

针对不同数据库引擎，实现了差异化的UPSERT操作：

MySQL/MariaDB：

INSERT INTO short_url_visits_counts 
VALUES (:short_url_id, :potential_bot, RAND() * 100, 1)
ON DUPLICATE KEY UPDATE count = count + 1;

PostgreSQL：

INSERT INTO short_url_visits_counts 
VALUES (:short_url_id, :potential_bot, random() * 100, 1)
ON CONFLICT (short_url_id, potential_bot, slot_id) DO UPDATE
SET count = count + 1;

SQLite/SQL Server：
- 先执行带锁的SELECT查询
- 根据结果决定INSERT新记录或UPDATE现有记录

应用层实现

通过Doctrine的事件订阅机制，在每次访问记录持久化前自动触发计数器更新：

class VisitCountSubscriber implements EventSubscriber {
    public function getSubscribedEvents() {
        return ['preFlush'];
    }
    
    public function preFlush(PreFlushEventArgs $args) {
        // 实现细节省略...
    }
}

方案优势分析

性能提升：
- SUM聚合替代COUNT，大幅减少I/O操作
- 避免了大表JOIN操作
并发优化：
- 100个槽位使写冲突概率降低99%
- 分散了数据库行锁压力
扩展性：
- 可灵活调整槽位数量平衡性能与准确性
- 支持区分正常访问与机器人访问统计

实施注意事项

数据迁移：需要为现有短链接初始化计数器数据
特性开关：保留回退到传统方案的开关
监控指标：需要监控新方案的准确性和性能表现

未来扩展方向

标签统计优化：将类似技术应用于标签系统的访问统计
动态槽位调整：根据访问量自动调整槽位数量
异步处理：考虑将计数器更新改为异步任务

这种创新的分槽计数器模式为Shlink提供了高性能、高并发的访问统计解决方案，值得在类似需要频繁计数更新的系统中借鉴应用。

shlink

The definitive self-hosted URL shortener

项目地址：https://gitcode.com/gh_mirrors/sh/shlink

登录后查看全文

Shlink项目中短链接访问统计的性能优化方案

背景与问题分析

传统方案的局限性

优化方案：分槽计数器模式

核心设计思想

技术实现细节

数据库表设计

访问计数更新策略

应用层实现

方案优势分析

实施注意事项

未来扩展方向

热门内容推荐

项目优选

Shlink项目中短链接访问统计的性能优化方案

背景与问题分析

传统方案的局限性

优化方案：分槽计数器模式

核心设计思想

技术实现细节

数据库表设计

访问计数更新策略

应用层实现

方案优势分析

实施注意事项

未来扩展方向

相关内容推荐

热门内容推荐

项目优选