ProxySQL中Admin接口并发查询stats表导致的死锁问题分析

2025-06-03 00:58:22作者：翟萌耘Ralph

sysown/proxysql: 是一个基于 MySQL 的数据库代理和负载均衡工具，它提供了高性能、高可用性、安全性的数据库代理和管理服务。适合用于需要数据库代理和负载均衡的场景，特别是对于需要高可用性、安全性的 MySQL 数据库。特点是数据库代理和负载均衡、高性能、高可用性、安全性。

项目地址：https://gitcode.com/gh_mirrors/pr/proxysql

问题背景

ProxySQL作为高性能的MySQL中间件，其Admin接口提供了丰富的监控统计功能。在v2.5.2至v2.5.5版本中，存在一个潜在的Admin接口死锁问题，当多个Admin连接并发查询某些统计表时，可能导致整个Admin接口不可用。

死锁发生机制

该问题的核心在于SQLite数据库连接的事务处理与ProxySQL内部锁机制的交互问题。具体表现为：

事务开启阶段：当一个Admin会话执行需要刷新统计信息的查询（如查询stats_proxysql_servers_checksums表）时，会启动一个SQLite事务，同时持有Admin全局互斥锁。
并发查询阶段：此时若有另一个Admin会话尝试查询某些特定的统计表（如stats_mysql_gtid_executed），它会在等待获取全局互斥锁后被放行。
锁竞争阶段：第一个会话释放全局互斥锁后，第二个会话获得执行权。但由于第一个会话的SQLite事务尚未提交，当第二个会话尝试执行清理操作时，会遇到SQLITE_LOCKED错误。
死锁形成：系统进入重试循环等待锁释放，而第一个会话又在等待第二个会话释放的全局互斥锁，从而形成典型的死锁场景。

技术细节分析

问题的关键在于ProxySQL内部对SQLite连接的管理方式。ProxySQL使用两个独立的SQLite连接：

admindb：用于常规Admin操作
statsdb：专门处理统计信息

当Admin用户查询统计表时，系统会使用statsdb连接。但在某些特定路径下（如查询stats_mysql_gtid_executed表），执行流程会到达vacuum_stats函数，该函数默认使用admindb连接尝试清理统计表。此时如果statsdb连接上有未提交的事务，就会导致SQLite报告锁冲突。

影响范围

该问题主要影响以下场景：

使用Admin账户并发查询统计信息
查询涉及需要刷新统计信息的表（如stats_proxysql_servers_checksums）
同时有其他Admin会话查询特定统计表（如stats_mysql_gtid_executed）

一旦触发，将导致Admin接口完全不可用，所有Admin连接都会被阻塞。

解决方案与最佳实践

该问题已在后续版本中修复，修复方案主要涉及：

优化事务处理逻辑，确保及时提交
改进锁获取顺序，避免循环等待
增强错误处理机制，防止无限重试

对于使用受影响版本的用户，建议：

升级到已修复的版本
避免在Admin接口上并发执行统计查询
对于自动化监控工具，适当增加查询间隔
考虑使用专门的监控账户而非Admin账户查询统计信息

总结

ProxySQL的这个死锁问题展示了数据库中间件中锁管理和事务处理的复杂性。开发者在设计类似系统时，需要特别注意：

不同数据库连接间的事务隔离
锁获取的顺序一致性
错误处理的重试机制
并发场景下的资源竞争

通过分析这类问题，我们可以更好地理解数据库中间件的内部工作原理，并在实际使用中避免类似问题的发生。

sysown/proxysql: 是一个基于 MySQL 的数据库代理和负载均衡工具，它提供了高性能、高可用性、安全性的数据库代理和管理服务。适合用于需要数据库代理和负载均衡的场景，特别是对于需要高可用性、安全性的 MySQL 数据库。特点是数据库代理和负载均衡、高性能、高可用性、安全性。

项目地址：https://gitcode.com/gh_mirrors/pr/proxysql

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理