VerneMQ高负载场景下的性能调优指南

2025-06-25 12:36:05作者：卓艾滢Kingsley

A distributed MQTT message broker based on Erlang/OTP. Built for high quality & Industrial use cases. The VerneMQ mission is active & the project maintained. Thank you for your support!

项目地址：https://gitcode.com/gh_mirrors/ve/vernemq

背景介绍

VerneMQ作为一款高性能的分布式MQTT消息代理，在实际生产环境中可能会遇到高负载场景下的性能瓶颈。本文针对一个典型的高负载场景进行分析，该场景中：

25个客户端连接，每个客户端模拟1000个设备
每个设备每10秒发送一条消息(QoS 1)
2个订阅客户端接收所有消息
使用共享订阅模式

在高负载下，系统日志中出现了busy_port、suppressed,port_events等警告信息，表明系统资源可能已达到瓶颈。

问题分析

从日志信息可以看出，主要瓶颈出现在网络I/O层面，具体表现为：

端口繁忙警告：busy_port表明TCP端口处理消息的速度跟不上消息到达的速度
端口事件被抑制：suppressed,port_events说明系统不得不丢弃部分网络事件以保护自身
查询超时：Subquery failed due to timeout表明内部处理流程出现延迟

调优方案

1. TCP缓冲区优化

VerneMQ的TCP连接参数可通过tcp_listen_options配置，建议调整以下参数：

{tcp_listen_options, [
    {sndbuf, 65536},        % 发送缓冲区大小
    {recbuf, 65536},        % 接收缓冲区大小
    {buffer, 131072},       % 总缓冲区大小
    {high_watermark, 65536},% 高水位标记
    {low_watermark, 32768}, % 低水位标记
    {nodelay, true},        % 禁用Nagle算法
    {linger, {true, 10}},   % 关闭时等待数据发送完成
    {send_timeout, 30000},  % 发送超时时间
    {send_timeout_close, true}
]}

2. 消息处理参数调整

对于QoS 1消息，可调整以下参数：

{max_inflight_messages, 2000}  % 增加未确认消息的窗口大小
{max_online_messages, 2000}    % 增加在线消息队列大小

3. 系统资源分配

{erlang.async_threads, 128}    % 增加异步线程池大小
{erlang.max_ports, 524288}     % 增加最大端口数
{leveldb.maximum_memory.percent, 30} % 增加LevelDB内存使用上限

实施建议

渐进式调整：建议每次只调整1-2个参数，观察效果后再进行下一步调整
监控系统指标：启用systree_enabled和graphite_interval配置，监控系统关键指标
共享订阅优化：已配置shared_subscription_policy = prefer_local是正确做法，可保持
队列类型：使用lifo队列类型有助于降低消息延迟

预期效果

通过上述调整，预期可以：

显著减少busy_port警告出现频率
提高消息吞吐量，降低延迟
增强系统在高负载下的稳定性

注意事项

调整缓冲区大小时需考虑服务器实际内存容量
对于持久化消息，需平衡内存使用和磁盘I/O
生产环境建议进行充分的压力测试

通过系统化的参数调优，VerneMQ能够更好地应对高并发、高吞吐的消息处理场景，为物联网应用提供稳定可靠的消息服务。

vernemq

A distributed MQTT message broker based on Erlang/OTP. Built for high quality & Industrial use cases. The VerneMQ mission is active & the project maintained. Thank you for your support!

项目地址：https://gitcode.com/gh_mirrors/ve/vernemq

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统