Python-Websockets 中消息发送延迟问题的分析与解决

2025-06-07 19:37:24作者：晏闻田Solitary

问题现象描述

在使用 Python-Websockets 库开发 WebSocket 服务器时，开发者遇到了一个有趣的现象：当服务器处理耗时计算任务时，客户端接收消息会出现延迟。具体表现为：

客户端发送初始请求
服务器遍历列表（示例中列表长度为3）
服务器执行耗时计算（可能持续数秒）
服务器为每个元素发送文本消息
服务器发送最终关闭消息

异常现象是：第一条消息能立即到达客户端，但后续两条消息会同时到达，尽管它们在服务器端是以数秒间隔发送的。

问题根源分析

这种现象的根源在于 Python 异步编程模型中的事件循环阻塞问题。当服务器执行耗时计算时，如果没有正确释放事件循环的控制权，会导致整个事件循环被阻塞。具体来说：

计算密集型任务会独占事件循环
即使使用 asyncio.create_task 也不足以解决阻塞问题
WebSocket 的发送操作需要事件循环来处理网络I/O
被阻塞的事件循环无法及时处理发送队列中的消息

解决方案

针对这一问题，我们有两种有效的解决方案：

方案一：显式释放事件循环控制权

在发送消息后立即使用 await 语句，强制事件循环处理挂起的I/O操作：

await ws.send(data)

这种方法简单直接，适用于发送间隔较短的场景。

方案二：使用Ping-Pong机制

通过发送Ping并等待Pong响应来强制事件循环处理：

pong_waiter = await ws.ping()
latency = await pong_waiter

这种方法不仅能解决发送延迟问题，还能顺便检测连接的健康状态。

最佳实践：使用线程池执行阻塞操作

对于长时间运行的阻塞操作，推荐使用 ThreadPoolExecutor 和 run_in_executor：

import asyncio
from concurrent.futures import ThreadPoolExecutor

async def handle_request(ws):
    loop = asyncio.get_event_loop()
    with ThreadPoolExecutor() as pool:
        # 将阻塞操作放到线程池中执行
        result = await loop.run_in_executor(pool, blocking_function)
        await ws.send(result)

这种方法将计算密集型任务转移到单独的线程中执行，完全避免了阻塞事件循环的问题。

技术原理深入

Python 的异步编程模型基于协程和事件循环。事件循环在同一时间只能执行一个任务，当遇到阻塞操作时：

如果是I/O密集型任务，可以使用 await 挂起当前协程，让事件循环处理其他任务
如果是CPU密集型任务，会阻塞整个事件循环，导致其他协程无法执行

WebSockets 库的网络操作依赖于事件循环，因此当事件循环被阻塞时，即使调用了发送方法，消息也会堆积在发送缓冲区中，直到事件循环重新获得控制权才能被实际发送。

性能优化建议

合理划分任务：将长时间运行的任务拆分为多个小任务，中间插入 await asyncio.sleep(0) 让出控制权
监控事件循环延迟：可以使用 loop.time() 测量事件循环的实际延迟情况
资源隔离：考虑将计算密集型任务部署到单独的服务中，通过RPC或消息队列与WebSocket服务通信
负载测试：使用工具模拟高并发场景，确保解决方案在实际负载下表现良好

总结

在基于 Python-Websockets 开发实时应用时，正确处理长时间运行的任务至关重要。理解异步编程模型和事件循环的工作原理，能够帮助我们设计出更高效、更可靠的服务。对于计算密集型任务，推荐使用线程池隔离；对于需要精细控制发送时序的场景，可以使用显式的控制权释放机制。

websockets

Library for building WebSocket servers and clients in Python

项目地址：https://gitcode.com/gh_mirrors/we/websockets

登录后查看全文