Cheshire Cat AI核心项目中WebSocket连接异常关闭问题分析与解决方案

2025-06-28 15:42:38作者：尤峻淳Whitney

问题背景

在Cheshire Cat AI核心项目中，当用户与AI进行对话时，如果用户在AI尚未完成响应前突然关闭WebSocket连接，会导致系统出现连接状态不一致的问题。具体表现为当用户重新连接时，系统无法正确处理新的会话请求，出现"Unexpected ASGI message 'websocket.close'"运行时错误。

问题现象

当用户通过WebSocket与Cheshire Cat AI建立连接并进行对话时，如果用户在AI仍在生成响应过程中突然关闭连接，系统会记录以下错误：

RuntimeError: Unexpected ASGI message 'websocket.close', after sending 'websocket close'

此后，即使用户重新连接，系统也无法正确处理该用户的会话请求，必须重启整个AI服务才能恢复正常。

技术分析

WebSocket连接状态管理机制

在Cheshire Cat AI项目中，WebSocket连接管理主要涉及以下几个关键组件：

StrayCat类：负责维护单个用户的WebSocket连接状态
WebSocket端点处理：负责接受和关闭WebSocket连接
消息处理循环：负责处理用户输入和AI响应

问题根源

当用户突然关闭连接时，系统会经历以下异常流程：

AI正在通过WebSocket发送响应消息
用户端突然关闭连接
系统尝试继续发送剩余响应时遇到连接已关闭的异常
系统尝试发送错误信息时再次遇到异常
最终导致WebSocket连接状态不一致

异常处理流程缺陷

正常情况下，当用户关闭连接时，系统会捕获WebSocketDisconnect异常并清理连接状态。但在上述异常场景中，由于错误处理逻辑本身又尝试通过已关闭的连接发送错误信息，导致异常被掩盖，连接状态未能正确重置。

解决方案

方案一：增强发送逻辑的异常处理

在StrayCat类的__send_ws_json方法中添加对ConnectionClosedOK异常的处理：

from websockets.exceptions import ConnectionClosedOK

def __send_ws_json(self, data: Any):
    try:
        asyncio.run_coroutine_threadsafe(
            self.__ws.send_json(data), loop=self.__main_loop
        ).result()
    except ConnectionClosedOK as ex:
        if ex.code == 1000:
            log.warning(ex)
            if self.__ws:
                del self.__ws
                self.__ws = None

此方案能有效捕获连接关闭异常并清理无效连接状态。

方案二：完善全局异常处理机制

在消息处理循环中添加对错误发送逻辑的保护：

def run(self, user_message_json):
    try:
        cat_message = self.loop.run_until_complete(self.__call__(user_message_json))
        self.send_chat_message(cat_message)
    except Exception as e:
        log.error(e)
        traceback.print_exc()
        try:
            self.send_error(e)
        except Exception as send_error_ex:
            log.warning(f"Failed to send error: {send_error_ex}")