OpenObserve仪表板WebSocket查询取消机制优化实践

2025-05-15 11:45:21作者：冯梦姬Eddie

🚀 10x easier, 🚀 140x lower storage cost, 🚀 high performance, 🚀 petabyte scale - Elasticsearch/Splunk/Datadog alternative for 🚀 (logs, metrics, traces, RUM, Error tracking, Session replay).

项目地址：https://gitcode.com/GitHub_Trending/op/openobserve

背景分析

在现代监控系统的仪表板功能中，实时数据展示往往依赖于WebSocket长连接技术。OpenObserve作为新一代可观测性平台，其仪表板模块通过WebSocket实现查询结果的实时推送。然而在实际应用中，我们发现当用户主动取消查询请求时，系统存在WebSocket连接未正确关闭的问题，这不仅会导致不必要的网络资源消耗，还可能引发内存泄漏等稳定性问题。

问题本质

WebSocket作为一种全双工通信协议，与传统HTTP请求的取消机制存在显著差异。在OpenObserve的原始实现中，取消操作仅终止了前端的状态跟踪，但未向服务端发送适当的关闭帧(Close Frame)，导致底层TCP连接未能正常终止。这种"半关闭"状态使得：

服务端持续维护无效连接
客户端可能继续接收冗余数据
连接池资源无法及时释放

解决方案

我们通过以下技术手段重构了取消机制：

连接生命周期管理

class DashboardWebSocket {
  private socket: WebSocket;
  private abortController: AbortController;

  constructor() {
    this.abortController = new AbortController();
  }

  connect(url: string) {
    this.socket = new WebSocket(url);
    
    // 绑定AbortSignal
    const signal = this.abortController.signal;
    signal.addEventListener('abort', () => {
      this.socket.close(1000, 'User requested cancellation');
    });
  }

  cancel() {
    this.abortController.abort();
  }
}

双端协同关闭流程

客户端主动终止：
- 发送标准关闭码1000（正常关闭）
- 清理事件监听器
- 释放内存引用

服务端响应处理：

async fn handle_websocket(mut stream: WebSocketStream) {
    while let Some(msg) = stream.next().await {
        match msg {
            Ok(Message::Close(_)) => {
                stream.close().await?;
                break;
            }
            // ...其他消息处理
        }
    }
}