GraphScope中AdminService与QueryService的请求阻塞问题分析

2025-06-24 07:32:03作者：胡易黎Nicole

问题现象

在GraphScope分布式图计算系统中，当QueryService(监听端口10000)正在执行一个耗时较长的查询任务时，发送到AdminService的请求会被阻塞，直到查询任务完成。然而，发送到QueryService本身的请求却不会被阻塞(除非所有分片资源都已被占用)。

问题根源

经过技术分析，这个问题的主要原因是系统同时启动了两个HTTP服务实例，导致资源竞争和请求处理冲突。具体表现为：

AdminService和QueryService共享相同的底层资源
长查询占用了系统资源，导致AdminService无法及时响应
HTTP服务实例间的协调机制存在缺陷

解决方案

针对这个问题，开发团队提出了有效的解决方案：

资源隔离策略：通过为Admin请求分配独立的分片资源，确保管理操作不受查询负载影响。这种设计实现了：

管理平面和数据平面的资源隔离
关键管理操作的可靠性保障
系统资源的合理分配和利用

技术实现

在具体实现上，团队对系统架构进行了优化：

重构了服务启动流程，避免不必要的HTTP服务实例创建
实现了请求路由和分片分配的智能调度
增加了资源隔离层，确保关键服务的高可用性

总结

这个问题的解决不仅修复了特定场景下的服务阻塞问题，更重要的是为GraphScope系统建立了更健壮的服务隔离机制。通过这次优化，系统在以下方面得到了显著提升：

管理操作的响应可靠性
高负载下的系统稳定性
多服务并发的资源利用率

这种架构优化对于构建大规模分布式图计算系统具有重要的参考价值，特别是在需要同时处理管理操作和计算任务的复杂场景下。

GraphScope

🔨 🍇 💻 🚀 GraphScope: A One-Stop Large-Scale Graph Computing System from Alibaba | 一站式图计算系统

项目地址：https://gitcode.com/gh_mirrors/gr/GraphScope

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140

GraphScope中AdminService与QueryService的请求阻塞问题分析

问题现象

问题根源

解决方案

技术实现

总结

热门内容推荐

最新内容推荐

项目优选

GraphScope中AdminService与QueryService的请求阻塞问题分析

问题现象

问题根源

解决方案

技术实现

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选