Aibrix项目分布式KV缓存编排器设计与实现

2025-06-23 11:45:36作者：宣聪麟

背景与需求

在Aibrix项目的最新开发中，团队正在设计一个专门用于推理引擎的编排器系统。这个系统的核心目标是替代原有的v6d操作符，并支持"自带元数据服务器"(Bring Your Own Metadata Server)的使用场景，使得用户能够灵活地配置etcd或redis服务器端点。

技术方案设计

KVCachePool CRD定义

项目团队设计了一个名为KVCachePool的自定义资源定义(CRD)，其核心结构如下：

apiVersion: kvcache.aibrix.ai/v1alpha1
kind: KVCachePool
metadata:
  name: test-aibrix-model-deepseek-coder-33b-instruct-kvcache
  namespace: default
spec:
  replicas: 1
  service:
    type: ClusterIP
    port: 9600
  cache:
    image: aibrix-container-registry-cn-beijing.cr.volces.com/aibrix/vineyardd:20241120
    imagePullPolicy: IfNotPresent
  scheduler:
    gpuType: NVIDIA-A10
    affinityWorkload: test-aibrix-model-deepseek-coder-33b-instruct

这个设计包含了几个关键组件：

副本控制：通过replicas字段控制缓存实例数量
服务暴露：定义ClusterIP类型的服务及端口
缓存配置：指定缓存容器镜像及拉取策略
调度策略：包括GPU类型选择和亲和性工作负载设置

实现路径

1. CRD生成流程

团队采用了标准的Kubernetes Operator开发流程：

go mod tidy
make generate
make manifests

这个过程中需要注意确保存在一个空的cmd/main.go文件，以避免因项目结构调整导致的构建问题。

2. 控制器核心逻辑开发

在CRD定义稳定后，团队将重点开发控制器的核心逻辑，包括：

缓存池的生命周期管理
状态同步与更新机制
与底层元数据服务的集成

3. 项目结构调整

随着API逐渐稳定，团队计划对项目结构进行优化调整，使其更符合标准的Kubernetes Operator项目布局。

技术挑战与解决方案

在开发过程中，团队遇到了因项目结构调整导致的构建问题。这个问题源于将入口点拆分到不同子文件夹时产生的依赖关系变化。解决方案是确保存在基本的项目结构文件，如cmd/main.go。

未来展望

这个KV缓存编排器的实现将为Aibrix项目带来以下优势：

更灵活的元数据服务集成能力
更好的资源调度和亲和性控制
可扩展的缓存池管理能力

随着功能的不断完善，这个组件将成为Aibrix推理引擎的核心基础设施之一，为分布式KV缓存场景提供强有力的支持。

aibrix

Cost-efficient and pluggable Infrastructure components for GenAI inference

项目地址：https://gitcode.com/GitHub_Trending/ai/aibrix

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

468

461

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1.03 K

645

Aibrix项目分布式KV缓存编排器设计与实现

背景与需求

技术方案设计

KVCachePool CRD定义

实现路径

1. CRD生成流程

2. 控制器核心逻辑开发

3. 项目结构调整

技术挑战与解决方案

未来展望

相关内容推荐

热门内容推荐

项目优选