BharatML Stack在线特征存储平台快速入门指南

2025-06-19 13:15:21作者：庞队千Virginia

BharatMLStack is an open-source, end-to-end machine learning infrastructure stack built at Meesho to support real-time and batch ML workloads at Bharat scale

项目地址：https://gitcode.com/gh_mirrors/bh/BharatMLStack

项目概述

BharatML Stack是由Meesho开发的一套在线特征存储(Online Feature Store)平台解决方案，专为机器学习场景设计。该平台提供了高性能的特征存储、检索和管理能力，能够帮助数据科学家和机器学习工程师更高效地构建和部署AI模型。

核心架构解析

BharatML Stack采用微服务架构设计，主要包含以下核心组件：

基础设施层

ScyllaDB：高性能NoSQL数据库，用于存储特征数据，具备低延迟和高吞吐特性
MySQL：关系型数据库，负责存储元数据和系统配置信息
Redis：内存数据库，提供缓存层加速特征访问
etcd：分布式键值存储，用于服务协调和配置管理

应用服务层

Horizon：后端REST API服务(端口8082)
Trufflebox UI：前端Web界面(端口3000)
Online Feature Store gRPC API：高性能gRPC接口(端口8089)
etcd Workbench：etcd管理界面(端口8081)

环境准备

在开始部署前，请确保开发环境满足以下要求：

Docker环境：包括Docker和Docker Compose
Go语言：版本1.22或更高
网络工具：需要安装netcat(nc)用于连通性测试
Bash shell：用于执行部署脚本
gRPC工具：推荐安装grpcurl用于测试gRPC接口

快速部署指南

一键启动服务

执行以下命令即可启动完整服务：

./start.sh

该脚本会自动完成以下工作：

检查Go语言环境
创建工作区目录并生成配置文件
拉取Docker镜像并启动所有服务
等待服务健康检查通过
初始化数据库表结构
显示服务访问信息

版本控制

支持通过环境变量指定不同版本：

ONFS_VERSION=v1.2.3 HORIZON_VERSION=v2.1.0 TRUFFLEBOX_VERSION=v1.0.5 ./start.sh

版本格式支持：

latest：默认最新稳定版
main：开发版
v1.2.3：特定版本
sha-abcd1234：特定提交

服务停止

停止所有服务：

./stop.sh

彻底清除所有容器和数据：

./stop.sh --purge

服务访问说明

前端界面

访问地址：http://localhost:3000
默认管理员账号：
- 用户名：admin@admin.com
- 密码：admin

API端点

Horizon API：http://localhost:8082
- 健康检查：http://localhost:8082/health
ONFS gRPC API：http://localhost:8089
- 健康检查：http://localhost:8089/health/self

数据库连接

MySQL：
- 主机：localhost
- 端口：3306
- 用户名：root
- 密码：root
- 数据库：testdb
ScyllaDB：
- 主机：localhost
- 端口：9042
- Keyspace：onfs

特征存储API实战

gRPC API使用示例

特征持久化：

grpcurl -plaintext -H "online-feature-store-caller-id: <caller-id>" -H "online-feature-store-auth-token: <auth-token>" -d '<request-body>' localhost:8089 persist.FeatureService/PersistFeatures

特征检索(解码格式)：

grpcurl -plaintext -H "online-feature-store-caller-id: <caller-id>" -H "online-feature-store-auth-token: <auth-token>" -d '<request-body>' localhost:8089 retrieve.FeatureService/RetrieveDecodedResult

请求体示例

单特征组持久化：

{
    "data": [{
        "key_values": ["10"],
        "feature_values": [{
            "values": {"fp32_values": [123.45]}
        }]
    }],
    "entity_label": "catalog",
    "feature_group_schema": [{
        "label": "int_fg",
        "feature_labels": ["id"]
    }],
    "keys_schema": ["catalog_id"]
}

向量特征检索：

{
    "entity_label": "catalog",
    "feature_groups": [{
        "label": "vector_fg",
        "feature_labels": ["embedding"]
    }],
    "keys_schema": ["catalog_id"],
    "keys": [{"cols": ["123"]}]
}

运维管理

日志查看

查看特定服务日志：

cd workspace && docker-compose logs -f horizon

服务管理

重启特定服务：

cd workspace && docker-compose restart horizon

常见问题排查

端口冲突：确保3000、8081-8089、9042、3306、6379、2379端口未被占用
网络问题：可尝试重建Docker网络
健康检查失败：先确认基础设施服务是否正常运行

开发建议

工作区目录包含所有运行时配置：

docker-compose.yml：服务编排定义
check_db_and_init.sh：数据库初始化脚本

修改环境变量后需要重启相关服务使配置生效。

技术特点

高性能特征存储：结合ScyllaDB和Redis实现低延迟特征访问
多协议支持：同时提供REST和gRPC接口
向量特征支持：专门优化了向量数据的存储和检索
灵活版本控制：支持快速切换不同版本进行测试

BharatML Stack为机器学习团队提供了完整的特征管理解决方案，从特征存储、版本控制到服务化接口一应俱全，能够显著提升机器学习项目的开发效率。

BharatMLStack

BharatMLStack is an open-source, end-to-end machine learning infrastructure stack built at Meesho to support real-time and batch ML workloads at Bharat scale

项目地址：https://gitcode.com/gh_mirrors/bh/BharatMLStack

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。