使用Bonanza构建bb-storage项目的完整指南
前言
Bonanza是一个正在开发中的构建系统,目前主要专注于支持构建bb-storage项目。本文将详细介绍如何使用Bonanza构建bb-storage,通过这个过程,读者可以深入理解Bonanza的工作原理和独特设计。
准备工作
获取修改版的bb-storage
首先需要获取一个经过修改的bb-storage版本,这个版本包含了支持Bonanza构建的必要改动:
git clone git@github.com:buildbarn/bb-storage.git
cd bb-storage
git checkout eschouten/bonanza
建议查看与主分支的差异,了解为支持Bonanza所做的修改类型。
配置.bazelrc文件
为了简化构建过程,我们需要在~/.bazelrc中添加Bonanza专用的配置。以下是对关键配置项的详细说明:
远程缓存和执行器配置
common:bonanza --remote_cache=unix:///path/to/bonanza_storage_frontend.sock
common:bonanza --remote_executor=unix:///path/to/bonanza_scheduler_clients.sock
这些配置指定了Bonanza的存储前端和调度器的Unix域套接字路径。与Bazel不同,Bonanza使用自己的存储和执行协议。
加密配置
common:bonanza --remote_encryption_key=U3YDUwfejfiRDeD4aqoR7A==
Bonanza支持使用AES加密CAS对象。这个密钥可以在客户端生成,并在构建时传递给集群。更改密钥将导致整个缓存失效。
构建器身份验证
common:bonanza --remote_executor_builder_pkix_public_key=MCowBQYDK2VuAyEAE+onXE9lGj+1ykKMdYJ7ORbbGvDg6mXwX9H90afmdDI=
Bonanza使用X25519密钥对来识别不同类型的worker。这个公钥对应于演示部署中使用的私钥。
客户端证书
common:bonanza --remote_executor_client_private_key=/path/to/bonanza_bazel.key.pem
common:bonanza --remote_executor_client_certificate_chain=/path/to/bonanza_bazel.cert.pem
构建请求需要附带受信任的X.509证书和对应的X25519私钥,用于加密构建请求。
模块覆盖
common:bonanza --override_module=bazel_tools=/path/to/bazel_tools
common:bonanza --override_module=builtins_bzl=/path/to/builtins_bzl
common:bonanza --override_module=builtins_core=/path/to/builtins_core
这些配置指定了需要上传的额外Starlark代码模块。
内置模块
common:bonanza --builtins_module=builtins_core
common:bonanza --builtins_module=builtins_bzl
这些配置使得DefaultInfo、filegroup()、platform()等基础功能以及cc_binary()等规则无需显式加载即可使用。
平台配置
common:bonanza --repo_platform=//platforms:repo
这个配置指定了用于运行仓库规则的平台。值得注意的是,bb-storage的platforms/BUILD.bazel中包含了一些Bonanza特有的平台属性:
exec_pkix_public_key:替代Bazel的exec_properties和remote_execution_properties属性,包含识别worker类型的X25519公钥repository_os_*:包含运行仓库规则所需的平台额外信息
安装bonanza_bazel
要启动构建,需要安装Bonanza的命令行工具:
install -m 555 \
$(bazel run --run_under echo //cmd/bonanza_bazel) \
/usr/local/bin/bonanza_bazel
启动演示集群
可以在本地系统上启动一个演示集群:
bazel run //deployments/demo
这个命令会启动多个进程,包括:
- bonanza_builder:负责构建分析和编排
- bonanza_scheduler:调度器
- bonanza_storage_frontend:存储前端
- 多个bonanza_storage_shard实例:存储分片
- bonanza_worker:工作节点
- bb_runner:实际执行构建动作的进程
执行构建
一切准备就绪后,可以在bb-storage代码目录中执行构建:
bonanza_bazel build --config=bonanza //cmd/bb_storage
技术要点解析
-
安全模型:Bonanza采用了基于X25519密钥对的身份验证机制,相比传统的属性键值对提供了更强的安全性。
-
加密存储:支持客户端控制的AES加密,确保CAS对象在传输和存储过程中的安全性。
-
模块化设计:将核心功能实现为Starlark模块,提高了系统的可扩展性和灵活性。
-
平台抽象:通过
repo_platform配置实现了构建环境与运行环境的解耦,支持跨平台构建。 -
进程架构:保持了与Buildbarn类似的worker架构,使用单独的runner进程执行构建动作。
通过这个构建过程,开发者可以深入了解Bonanza的设计理念和技术实现,为未来支持更广泛的Bazel项目构建奠定基础。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python03
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00