Mozc项目迁移至Bazel 8.0的技术实践
背景介绍
Mozc作为Google开发的日语输入法引擎,其构建系统基于Bazel。随着Bazel 8.0即将发布,项目团队开始着手准备从Bazel 7.4.x到8.0.x的迁移工作。本文将详细介绍这一技术迁移过程中的关键点和实践经验。
迁移准备工作
在正式迁移前,团队制定了详细的工作计划:
-
版本锁定策略:在迁移初期,先将Bazel版本锁定在7.4.x,确保现有构建系统的稳定性。对于使用Bazelisk的GitHub Actions工作流,通过设置USE_BAZEL_VERSION环境变量来指定版本。
-
依赖模块兼容性检查:全面检查所有依赖的Bazel模块是否兼容Bazel 8.0,必要时更新模块版本。
-
自定义构建规则适配:确保Mozc项目自身的构建规则能够适配Bazel 8.0的新特性。
关键迁移步骤
1. 构建系统升级
团队首先更新了构建系统的核心组件,包括rules_apple等关键模块。在测试过程中发现,rules_apple 3.16.1版本能够很好地支持Linux平台下的服务器、GUI工具以及fcitx5输入法框架的构建。
2. 代码变更适配
迁移过程中需要对代码进行多处调整,包括但不限于:
- 构建文件(.bzl)的语法更新
- 依赖声明方式的调整
- 测试框架的适配
3. 持续集成系统改造
团队对GitHub Actions工作流进行了改造,确保CI/CD管道能够同时支持新旧版本的Bazel,为平滑过渡创造条件。
技术挑战与解决方案
在迁移过程中,团队遇到了几个主要挑战:
-
向后兼容性问题:通过创建临时分支进行测试,确保所有功能在Bazel 8.0下正常工作后才合并到主分支。
-
依赖冲突:仔细分析依赖树,逐步更新各模块版本,避免引入不兼容的变更。
-
构建性能优化:利用Bazel 8.0的新特性对构建过程进行优化,减少构建时间。
迁移后的验证
完成迁移后,团队进行了全面的验证:
- 各平台构建测试(Windows/Linux/macOS)
- 功能完整性测试
- 性能基准测试
- 稳定性测试
经验总结
通过这次迁移,团队积累了宝贵的经验:
- 渐进式迁移:采用锁定旧版本、逐步验证的方式大大降低了风险。
- 自动化测试:完善的CI系统是确保迁移成功的关键。
- 社区协作:积极与Bazel社区沟通,及时获取最新信息和支持。
未来展望
随着Bazel 8.0的正式发布,Mozc项目将完全转向新版本,并计划逐步淘汰对Bazel 7.x的支持。团队将持续关注Bazel生态的发展,及时采用新特性来优化输入法引擎的构建过程。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00