Google Protobuf Java 版本中意外包含 JRuby 依赖的问题分析

2025-04-29 01:10:46作者：郦嵘贵Just

项目地址：https://gitcode.com/gh_mirrors/pro/protobuf

问题背景

在 Google Protobuf 项目的 Java 实现中，最近发布的 4.31.0.rc.1 版本出现了一个显著的体积膨胀问题。原本只有 5.3MB 的 protobuf_java.jar 文件，在新版本中增长到了 33MB。经过深入分析，发现这是由于构建过程中意外地将 JRuby 完整运行时(jruby-complete.jar)打包进了最终的 JAR 文件中。

问题表现

通过对比 4.30.2 和 4.31.0.rc.1 两个版本的 JAR 文件内容，可以清楚地看到新增了大量与 JRuby 相关的类和资源文件。这些新增内容包括：

JRuby 核心运行时类文件
JRuby 依赖的第三方库(如 JNR、JLine 等)
JRuby 扩展模块
各种平台相关的本地库文件

这些依赖实际上已经在 Maven POM 文件中正确标记为 provided 作用域，意味着它们应该只在编译时被使用，而不会被打包进最终的发布产物中。

技术原因分析

经过调查，这个问题很可能与最近对 Bazel 构建规则的修改有关。在 Protobuf 项目中，Bazel 被用作主要的构建工具。虽然 Maven POM 文件中的依赖声明多年来一直保持稳定(包括正确的 provided 作用域)，但 Bazel 构建规则的变化可能导致这些依赖被错误地包含在最终产物中。

具体来说，Bazel 的 Java 规则在处理 provided 作用域依赖时可能存在缺陷，或者最近的修改意外改变了这一行为。这导致即使 Maven POM 文件配置正确，构建过程仍然会将所有依赖打包进最终的 JAR 文件。

影响评估

这个问题会带来几个方面的负面影响：

体积膨胀：JAR 文件大小增加了近 6 倍，这对于依赖 Protobuf 的应用程序来说是不必要的资源消耗
潜在冲突：由于 JRuby 运行时已经被包含在运行环境中，打包重复的类文件可能导致类加载冲突
启动性能：更大的 JAR 文件意味着更长的类加载时间和更高的内存占用

解决方案建议

针对这个问题，建议采取以下措施：

修复 Bazel 构建规则：确保构建规则正确处理 provided 作用域的依赖，避免将它们打包进最终产物
加强构建验证：在持续集成流程中添加检查步骤，验证生成的 JAR 文件不包含预期之外的依赖
版本回滚：如果问题紧急，可以考虑回滚到上一个稳定版本，同时修复构建系统

最佳实践

对于类似的项目，建议遵循以下最佳实践：

明确依赖作用域：在构建配置中清晰地定义每个依赖的作用域
构建产物分析：定期分析构建产物内容，确保没有意外的依赖被包含
多环境验证：在不同的构建环境(如 Maven 和 Bazel)中验证构建结果的一致性
自动化检查：实现自动化工具来检查 JAR 文件的内容是否符合预期

通过这次问题的分析和解决，可以帮助 Protobuf 项目团队进一步完善构建系统，避免类似问题在未来版本中再次出现。

项目地址：https://gitcode.com/gh_mirrors/pro/protobuf

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统