TruffleRuby项目中的libffi符号冲突问题分析与解决方案

2025-06-26 19:17:28作者：乔或婵

A high performance implementation of the Ruby programming language, built on GraalVM.

项目地址：https://gitcode.com/gh_mirrors/tr/truffleruby

在TruffleRuby 24.1.0-dev版本的JVM构建中，开发人员发现了一个严重的段错误问题。这个问题在使用PostgreSQL驱动运行ORM基准测试时100%可重现，但有趣的是在原生构建和CE JVM构建中却不会出现。

问题现象

当开发人员尝试运行基于ActiveRecord的ORM基准测试时，程序会稳定地发生段错误。错误日志显示崩溃发生在libffi.so和libtrufflenfi.so的交互过程中，具体是在ClosureNativePointer.freeClosure方法的执行阶段。

根本原因分析

经过深入调查，技术团队发现问题的根源在于符号冲突：

TruffleNFI内部静态链接了一个libffi库
系统中可能存在另一个动态加载的libffi库（可能来自JVM或PostgreSQL驱动）
动态加载器混淆了这两个库的符号，导致：
- 从TruffleNFI的libffi分配闭包
- 却尝试从系统libffi释放闭包

这种不匹配的内存操作最终导致了段错误的发生。

解决方案

技术团队提出了一个优雅的解决方案：在构建libffi时添加-fvisibility=hidden编译选项。这个方案：

不需要手动重命名符号
有效隐藏了内部符号，防止与其他库冲突
保持了原有的功能完整性

验证结果

开发人员验证了这个修复方案，确认：

替换修改后的libtrufflenfi.so后
ORM基准测试可以正常完成
不再出现段错误

技术启示

这个案例展示了在复杂运行时环境中符号管理的重要性。特别是在以下场景需要特别注意：

使用静态链接库时
运行时可能加载多个版本相同库时
开发语言虚拟机等复杂系统时

通过控制符号的可见性，可以有效地避免这类难以调试的运行时问题。

后续建议

对于使用TruffleRuby的开发人员，建议：

关注24.1.0正式版的发布
在复杂环境中运行时注意库的依赖关系
遇到类似问题时检查符号冲突可能性

这个问题的解决体现了TruffleRuby团队对运行时稳定性的高度重视，也为其他类似项目提供了宝贵的经验参考。

A high performance implementation of the Ruby programming language, built on GraalVM.

项目地址：https://gitcode.com/gh_mirrors/tr/truffleruby

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。