bdwgc项目在Solaris系统上的信号传递问题分析

2025-06-25 11:13:49作者：史锋燃Gardner

问题背景

在bdwgc项目中，当在Solaris系统上使用DEFAULT_VDB或64位模式时，会出现信号传递失败的问题。具体表现为测试程序gctest在执行过程中会报告"Signals delivery fails constantly"错误，有时甚至会导致程序挂起。

问题表现

该问题在两种配置下出现：

使用DEFAULT_VDB编译时
在64位模式下编译时

测试程序会输出类似以下错误信息：

Running on SOLARIS/SPARC target
Supported VDBs: manual default
Switched to incremental mode
Signals delivery fails constantly at GC 4808

根本原因分析

通过深入分析线程堆栈和程序行为，发现这是一个并发问题，具体表现为：

线程挂起功能(GC_ENABLE_SUSPEND_THREAD)存在缺陷
在线程清理过程中信号丢失
导致线程无法正确挂起和恢复
最终形成死锁状态

从堆栈跟踪可以看出，一个线程(Thread 61)在退出时尝试获取GC_lock，而另一个线程(Thread 60)则试图挂起自己，同时还有线程在等待被挂起的线程确认状态。

临时解决方案

目前可以通过以下方式临时解决该问题：

在配置时使用--disable-gcj-support选项
或者直接修改配置，取消定义GC_ENABLE_SUSPEND_THREAD宏

这两种方法都能有效避免信号传递失败的问题，因为它们禁用了有缺陷的线程挂起功能。

长期解决方案

项目维护者已经确认需要修复GC_retry_signals在GC_suspend_thread中的实现。这将从根本上解决信号丢失导致的线程挂起问题。不过由于问题复杂性较高，这被标记为低优先级任务。

技术细节

在Solaris系统上，特别是SPARC架构下，信号处理和线程同步机制有其特殊性。当使用DEFAULT_VDB或64位模式时，内存访问模式和信号传递机制的变化会放大原本存在的线程同步问题。

线程挂起功能依赖于信号来通知目标线程暂停执行，但在Solaris环境下，特别是在线程清理过程中，这些信号可能会丢失，导致线程无法正确响应挂起请求，最终形成死锁。

结论

bdwgc在Solaris系统上的信号传递问题主要源于线程挂起功能的实现缺陷。虽然目前有临时解决方案，但长期来看需要完善GC_retry_signals机制。对于需要在Solaris上使用bdwgc的开发者，建议暂时禁用GC_ENABLE_SUSPEND_THREAD功能以避免此问题。

bdwgc

The Boehm-Demers-Weiser conservative C/C++ Garbage Collector (bdwgc, also known as bdw-gc, boehm-gc, libgc)

项目地址：https://gitcode.com/gh_mirrors/bd/bdwgc

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理