Rustc_codegen_cranelift项目中的TLS访问SIGSEGV问题分析

2025-07-08 20:24:40作者：晏闻田Solitary

在Rustc_codegen_cranelift项目中，开发人员发现了一个在x86_64架构的macOS系统上使用经典链接器时出现的严重问题。当程序尝试访问线程局部存储(TLS)变量时，会导致SIGSEGV段错误。

问题现象

错误发生在程序执行过程中，当尝试访问TLS变量时，CPU指令指针跳转到了一个错误的地址。具体表现为程序试图访问mini_core_hello_world::TLS::h3c257645134f94e9 + 4，而实际上应该访问的是mini_core_hello_world::TLS::h3c257645134f94e9。

通过反汇编可以看到，错误的指令是：

0x1000028c4 <+8>:   leaq   0x5741(%rip), %rdi
0x1000028cb <+15>:  callq  *(%rdi)

这里错误的偏移量导致了后续的段错误。

根本原因

经过深入分析，发现问题出在对象文件(object file)的生成和重定位处理上。具体来说：

在错误的对象文件中，重定位指令使用了错误的偏移量：

movq    4(%rip), %rdi
X86_64_RELOC_TLV __ZN21mini_core_hello_world3TLS17h3c257645134f94e9E@TLVP

而在正确的对象文件中，偏移量是正确的：

movq    (%rip), %rdi
X86_64_RELOC_TLV __ZN21mini_core_hello_world3TLS17h3c257645134f94e9E@TLVP

技术背景

这个问题涉及到Mach-O文件格式中TLV(Thread Local Variable)重定位的处理。在macOS系统中，TLV访问需要通过特殊的重定位类型X86_64_RELOC_TLV来实现。

在对象文件处理库(object crate)中，最近对重定位处理进行了修正，使得所有重定位的加数(addend)现在都是相对于重定位位置的偏移量。这一变化影响了所有之前使用RelocationKind::MachO并且是PC相对寻址的x86/x86-64重定位。

解决方案

根据对象文件处理库的设计原则：

在读取对象文件时，加数总是相对于重定位位置的偏移量
写入对象文件时需要与读取行为保持一致

因此，正确的做法是移除Cranelift中针对TLV重定位的特殊处理代码。这一修复已经合并到主分支中。

影响范围

这个问题主要影响：

使用经典链接器(-ld_classic)的macOS系统
x86_64架构
涉及线程局部存储(TLS)变量访问的场景

使用Xcode 15的新链接器不会触发此问题，因为新链接器对TLV重定位的处理方式有所不同。

总结

这个问题展示了低级代码生成中重定位处理的复杂性，特别是在跨平台支持时需要考虑不同链接器和系统ABI的差异。通过精确控制重定位偏移量和遵循对象文件处理库的设计原则，可以确保生成的代码在各种环境下都能正确运行。

rustc_codegen_cranelift

Cranelift based backend for rustc

项目地址：https://gitcode.com/gh_mirrors/ru/rustc_codegen_cranelift

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

C++

415

298