Wild项目中AArch64架构下__gmon_start__符号处理问题分析

2025-07-06 23:30:37作者：牧宁李

🚀 GitHub 加速器 Wild 链接器，专为迭代开发设计，追求极致速度。虽尚处于早期阶段，不适用于生产环境，但已有初步成果：支持Linux上的x86-64平台，能生成静态/动态链接的二进制和共享对象文件。未来目标是增量链接。参与开发、贡献代码，一起打造更快的链接器！

项目地址：https://gitcode.com/gh_mirrors/wi/wild

在Wild项目开发过程中，开发团队遇到了一个关于AArch64架构下符号处理的特殊问题。这个问题涉及到编译器运行时初始化对象(crti.o)中的__gmon_start__符号处理，以及动态链接过程中的重定位机制。

问题现象

在AArch64架构下运行测试时，系统报错提示无法为__gmon_start__符号应用复制重定位(copy relocation)。错误信息显示该符号被标记为本地(local=1)，位于动态链接库中。通过分析发现，crti.o对象文件中确实定义了这个符号，但被标记为弱引用(WEAK)和未定义(UND)。

技术背景

__gmon_start__是GNU性能分析工具gprof使用的特殊符号，通常由运行时库提供。在程序启动时，如果这个符号存在，gprof会用它来初始化性能分析功能。在AArch64架构下，编译器生成的代码会使用三种不同类型的重定位来处理这个符号：

ADR_GOT_PAGE重定位 - 用于获取GOT页地址
LD64_GOT_LO12_NC重定位 - 用于加载GOT条目
JUMP26重定位 - 用于函数跳转

相比之下，x86架构只使用GOTPCRELX这一种间接重定位方式，不需要复制重定位。

问题根源

通过深入分析发现，Wild链接器在处理这个符号时存在两个关键问题：

符号解析逻辑不够完善，未能正确处理弱未定义符号的情况
重定位处理机制中，对绝对符号和非绝对符号的区分不够细致

具体来说，链接器错误地尝试为未定义的__gmon_start__符号创建复制重定位，但实际上复制重定位需要知道符号的大小，而这是未定义符号所不具备的信息。

解决方案

开发团队通过修改符号处理逻辑解决了这个问题。关键改进包括：

确保不为未定义符号创建复制重定位
完善符号标志位检查逻辑，特别是对绝对符号的处理
增强符号解析的健壮性，正确处理弱引用情况

这些改进使得Wild链接器能够正确处理AArch64架构下对__gmon_start__等特殊符号的引用，同时保持与其他架构的兼容性。

经验总结

这个案例展示了跨平台开发中架构差异带来的挑战。AArch64和x86架构在重定位处理上的不同行为需要链接器有更精细的控制逻辑。同时，也提醒我们在处理特殊符号时需要特别注意其定义状态和引用属性，特别是对于性能分析工具等系统级功能依赖的符号。

🚀 GitHub 加速器 Wild 链接器，专为迭代开发设计，追求极致速度。虽尚处于早期阶段，不适用于生产环境，但已有初步成果：支持Linux上的x86-64平台，能生成静态/动态链接的二进制和共享对象文件。未来目标是增量链接。参与开发、贡献代码，一起打造更快的链接器！

项目地址：https://gitcode.com/gh_mirrors/wi/wild

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统