首页
/ 深入分析Sonic库在ARM64架构下的CPU Profiling崩溃问题

深入分析Sonic库在ARM64架构下的CPU Profiling崩溃问题

2025-05-28 16:39:11作者:史锋燃Gardner

背景介绍

Sonic是一款由字节跳动开发的高性能JSON处理库,以其卓越的性能著称。然而,近期在ARM64架构的Linux系统上,用户报告了当启用CPU性能分析(profiling)时,程序会出现崩溃的问题。这个问题不仅出现在容器环境中,在原生Linux系统上同样会复现。

问题现象

当程序在ARM64架构的Linux系统上运行,并启用了CPU性能分析功能时,使用Sonic库进行JSON反序列化操作会导致程序崩溃。崩溃发生时,信号处理程序无法正确获取当前的goroutine信息,表现为内存访问错误。

技术分析

ARM64架构的特殊性

在ARM64架构下,Go语言运行时对寄存器使用有严格规定。特别是R28寄存器(也称为x28),被Go编译器保留用于存储当前goroutine的指针。这是ARM64架构特有的寄存器使用约定。

崩溃的根本原因

通过分析崩溃堆栈和Sonic的源代码,我们发现问题的根源在于Sonic的ARM64汇编优化代码中直接使用了R28寄存器。具体来说,在get_by_path_arm64.s文件中,有多处直接操作x28寄存器的代码。当CPU性能分析器触发信号中断时,信号处理程序期望从R28寄存器获取当前goroutine指针,但由于Sonic的汇编代码修改了这个寄存器的值,导致获取到的指针无效,从而引发段错误。

CPU性能分析的影响

CPU性能分析功能会定期发送SIGPROF信号(信号编号27)来采样程序的执行状态。这个信号处理过程高度依赖正确的goroutine上下文信息。当R28寄存器被错误修改后,信号处理程序无法正确识别当前的执行上下文,最终导致崩溃。

解决方案建议

  1. 避免使用保留寄存器:修改Sonic的ARM64汇编代码,避免使用R28(x28)寄存器,改用其他非保留寄存器。

  2. 寄存器保存与恢复:如果必须使用R28寄存器,应在函数入口处保存原始值,在函数退出前恢复,确保不影响Go运行时的正常工作。

  3. 增加架构兼容性测试:建议在持续集成流程中加入ARM64架构下的CPU性能分析测试,确保类似问题能够被及时发现。

影响范围

这个问题主要影响:

  • 使用Sonic库的ARM64程序
  • 启用了CPU性能分析功能的场景
  • Linux操作系统环境

值得注意的是,虽然问题最初是在容器环境中发现的,但它实际上与容器无关,是纯粹的架构相关性问题。

总结

高性能库在追求极致性能的同时,也需要充分考虑不同架构的特殊性和运行时环境的约定。这个案例很好地展示了在底层优化时需要注意的架构特定规则。对于开发者而言,在ARM64平台上使用Sonic库时,如果不需要CPU性能分析功能,可以暂时通过不启用profiling来避免这个问题;长期来看,等待官方修复版本发布是最佳选择。

这个问题也提醒我们,在使用任何高度优化的库时,特别是在交叉架构环境下,需要充分测试所有功能点,确保它们在不同平台上的行为一致性。

登录后查看全文
热门项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
262
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
863
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K