OP-TEE项目中QEMU环境下syscall ftrace功能失效问题分析

2025-07-09 21:26:23作者：蔡丛锟

Trusted side of the TEE

项目地址：https://gitcode.com/gh_mirrors/op/optee_os

问题背景

在OP-TEE项目开发过程中，开发人员发现当在QEMU v7平台上启用系统调用跟踪功能(CFG_SYSCALL_FTRACE)时，系统会出现严重问题。具体表现为当尝试加载trusted keys TA时，系统会完全挂起，并在控制台输出RCU(Read-Copy-Update)相关的错误信息。

问题现象

开发人员使用以下编译选项时触发了该问题：

CFG_FTRACE_SUPPORT=y 
CFG_SYSCALL_FTRACE=y 
CFG_FTRACE_BUF_SIZE=1000000 
CFLAGS_ta_arm32=-pg 
QEMU_VIRTFS_AUTOMOUNT=y

系统挂起时输出的关键错误信息包括：

rcu: INFO: rcu_sched detected stalls on CPUs/tasks:
rcu:    0-...0: (6 ticks this GP) idle=0174/1/0x40000000 softirq=97/101 fqs=995
rcu:    (detected by 1, t=2103 jiffies, g=-1107, q=13 ncpus=2)

问题分析

RCU机制简介：RCU是Linux内核中使用的一种同步机制，它允许读操作在无锁情况下进行，同时确保数据的一致性。当RCU检测到CPU或任务停滞时，会输出类似上述的错误信息。
问题根源：通过实验发现，当从编译选项中移除-pg标志(用于函数调用跟踪)时，问题消失。这表明问题与函数调用跟踪机制有关。
深入分析：
- -pg标志会为函数添加额外的调用跟踪代码
- 在OP-TEE的核心组件中，某些关键函数可能不适合被跟踪
- 当这些关键函数被跟踪时，可能导致系统调度或同步机制出现问题
- 特别是当加载TA(Trusted Application)时，系统进入关键路径，此时跟踪机制可能干扰正常操作

解决方案

开发团队通过以下方式解决了该问题：

选择性应用跟踪：不是全局启用-pg标志，而是有选择地在特定模块(如Mbed TLS)中应用。
核心函数保护：识别出不应被跟踪的核心函数，确保这些函数不会被-pg标志影响。
代码优化：对跟踪机制本身进行优化，确保它不会干扰系统的关键操作。

技术启示

调试工具的影响：即使是调试和性能分析工具本身，也可能对系统行为产生重大影响，特别是在安全关键系统中。
选择性跟踪的重要性：在复杂系统中，全量跟踪可能带来不可预见的问题，需要有策略地选择跟踪目标。
RCU机制的敏感性：RCU作为内核关键同步机制，其异常往往反映了更深层次的系统问题。

这个问题及其解决方案为OP-TEE开发者提供了宝贵的经验，特别是在处理系统级调试工具与核心功能交互时的注意事项。

Trusted side of the TEE

项目地址：https://gitcode.com/gh_mirrors/op/optee_os

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统