OP-TEE项目中的栈检查机制问题分析与修复

2025-07-09 22:16:11作者：昌雅子Ethen

Trusted side of the TEE

项目地址：https://gitcode.com/gh_mirrors/op/optee_os

问题背景

在OP-TEE操作系统的qemu_v8平台上，当启用CFG_CORE_DEBUG_CHECK_STACKS和CFG_STACK_THREAD_EXTRA=256配置时，系统启动过程中会出现挂起现象。具体表现为系统在BL31阶段后停止响应，无法继续启动流程。

问题分析

通过代码bisect定位到问题源于一个关于栈检查机制的修改提交。该提交移除了THREAD_CORE_LOCAL_STACKCHECK_RECURSION宏定义及相关汇编代码，原本这些代码负责在启动过程中清除stackcheck_recursion标志。

栈检查机制是OP-TEE中用于检测线程栈溢出的重要安全特性。当启用CFG_CORE_DEBUG_CHECK_STACKS时，系统会在关键点检查栈指针是否越界。而CFG_STACK_THREAD_EXTRA参数则控制为每个线程分配的额外栈空间大小。

技术细节

在ARM架构下，OP-TEE使用thread_core_local结构体来跟踪每个核心的线程状态。其中包含与栈检查相关的字段：

stackcheck_recursion标志：用于防止在栈检查过程中发生递归调用
栈指针信息：记录当前线程的栈边界

问题的本质在于，移除THREAD_CORE_LOCAL_STACKCHECK_RECURSION后，系统在启动阶段未能正确初始化栈检查相关的状态，导致后续的栈检查逻辑出现异常。

解决方案

修复方案主要涉及两个方面：

恢复必要的栈检查状态初始化逻辑
确保在启动过程中栈指针信息与thread_core_local中的记录保持同步

正确的做法是，在启动汇编代码中建立栈指针的同时，也初始化相关的栈检查状态，避免后续检查时出现不一致的情况。

经验总结

这个案例提醒我们，在修改底层核心机制时需要特别注意：

启动流程中的初始化顺序至关重要
汇编层面的状态管理需要与C代码保持严格一致
安全相关的检查机制往往有复杂的依赖关系
配置参数的组合测试非常重要

对于嵌入式安全系统而言，栈检查这样的基础安全机制需要特别谨慎处理，任何改动都可能影响系统的可靠性和安全性。

Trusted side of the TEE

项目地址：https://gitcode.com/gh_mirrors/op/optee_os

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。