Hyperlight项目中主机与访客执行状态同步问题分析

2025-06-20 13:22:47作者：温玫谨Lighthearted

Hyperlight is a lightweight Virtual Machine Manager (VMM) designed to be embedded within applications. It enables safe execution of untrusted code within micro virtual machines with very low latency and minimal overhead.

项目地址：https://gitcode.com/gh_mirrors/hy/hyperlight

问题背景

在Hyperlight项目的开发过程中，我们发现了一个关于主机(host)与访客(guest)执行状态同步的重要问题。这个问题涉及到当主机线程调度访客函数调用时，在并发条件下可能出现的状态判断错误，导致主机错误地尝试读取未执行的访客函数返回值。

技术细节

正常执行流程

在正常情况下，Hyperlight项目中的执行流程是这样的：

主线程调度一个访客函数调用
向hypervisor-handler线程发送HypervisorHandlerAction::DispatchCallFromHost消息
主线程等待响应
如果访客函数执行完成，hypervisor-handler线程会设置一个原子标志位
主线程检测到这个标志位变化后，继续后续操作

问题出现场景

问题出现在高并发或系统资源紧张的情况下，具体表现为：

主线程发送消息后开始等待
由于系统调度原因，hypervisor-handler线程可能长时间得不到执行
主线程在等待超时后会调用terminate_hypervisor_handler_execution_and_reinitialise
此时会检查原子标志位来判断访客是否已完成执行

根本原因分析

问题的核心在于原子标志位的状态判断逻辑存在缺陷。主线程假设：

如果标志位为false，表示它最初为true，后来在执行完成后被清除
但实际上，标志位可能从未被设置为true，因为hypervisor-handler线程可能根本没有被调度执行

这种错误的假设导致主线程误认为访客函数已经执行完成，进而尝试从访客内存中读取ReturnValue，而实际上访客函数可能从未执行。这最终导致"Stack pointer is out of bounds"错误，因为内存中根本没有有效数据可读。

解决方案

要解决这个问题，我们需要重新设计状态同步机制。可能的解决方案包括：

引入执行状态机：使用更明确的状态标识，而不仅仅是布尔标志位
增加超时处理：在检测到超时后，不仅要检查标志位，还要确认hypervisor-handler线程是否确实收到了消息
双重确认机制：在认为执行完成前，需要多个条件同时满足

经验教训

这个问题给我们带来了几个重要的启示：

在并发编程中，不能仅依靠简单的标志位来判断复杂的状态
超时处理需要考虑所有可能的执行路径，包括消息可能未被处理的情况
状态机的设计应该明确反映所有可能的执行状态，避免隐含假设

总结

Hyperlight项目中的这个问题展示了在虚拟化环境中主机与访客间状态同步的复杂性。通过深入分析这个问题，我们不仅找到了解决方案，更重要的是理解了在类似系统中设计可靠状态同步机制的关键原则。这对于构建稳定、高效的虚拟化系统具有重要意义。

hyperlight

项目地址：https://gitcode.com/gh_mirrors/hy/hyperlight

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.22 K

670