UTM虚拟机中CentOS Stream 9升级后启动失败问题分析
问题现象
在UTM虚拟机环境中运行CentOS Stream 9系统的用户报告了一个严重问题:当系统执行dnf upgrade更新并重启后,虚拟机无法正常启动,系统在到达GRUB引导程序之前就会崩溃。类似的问题也出现在其他基于RHEL 9的发行版中,包括Rocky Linux 9.4、AlmaLinux 9.4、Oracle Linux 9.3/9.4以及Fedora 39等。
技术背景
这个问题与QEMU虚拟化环境中的一个已知bug有关。具体表现为系统启动时出现"Synchronous Exception"错误,导致引导过程中断。值得注意的是,即使不更新内核包,仅更新其他系统组件也会触发此问题,这表明问题根源可能不仅限于内核层面。
影响范围
经过多位用户的测试验证,此问题主要影响以下Linux发行版:
- CentOS Stream 9
- Rocky Linux 9.x系列
- AlmaLinux 9.x系列
- Oracle Linux 9.x系列
- Fedora 39
而Fedora 40、Ubuntu 22.04/24.04以及Debian 11/12等发行版则不受此问题影响。
根本原因分析
从技术角度看,这个问题与QEMU在ARM架构下的页表处理机制有关。当这些受影响的RHEL系发行版执行系统更新后,某些组件(可能是引导加载程序或固件)会尝试使用特定的内存页大小配置,而QEMU的当前实现无法正确处理这种配置变更,导致系统在引导早期阶段就触发同步异常。
解决方案
目前有以下几种可行的解决方案:
-
切换虚拟化后端: 将虚拟机的虚拟化后端从QEMU切换为Apple Virtualization框架。多位用户报告这种方法可以完全规避此问题。对于已存在的虚拟机,可以通过以下步骤迁移:
- 将原有虚拟磁盘转换为RAW格式
- 创建新的Apple Virtualization虚拟机配置
- 导入转换后的磁盘映像
-
使用替代引导加载程序: 对于无法切换虚拟化后端的用户,可以尝试使用发行版安装介质中的原始grubx64.efi文件替换更新后的引导加载程序。具体操作包括:
- 从安装ISO中提取grubx64.efi
- 将其放置到/boot/efi/efi/[发行版名称]/目录下
- 通过OVMF引导管理器添加新的引导项
-
暂时避免系统更新: 对于关键业务环境,在QEMU修复此问题前,可以暂时避免执行完整的系统更新,特别是涉及引导相关组件的更新。
长期展望
这个问题已经引起了QEMU开发团队的关注,预计未来的QEMU版本将会包含针对此问题的修复。建议用户关注UTM和QEMU的更新日志,在确认问题修复后再考虑切换回QEMU后端(如果需要使用QEMU特有的功能)。
技术建议
对于需要在UTM中运行RHEL 9系发行版的用户,建议:
- 新虚拟机优先使用Apple Virtualization后端创建
- 定期备份重要虚拟机,特别是在执行系统更新前
- 关注UTM和QEMU的版本更新,及时获取问题修复
- 对于开发测试环境,可以考虑使用不受此问题影响的替代发行版
这个问题再次提醒我们,在虚拟化环境中运行操作系统时,虚拟化层与客户机操作系统之间的兼容性是需要特别关注的重点,特别是在ARM架构下运行x86_64系统时,各种模拟和转换层可能会引入意想不到的问题。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0245- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
HivisionIDPhotos⚡️HivisionIDPhotos: a lightweight and efficient AI ID photos tools. 一个轻量级的AI证件照制作算法。Python05