Azure CLI中VMSS运行命令卡在InProgress状态的技术分析

2025-06-15 19:15:31作者：邬祺芯Juliet

问题现象

在使用Azure CLI执行虚拟机规模集(VMSS)运行命令时，用户遇到了命令执行长时间停留在"InProgress"状态的问题。具体表现为当执行az vmss run-command invoke命令时，尽管脚本内容非常简单（如"Write-Host test"），但操作状态持续显示为"进行中"，直到最终超时。

技术背景

Azure CLI的vmss run-command invoke功能允许管理员在虚拟机规模集实例上远程执行脚本或命令。这一功能基于Azure的RunCommand基础设施实现，通过Azure资源管理器与虚拟机代理通信来执行命令。

可能原因分析

虚拟机代理问题：VMSS实例上的Windows Azure Guest Agent可能未正常运行或响应延迟
资源限制：虚拟机实例可能遇到内存不足(OOM)或其他资源限制
网络通信问题：虚拟机与Azure控制平面之间的通信可能存在延迟或中断
扩展冲突：某些虚拟机扩展可能与RunCommand功能存在兼容性问题
服务端问题：Azure Compute服务可能存在临时性问题

解决方案建议

基础检查：
- 确认VMSS实例处于运行状态
- 检查实例上的Windows Azure Guest Agent服务是否正常运行
- 验证实例是否有足够的系统资源
诊断步骤：
- 使用Azure门户检查VMSS实例的运行状况
- 查看实例的系统日志，特别是与RunCommand相关的日志
- 尝试在实例上直接执行相同命令，验证是否能够正常完成
替代方案：
- 考虑使用Azure Automation或自定义脚本扩展作为替代方案
- 对于关键操作，可以设计重试机制和超时处理