Azure CLI 中角色分配删除操作在PME租户中的MSI连接问题分析

2025-06-15 12:18:53作者：霍妲思

问题背景

在使用Azure CLI的Cloud Shell环境时，开发人员在PME(生产管理环境)租户中执行角色分配删除操作时遇到了MSI(托管服务标识)连接失败的问题。具体表现为当运行az role assignment delete命令时，系统返回"Failed to connect to MSI"错误，而相同的命令在MSFT(微软内部)租户中却能正常工作。

技术现象

错误日志显示，CLI尝试从本地MSI端点(http://localhost:50342/oauth2/token)获取Microsoft Graph API的访问令牌时收到了400错误响应。值得注意的是，角色分配创建操作(az role assignment create)在两种租户环境中都能正常工作。

根本原因分析

经过深入调查，发现问题的核心在于：

命令参数差异：az role assignment create命令支持--assignee-object-id和--assignee-principal-type参数，当这两个参数都提供时，命令可以绕过Microsoft Graph查询直接完成操作。
命令功能限制：当前版本的az role assignment delete命令不支持--assignee-object-id参数，因此CLI必须通过Microsoft Graph查询来解析主体信息，这就需要在PME租户中获取Graph API的访问令牌。
Cloud Shell限制：PME租户中的Cloud Shell环境配置存在问题，其MSI端点无法为Microsoft Graph资源颁发有效的访问令牌，导致400错误。

解决方案与变通方法

针对这一问题，可以考虑以下几种解决方案：

本地CLI环境：在本地安装Azure CLI并执行操作，避免使用Cloud Shell的MSI认证。
直接调用REST API：使用az rest命令直接调用角色分配删除的REST API端点，绕过CLI的Graph查询逻辑。
等待功能更新：Azure CLI团队已经合并了对--assignee-object-id参数的支持，该功能将在2025年5月6日的版本中发布。更新后可以使用新参数避免Graph查询。
Cloud Shell修复：从根本上解决Cloud Shell在PME租户中颁发Graph API令牌的问题。

技术建议

对于需要立即解决问题的用户，建议采用以下命令作为临时解决方案：

az rest --method delete --uri "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Authorization/roleAssignments/{roleAssignmentName}"

对于长期解决方案，建议：