DirectXShaderCompiler中SPIR-V调试符号生成问题分析

2025-06-25 23:29:35作者：翟萌耘Ralph

问题背景

在DirectXShaderCompiler(DXC)项目中，当使用SPIR-V后端编译带有调试信息的网格着色器时，编译器会生成无效的SPIR-V代码。具体表现为当启用-fspv-debug=vulkan-with-source选项时，编译器会报错"ID 'XXX[%XXX]' has not been defined"。

问题现象

开发者在使用DXC编译如下HLSL网格着色器代码时遇到了问题：

#define MAX_VERTICES 64
#define MAX_PRIMITIVES 124

struct MeshPayload {
  uint data[32];
};

struct VertexAttributes {
    float3 position : SV_Position;
};

[outputtopology("triangle")]
[numthreads(1, 1, 1)]
void main(
  in payload MeshPayload payload,
  uint gid : SV_GroupID,
  out indices uint3 triangles[MAX_PRIMITIVES],
  out vertices VertexAttributes vertices[MAX_VERTICES]
) {
  uint data = payload.data[gid];
}

当使用以下命令编译时：

dxc -T ms_6_5 -spirv -fspv-target-env=vulkan1.1spirv1.4 -fspv-debug=vulkan-with-source test.hlsl

编译器会报错：

fatal error: generated SPIR-V is invalid: ID '356[%356]' has not been defined
  %355 = OpExtInst %void %1 DebugValue %71 %356 %75 %int_0

技术分析

根本原因

这个问题源于DXC在SPIR-V生成过程中的"copy-propagate-arrays"优化阶段。该优化旨在消除不必要的数组拷贝操作，但在处理调试信息时出现了顺序问题。

具体来说：

编译器最初为局部变量修改生成了DebugValue指令
"copy-propagate-arrays"优化阶段创建了一个新的OpAccessChain指令，直接访问数组而不再通过局部变量
优化器会随后让死代码消除(DCE)阶段移除不再使用的代码
优化器尝试修补DebugValue指令以反映新的访问方式

问题在于，新的OpAccessChain指令被添加在了修补后的DebugValue指令之后，导致了无效的前向引用。

SPIR-V调试信息生成机制

在SPIR-V中，调试信息通过特殊的扩展指令表示。DebugValue指令用于记录变量的值与其调试信息的关联。当编译器进行优化时，需要确保所有被引用的ID都已经正确定义。

影响范围

此问题主要影响：

使用网格着色器(ms_6_5)的HLSL代码
启用了SPIR-V调试信息生成(-fspv-debug=vulkan-with-source)
涉及数组访问和局部变量优化的场景

解决方案

该问题已被识别为重复问题，并在后续提交中被修复。修复方案主要涉及：

确保在修补DebugValue指令前正确定义所有被引用的ID
调整优化阶段的执行顺序，避免生成前向引用
完善调试信息在优化过程中的处理逻辑

开发者建议

对于遇到类似问题的开发者，可以采取以下临时解决方案：

暂时禁用调试信息生成(不适用-fspv-debug选项)
简化着色器中的数组访问模式
使用最新版本的DXC编译器，确保已包含相关修复

总结

这个问题展示了编译器在同时处理优化和调试信息时可能遇到的挑战。调试信息需要准确反映优化后的代码行为，而优化过程又不应破坏调试信息的有效性。DXC团队通过调整优化顺序和完善调试信息处理逻辑解决了这一问题，为开发者提供了更可靠的调试体验。

DirectXShaderCompiler

This repo hosts the source for the DirectX Shader Compiler which is based on LLVM/Clang.

项目地址：https://gitcode.com/gh_mirrors/di/DirectXShaderCompiler

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

578

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java