Open XML SDK 中自定义XML部件更新的注意事项

2025-06-15 09:35:22作者：丁柯新Fawn

在使用 Open XML SDK 处理 Word 文档时，开发者经常会遇到需要更新文档中自定义 XML 部件的情况。本文将通过一个典型场景，深入分析如何正确更新 Word 文档中的自定义 XML 数据，并解释其中容易忽视的技术细节。

问题背景

在开发过程中，一个常见需求是更新 Word 文档中嵌入的自定义 XML 数据。开发者可能会遇到这样的情况：虽然成功更新了自定义 XML 部件（如 item1.xml），但文档主体（document.xml）却没有同步更新，直到执行"另存为"操作后才看到变更生效。

核心问题分析

这种现象的根本原因在于 Word 文档的结构特性。Word 文档是一个由多个部件组成的 ZIP 包，其中：

自定义 XML 部件存储原始数据
文档主体（document.xml）包含实际显示内容
内容控件绑定将 XML 数据显示在文档中

当仅更新自定义 XML 部件时，文档主体不会自动更新，因为：

内容控件绑定是单向的（从 XML 到文档）
Word 应用程序会在打开文档时重新解析 XML 数据
直接保存不会触发文档主体的重新生成

正确的实现方式

以下是使用 Open XML SDK 处理此类需求的推荐做法：

// 1. 创建内存流并写入文档数据
byte[] byteWordDoc = Convert.FromBase64String(strWordDocBase64);
using var streamWordDoc = new MemoryStream(byteWordDoc);

// 2. 使用 using 语句确保资源正确释放
using (var wordDoc = WordprocessingDocument.Open(streamWordDoc, true))
{
    // 3. 解析要更新的XML数据
    byte[] byteXmlFile = Convert.FromBase64String(strXMLFileBase64);
    var xmlfile = XElement.Parse(Encoding.UTF8.GetString(byteXmlFile));

    // 4. 查找目标自定义XML部件
    var mainXMLPart = wordDoc.MainDocumentPart.CustomXmlParts
        .FirstOrDefault(part => part.Uri.OriginalString.Contains(strWordDocNamespace));

    if (mainXMLPart != null)
    {
        // 5. 更新XML部件内容
        using (var stream = mainXMLPart.GetStream(FileMode.Create, FileAccess.Write))
        using (var writer = XmlWriter.Create(stream))
        {
            xmlfile.Save(writer);
        }
    }
    
    // 6. 自动保存并关闭文档
}

// 7. 此时streamWordDoc已包含更新后的完整文档