ShikiJS 中通过 Transformer 添加包装元素时节点重复问题的分析与解决

2025-05-20 01:28:00作者：曹令琨Iris

在 ShikiJS 项目中，开发者在使用 transformer 为代码块添加外层包装元素时，可能会遇到意外的节点重复问题。本文将深入分析这一现象的技术原理，并提供多种解决方案。

问题现象

当开发者尝试通过 transformer 的 root 或 postprocess 钩子为代码块添加外层 div 包装时，最终生成的 HTML 结构中会出现额外的 pre 和 code 元素包裹。例如：

<pre> <!-- 意外的外层包装1 -->
  <code class="language-js"> <!-- 意外的外层包装2 -->
    <div data-my-attr="val"> <!-- 开发者期望的包装 -->
      <pre class="shiki">...</pre>
    </div>
  </code>
</pre>

技术背景

这种现象源于 Markdown-it 的工作机制。Markdown-it 在渲染代码块时，默认会自动为高亮结果添加 pre 和 code 元素包装。这是 Markdown 规范的标准行为，但在某些定制化场景下会成为障碍。

解决方案

方案一：正确返回 Root 节点

在 transformer 的 root 钩子中，必须返回完整的 Root 类型对象：

{
  type: 'root',
  children: [
    {
      type: 'element',
      tagName: 'div',
      properties: { 'data-my-attr': 'val' },
      children: root.children
    }
  ]
}

方案二：禁用 Markdown-it 的自动包装

通过修改 Markdown-it 的渲染规则，可以禁用其自动添加包装的行为：

自定义 fence 渲染规则
确保高亮结果以 <pre 开头（Markdown-it 的跳过条件）

实现示例：

const customFenceRule = (tokens, idx, options, env, slf) => {
  const token = tokens[idx];
  const info = token.info ? unescapeAll(token.info).trim() : '';
  const content = token.content;
  
  if (content.startsWith('<pre')) {
    return content;
  }
  
  // 否则返回默认处理
  return slf.renderToken(tokens, idx, options);
};

md.renderer.rules.fence = customFenceRule;

方案三：使用专用插件

社区已开发了专门解决此问题的插件，可直接集成使用：

import wrapperlessFence from 'markdown-it-wrapperless-fence-rule';

md.use(wrapperlessFence);

最佳实践建议

优先考虑使用 postprocess 钩子进行包装，因为它可以访问完整的元数据
如需深度定制，建议组合使用 transformer 和自定义渲染规则
在团队协作项目中，推荐使用专用插件方案以保证一致性

总结

理解 Markdown-it 的渲染机制是解决此类问题的关键。通过合理配置 transformer 和渲染规则，开发者可以灵活控制代码块的最终输出结构，满足各种定制化需求。对于常见场景，使用社区验证过的解决方案往往是最稳妥的选择。

shiki

A beautiful Syntax Highlighter.

项目地址：https://gitcode.com/gh_mirrors/sh/shiki

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.03 K

480

torchair

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

Python

276

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openGauss kernel ~ openGauss is an open source relational database management system

C++

157

210