Marked.js中处理数学公式分隔符的技术方案

2025-05-04 23:49:48作者：农烁颖Land

Marked是一款轻量级且高效的Markdown解析器，适用于浏览器、服务器及命令行环境。它专为速度优化，采用底层编译技术，避免长时间阻塞或缓存，确保快速响应。支持多种Markdown特性及规范，完美适应现代开发需求。无论你是要构建动态网站、编写文档还是简单地命令行转换文本，Marked都能轻松应对。请注意，它不负责HTML输出的自动净化，请手动集成如DOMPurify等库保障安全性。想体验其强大功能？不妨一试其在线演示，或通过NPM轻松集成到你的项目中，让文档创作与呈现既快捷又灵活。

项目地址：https://gitcode.com/gh_mirrors/mar/marked

问题背景

在使用Marked.js解析Markdown文档时，经常会遇到需要处理数学公式的情况。常见的数学公式渲染库如MathJax和KaTeX都使用特定的分隔符来标识公式内容，例如$$...$$、 $...$ 、$...$和\[...\]等。

然而，Marked.js默认会将这些分隔符作为普通文本处理，导致后续数学公式渲染失败。这是因为Marked.js的解析过程会改变原始文本结构，使得数学公式的分隔符被错误地转义或修改。

解决方案

自定义扩展方案

Marked.js提供了强大的扩展机制，允许开发者自定义解析规则。针对数学公式处理，我们可以采用以下两种主要方法：

保护模式扩展：创建一个自定义扩展，将数学公式及其分隔符作为原始文本保留，避免被Markdown解析过程修改。
集成处理扩展：直接创建能够识别并处理数学公式的扩展，在Markdown解析的同时完成公式渲染。

实现示例

以下是一个保护模式扩展的基本实现思路：

const marked = require('marked');

// 定义数学公式分隔符
const mathDelimiters = [
  {left: "$$", right: "$$", display: true},
  {left: "$", right: "$", display: false},
  {left: "\\(", right: "\\)", display: false},
  {left: "\\[", right: "\\]", display: true}
];

// 创建自定义扩展
const mathExtension = {
  name: 'math',
  level: 'inline',
  start(src) { return src.indexOf('$'); },
  tokenizer(src, tokens) {
    // 实现识别数学公式的逻辑
    // 返回匹配的token或undefined
  },
  renderer(token) {
    // 返回原始数学公式文本
    return token.raw;
  }
};

// 使用扩展
marked.use({ extensions: [mathExtension] });