Shiki.js 内存泄漏问题解析与解决方案

2025-05-20 08:26:18作者：裘晴惠Vivianne

问题现象

在使用 Shiki.js 进行代码高亮渲染时，特别是在 Next.js 14 应用中使用 React Server Components 的场景下，系统会出现间歇性崩溃。错误表现为 TypeError: onigBinding.UTF8ToString is not a function，通常发生在处理多个并行请求或长时间运行后。

根本原因分析

经过深入调查，发现这个问题由两个核心因素导致：

WASM 内存管理异常：当内存分配失败时，错误处理代码尝试调用 UTF8ToString 方法，但此时该方法已不可用，导致程序崩溃。
高频调用 getHighlighter：许多开发者会在每次渲染时都创建新的高亮器实例，这会导致内存持续增长，最终触发 WASM 内存越界错误。

技术细节

Shiki.js 底层使用 WebAssembly(wasm)来实现高性能语法分析。WASM 的内存管理有其特殊性：

内存分配是手动管理的
内存一旦分配就不会自动回收
频繁创建高亮器实例会导致内存碎片化

当内存不足时，系统会抛出异常，但错误处理机制本身又依赖已失效的内存，形成恶性循环。

解决方案

1. 单例模式使用高亮器

最佳实践是在应用初始化时创建高亮器实例，并重复使用：

// 全局或模块级缓存
let highlighter: Highlighter | null = null

async function getCachedHighlighter() {
  if (!highlighter) {
    highlighter = await getHighlighter({
      themes: ['dark-plus'],
      langs: ['javascript', 'typescript']
    })
  }
  return highlighter
}

2. 显式释放资源

从 v1.8 版本开始，Shiki 提供了 dispose 方法主动释放内存：

const highlighter = await getHighlighter({...})
// 使用完成后
highlighter.dispose()

3. 分批处理大量文件

当需要处理大量文件时，建议：

将文件分成多个批次
每批处理完成后调用 dispose
或者为每批启动独立的进程

框架集成建议

Next.js 最佳实践

// lib/shiki.ts
import { getHighlighter } from 'shiki'

let highlighter: Awaited<ReturnType<typeof getHighlighter>>

export async function highlight(code: string, lang: string) {
  if (!highlighter) {
    highlighter = await getHighlighter({
      themes: ['github-dark'],
      langs: [lang]
    })
  }
  return highlighter.codeToHtml(code, { lang })
}

Nuxt/MDC 集成

通过创建插件来管理高亮器生命周期：

// plugins/shiki.ts
export default defineNuxtPlugin(async () => {
  const highlighter = await getHighlighter({...})
  
  return {
    provide: {
      shiki: highlighter
    }
  }
})