Shiki代码高亮库中按需加载语言解析器的优化实践

2025-05-20 19:25:20作者：盛欣凯Ernestine

在Web开发中，代码高亮是提升用户体验的重要功能之一。Shiki作为一款基于TextMate语法的代码高亮库，因其精准的语法高亮效果而广受欢迎。然而，在实际使用过程中，开发者可能会遇到一个性能优化问题：如何实现语言解析器的按需加载。

问题背景

Shiki默认的工作机制是在初始化时同步加载所有配置的语言解析器（lexers）。这种设计虽然保证了高亮操作的同步执行（这对某些集成场景很重要），但也带来了明显的性能开销。当项目中只需要高亮少数几种语言时，加载全部语言解析器会造成不必要的资源浪费，影响页面加载速度。

核心问题分析

通过实际案例观察，即使只指定使用TypeScript语言进行高亮，Shiki仍然会加载所有配置的语言解析器模块。这主要表现在：

网络请求中出现了所有语言模块的JS文件加载
内存中保留了未使用语言解析器的资源
增加了初始化的时间和资源消耗

解决方案

针对这一问题，Shiki核心团队成员提出了异步加载的解决方案。这种方案特别适合那些可以接受异步操作的集成环境：

延迟加载机制：首先检查当前是否已加载目标语言
动态导入：当语言未加载时，异步导入对应的语言模块
按需注册：将导入的语言模块注册到高亮器实例中

实现示例

以下是经过优化的实现代码，展示了如何实现TypeScript语言的按需加载：

// 检查是否已加载目标语言
if (!highlighter.getLoadedLanguages().includes('typescript')) {
  // 动态导入语言模块
  const tsModule = await import('shiki/langs/typescript.mjs');
  // 注册语言
  await highlighter.loadLanguage(tsModule);
}

// 执行高亮操作
const html = highlighter.codeToHtml(code, { lang: 'ts' });

对于更复杂的场景，可以结合Shiki提供的bundledLanguages信息，构建一个通用的语言加载器：

async function loadLanguageOnDemand(lang: string) {
  const { bundledLanguages } = await import('shiki/langs');
  const importFn = (bundledLanguages as any)[lang];
  if (!importFn) return;
  
  if (!highlighter.getLoadedLanguages().includes(lang)) {
    await highlighter.loadLanguage(await importFn());
  }
}