Lexical 项目中处理未知 HTML 标签的技术方案

2025-05-10 14:39:03作者：姚月梅Lane

在富文本编辑器开发中，处理用户输入的未知 HTML 标签是一个常见需求。Lexical 作为一个现代化的富文本编辑器框架，其设计哲学强调可扩展性和灵活性。本文将深入探讨如何在 Lexical 编辑器中实现对未知 HTML 标签的支持。

核心挑战

Lexical 的 DOM 转换机制默认会剥离所有未被明确识别的 HTML 标签。这种设计虽然保证了内容的安全性，但也限制了编辑器的灵活性。开发者面临的主要挑战包括：

如何保留编辑器不支持的 HTML 标签结构
如何确保这些未知标签内容在编辑器中只读显示
如何在导入/导出过程中保持这些标签的完整性

技术实现方案

HTMLNode 节点设计

我们可以通过创建一个特殊的 DecoratorNode 子类来处理未知标签：

class HTMLNode extends DecoratorNode<HTMLElement> {
  __html: string;

  // 实现必要的静态方法和实例方法
  static getType() { return 'html'; }
  
  constructor(html: string, key?: NodeKey) {
    super(key);
    this.__html = html;
  }

  createDOM() {
    const wrapper = document.createElement('div');
    wrapper.innerHTML = this.__html;
    return wrapper;
  }
}

这个节点类将未知 HTML 内容作为字符串存储，并在渲染时直接插入到 DOM 中。

关键实现细节

DOM 转换注册：必须为每个需要支持的 HTML 标签显式注册转换器

static importDOM(): DOMConversionMap {
  return {
    'iframe': this.convert,
    'dialog': this.convert,
    // 明确列出所有需要支持的标签
  };
}

private static convert(domNode: Node): DOMConversionOutput {
  return {
    node: new HTMLNode((domNode as HTMLElement).outerHTML)
  };
}

只读特性：通过不实现更新逻辑确保内容只读
导出处理：在导出时保持原始 HTML 结构

exportDOM() {
  const parser = new DOMParser();
  const doc = parser.parseFromString(this.__html, 'text/html');
  return { element: doc.body.firstElementChild as HTMLElement };
}