在jsdiff中实现JSON文本的单词级差异对比

2025-05-27 16:23:07作者：丁柯新Fawn

背景介绍

jsdiff是一个流行的JavaScript差异对比库，广泛应用于代码比较、文本差异分析等场景。在实际开发中，我们经常需要比较两个JSON对象之间的差异。jsdiff提供了diffJson方法来实现这一功能，但默认情况下它是以行为单位进行对比的。

问题分析

当JSON中包含大段文本内容时，如果这些文本只有少量单词的差异，使用行级对比就会显得不够精细。开发者只能看到整段文本被标记为差异，而无法直观地看到具体哪些单词发生了变化。这种情况在配置对比、文档版本比较等场景下尤为常见。

技术方案

jsdiff库内部实际上由多个差异对比引擎组成，包括行级对比(lineDiff)、单词级对比(wordDiff)和JSON专用对比(jsonDiff)等。我们可以通过修改JSON对比引擎的tokenize方法，将其从默认的行级分词改为单词级分词。

实现步骤

1. 导入所需模块

首先需要同时导入JSON对比和单词对比两个模块：

import jsonDiff from 'diff/lib/diff/json.js';
import wordDiff from 'diff/lib/diff/word.js';

2. 替换分词方法

将JSON对比引擎的tokenize方法替换为单词对比引擎的tokenize方法：

jsonDiff.jsonDiff.tokenize = wordDiff.wordDiff.tokenize;

3. 使用改造后的对比方法

现在就可以使用改造后的diffJson方法进行单词级的JSON对比了：

const result = jsonDiff.diffJson(
  {content: '这是一段包含多个单词的文本'},
  {content: '这是一段包含不同单词的文本'}
);

React应用中的实现

在React应用中，由于模块加载的异步性，我们需要使用动态导入和状态管理：

const [diffJsonWords, setDiffJsonWords] = useState(DiffMethod.JSON);

useEffect(() => {
  Promise.all([
    import('diff/lib/diff/json.js'),
    import('diff/lib/diff/word.js'),
  ]).then(([jsonModule, wordModule]) => {
    jsonModule.jsonDiff.tokenize = wordModule.wordDiff.tokenize;
    setDiffJsonWords(() => jsonModule.diffJson);
  });
}, []);