Hoarder项目中的JSON输出格式问题分析与解决方案

2025-05-15 11:46:14作者：宗隆裙

在开源项目Hoarder的CLI工具使用过程中，开发者发现bookmark list命令输出的JSON格式存在不规范问题。本文将深入分析该问题的技术细节，并提出合理的解决方案。

问题现象

当用户执行hoarder bookmarks list > bookmarks.json命令时，输出的JSON文件存在以下格式问题：

日期字段未使用双引号包裹
部分键名(key)未使用双引号
字符串值中存在拼接符号(+)和多段引号
htmlContent字段包含未处理的HTML片段和截断标记

这些问题导致输出的JSON文件无法被标准JSON解析器正确处理。

技术分析

根本原因

问题的根源在于Node.js的console.dir()方法。该方法虽然能够将对象以可读形式输出，但并不保证输出的字符串是严格符合JSON规范的。特别是：

不会自动为所有键和字符串值添加双引号
对特殊字符的处理不够严谨
日期对象的序列化方式不符合JSON标准

现有实现的问题

当前实现直接使用console.dir()输出对象，这导致了以下具体问题：

日期格式问题：createdAt: 2024-05-11T16:51:13.000Z应该为"createdAt": "2024-05-11T16:51:13.000Z"
键名引号缺失：id: 'xxxxxxxxx'应该为"id": "xxxxxxxxx"
字符串拼接问题：多行字符串使用+拼接不符合JSON规范
HTML内容处理：原始HTML中的特殊字符可能导致解析错误

解决方案

基础修复方案

最简单的解决方案是使用JSON.stringify()替代console.dir()：

console.log(JSON.stringify(bookmarks, null, 4));

这种方法可以：

自动为所有键和字符串值添加双引号
正确处理日期对象的序列化
确保输出符合JSON规范

进阶改进建议

考虑到CLI工具的整体一致性，建议进行以下改进：

统一输出格式：所有命令都应支持JSON输出
添加--json选项：允许用户选择输出格式(表格或JSON)
内容简化：对htmlContent等复杂字段进行适当简化
错误处理：添加JSON解析错误处理机制

实现示例

以下是改进后的代码示例：

function outputJson(data) {
  const simplified = data.map(item => {
    const { htmlContent, ...rest } = item.content;
    return {
      ...item,
      content: {
        ...rest,
        htmlContent: htmlContent ? "<CROPPED>" : null
      }
    };
  });
  console.log(JSON.stringify(simplified, null, 2));
}