Jolt 实现 JSON 数据中相同主项的合并处理

2025-07-10 23:00:46作者：凌朦慧Richard

在 JSON 数据处理中，经常会遇到需要合并具有相同主键的子数组的情况。本文将以 bazaarvoice/jolt 项目为例，介绍如何使用 Jolt 转换工具实现这一功能。

问题场景分析

我们有一个包含设计通用信息的 JSON 数据结构，其中 designGeneral 数组包含多个设计项。每个设计项都有唯一的 id 和 designedFor 对象，以及一个 hasPart 数组。当多个设计项的 id 和 designedFor 相同时，我们需要将这些项的 hasPart 数组合并。

原始数据结构特点

顶层结构包含 data 对象，其中有 designGeneral 数组
每个 designGeneral 项包含：
- id：唯一标识符
- designedFor：设计目标对象
- hasPart：包含多个活动描述的数组

Jolt 转换方案

我们使用四步转换来实现这一合并功能：

第一步：按 ID 和 designedFor.id 分组

{
  "operation": "shift",
  "spec": {
    "data": {
      "designGeneral": {
        "*": {
          "*": "data.designGeneral.@(1,id).@(1,designedFor.id).&",
          "hasPart": {
            "*": {
              "*": "data.designGeneral.@(3,id).@(3,designedFor.id).hasPart.@(1,id).&"
            }
          }
        }
      }
    }
  }
}

这一步通过 shift 操作将数据按 id 和 designedFor.id 进行分组，同时保留 hasPart 的结构。

第二步：将分组后的 designGeneral 转换为数组

{
  "operation": "shift",
  "spec": {
    "data": {
      "designGeneral": {
        "*": {
          "*": "data.designGeneral[]"
        }
      }
    }
  }
}

分组后，我们需要将数据结构重新组织为数组形式，为后续处理做准备。

第三步：将 hasPart 转换为数组

{
  "operation": "shift",
  "spec": {
    "data": {
      "designGeneral": {
        "*": {
          "*": "data.designGeneral[&1].&",
          "hasPart": {
            "*": "data.designGeneral[&2].&1[]"
          }
        }
      }
    }
  }
}

这一步确保每个设计项的 hasPart 被正确地组织为数组形式，合并相同主项下的所有子项。

第四步：去除重复的 id 和 designedFor

{
  "operation": "cardinality",
  "spec": {
    "data": {
      "designGeneral": {
        "*": {
          "id": "ONE",
          "designedFor": "ONE"
        }
      }
    }
  }
}