Jolt项目实战：如何实现JSON数组间的数据关联匹配

2025-07-10 07:25:41作者：董灵辛Dennis

在JSON数据处理过程中，经常会遇到需要根据某个关键字段将不同数组中的数据进行关联匹配的场景。本文将以Jolt转换库为例，详细介绍如何实现两个JSON数组间的数据关联操作。

业务场景分析

假设我们有以下JSON数据结构：

主数据：包含支付信息数组，每个支付对象有id和status字段
临时数据：包含转账信息数组，每个转账对象有transferId和recipientId字段

我们的目标是根据支付id和转账transferId的匹配关系，将recipientId合并到对应的支付对象中。

输入输出示例

输入数据：

{
  "input": {
    "payment": [
      {"id": "rem_X_nSRHt1KrIEC4EAkruYrpG-Osw", "status": "SUCCESS"},
      {"id": "rem_X_asdasdasdpG-asd2", "status": "SUCCESS"}
    ]
  },
  "temp": [
    {"transferId": "rem_X_nSRHt1KrIEC4EAkruYrpG-Osw", "recipientId": "12345678"},
    {"transferId": "rem_X_asdasdasdpG-asd2", "recipientId": "9876543"}
  ]
}

期望输出：

{
  "payment": [
    {
      "id": "rem_X_nSRHt1KrIEC4EAkruYrpG-Osw",
      "status": "SUCCESS",
      "recipientId": "12345678"
    },
    {
      "id": "rem_X_asdasdasdpG-asd2",
      "status": "SUCCESS",
      "recipientId": "9876543"
    }
  ]
}

Jolt转换方案解析

实现这一转换的关键在于使用Jolt的shift操作，通过数组索引匹配来实现数据关联：

[
  {
    "operation": "shift",
    "spec": {
      "input": {
        "payment": {
          "*": {
            "*": "&2.[&1].&"
          }
        }
      },
      "temp": {
        "*": {
          "recipientId": "payment.[&1].&"
        }
      }
    }
  }
]

转换逻辑详解

主数据处理路径：
- "input": {"payment": {"*": {"*": "&2.[&1].&"}}}
- 这个路径会遍历payment数组中的所有元素
- &2表示向上回溯两层获取字段名"payment"
- [&1]表示使用当前数组索引作为新数组的索引
- &表示保留原始字段名
临时数据处理路径：
- "temp": {"*": {"recipientId": "payment.[&1].&"}}
- 这个路径会遍历temp数组中的recipientId字段
- [&1]使用当前数组索引确保与payment数组索引匹配
- 将recipientId值放入payment数组中对应索引位置