Jolt 转换:如何将扁平 JSON 结构转换为嵌套数组格式
2025-07-10 01:14:53作者:滑思眉Philip
在数据处理和转换过程中,我们经常需要将简单的扁平 JSON 结构转换为更复杂的嵌套格式。本文将通过一个实际案例,展示如何使用 Jolt 库实现这种转换。
原始数据结构分析
我们有以下简单的 JSON 输入:
{
"id": "INC-199",
"name": "Test Incident",
"category": "SERVER"
}
这个数据结构包含三个字段:
- id:事件编号
- name:事件名称
- category:事件分类
目标数据结构
我们需要将其转换为以下格式:
{
"cxid": "INC-199",
"cispec": [
{
"assetattrid": "CX_NAME",
"alnvalue": "Test Incident"
},
{
"assetattrid": "CX_CATEGORY",
"alnvalue": "SERVER"
}
]
}
转换后的数据结构特点:
- id 字段被重命名为 cxid
- name 和 category 字段被放入 cispec 数组中
- 每个数组元素包含两个字段:
- assetattrid:固定的标识符(CX_NAME 或 CX_CATEGORY)
- alnvalue:原始字段的值
Jolt 转换方案实现
为了实现这种转换,我们使用了两步 Jolt 转换:
第一步:初步转换
[
{
"operation": "shift",
"spec": {
"id": "cxid",
"name": {
"#CX_NAME": "&1.cispec.assetattrid",
"@0": "&1.cispec.alnvalue"
},
"category": {
"#CX_CATEGORY": "&1.cispec.assetattrid",
"@0": "&1.cispec.alnvalue"
}
}
}
]
这一步的关键点:
- 直接映射 id 到 cxid
- 对 name 和 category 字段进行特殊处理:
- 使用 # 符号添加固定值(CX_NAME 和 CX_CATEGORY)
- 使用 @0 引用当前字段的值
- &1 表示匹配的字段名(name 或 category)
第二步:数组化处理
{
"operation": "shift",
"spec": {
"*": "&",
"name|category": {
"*": "cispec[]"
}
}
}
这一步的关键点:
- "*": "&" 保留所有非 name/category 的字段
- 将 name 和 category 下的所有内容放入 cispec 数组
简化方案
经过分析,我们可以将上述两步合并为一个更简洁的方案:
[
{
"operation": "shift",
"spec": {
"id": "cxid",
"name": {
"#CX_NAME": "cispec[0].assetattrid",
"@": "cispec[0].alnvalue"
},
"category": {
"#CX_CATEGORY": "cispec[1].assetattrid",
"@": "cispec[1].alnvalue"
}
}
}
]
这个简化方案直接指定了数组索引,避免了第二步的处理,使转换更加直观。
技术要点总结
- 字段重命名:使用简单的键值对映射实现字段重命名
- 固定值插入:使用 # 符号可以插入固定字符串
- 数组构建:通过 [n] 索引或 [] 自动索引构建数组结构
- 条件处理:通过 | 符号可以匹配多个字段名
- 引用原始值:@ 符号用于引用输入中的原始值
这种转换模式在 API 数据格式标准化、系统间数据交换等场景中非常有用,能够帮助开发者灵活地处理不同系统间的数据结构差异。
通过这个案例,我们可以看到 Jolt 转换的强大之处在于它能够通过声明式的 JSON 配置完成复杂的数据结构转换,而无需编写繁琐的代码逻辑。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01
项目优选
收起
暂无描述
Dockerfile
764
4.98 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.93 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
683
1.33 K
Ascend Extension for PyTorch
Python
719
882
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
457
439
用户可使用该项目在 OpenHarmony 平台开发应用,支持通过 IDE 或终端用 Flutter Tools 指令编译构建,基于 Flutter 3.27.4 版本,新增 impeller-vulkan 渲染模式,兼容多种开发指令与环境配置。
Dart
1.01 K
261
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
253
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
998
609