使用jq工具在Bash脚本中构建多层级JSON
2025-05-04 14:43:40作者:卓艾滢Kingsley
在Shell脚本编程中,处理JSON数据是一项常见任务。jq作为一款强大的命令行JSON处理器,能够帮助我们高效地构建和操作JSON数据结构。本文将通过一个实际案例,讲解如何使用jq在Bash脚本中动态构建包含数组的多层级JSON结构。
问题背景
开发者尝试从一个文本文件中读取数据,并将其转换为特定结构的JSON格式。核心需求包括:
- 解析包含时间戳和站点信息的多行文本
- 将时间戳转换为可读格式
- 将站点信息组织为JSON数组
- 动态地向数组中添加元素
初始实现分析
原始脚本采用了以下方法:
- 使用
readarray读取文件内容到数组 - 遍历数组元素,通过正则匹配识别不同类型的数据
- 对于时间戳,转换为日期格式并添加到JSON对象
- 对于站点信息,尝试创建节点数组并添加MAC地址和接口信息
关键挑战
在实现过程中,开发者遇到了向JSON数组中动态添加元素的困难。具体表现为:
- 直接使用变量作为数组索引(
.nodes[$count])无法正常工作 - 尝试使用数组长度作为索引(
.nodes[.nodes | length])也未达到预期效果
解决方案
jq提供了多种向数组添加元素的方法,以下是几种有效的实现方式:
方法一:使用数组拼接运算符
JSON=$(echo $JSON | jq --arg mac "${mac}" '.nodes += [{"mac": $mac}]')
这种方法简洁明了,通过+=运算符将包含新元素的对象追加到数组末尾。
方法二:使用数组构造语法
JSON=$(echo $JSON | jq --arg mac "${mac}" '.nodes |= . + [{"mac": $mac}]')
这种语法使用|=更新运算符,将原数组与新构造的数组合并。
方法三:使用变量索引
如果需要显式使用计数变量作为索引,可以这样实现:
JSON=$(echo $JSON | jq --arg mac "${mac}" --argjson count "$count" '.nodes[.nodes|length] = {"mac": $mac}')
完整改进方案
结合上述方法,改进后的脚本核心部分如下:
#!/bin/bash
JSON=$(jq -n '{}')
readarray -t array < ./station.sample
for e in "${array[@]}"
do
if echo "$e" | grep -Eq '^[0-9]{10}' >/dev/null; then
timestamp=$e
datetime=$(date +'%Y-%m-%d %H:%M:%S' -d "@$e")
JSON=$(jq -n --argjson json "$JSON" \
--arg timestamp "$timestamp" \
--arg datetime "$datetime" \
'$json + ($ARGS.named|del(.json))')
fi
if echo "$e" | grep '^Station ' >/dev/null; then
mac=$(echo "$e" | awk '{print $2}')
interface=$(echo "$e" | awk '{print $4}' | rev | cut -c2- | rev)
JSON=$(jq -n --argjson json "$JSON" \
--arg mac "$mac" \
--arg interface "$interface" \
'$json | (.nodes += [{"mac": $mac, "interface": $interface}])')
fi
done
性能优化建议
- 减少jq调用次数:每次调用jq都会产生进程创建开销,可以考虑将多次操作合并到单个jq命令中
- 使用
--argjson传递复杂数据结构 - 对于大型数据集,考虑使用jq的流式处理功能
扩展应用
这种技术可以应用于多种场景:
- 日志文件转JSON
- 系统监控数据收集
- 网络设备配置导出
- API响应数据处理
通过掌握jq在Shell脚本中的高级用法,开发者可以更高效地处理复杂的JSON数据转换任务。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0172
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook098
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
BitCPM-CANN-8BBitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值化)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速,覆盖了从自定义三值算子到基于昇腾 910B 的分布式并行训练的完整训练栈。Python00
MiniCPM5-1BMiniCPM5-1B,这是 MiniCPM5 系列的首款模型。它是一个专为端侧、本地部署和资源受限场景打造的 10 亿参数密集型 Transformer 模型,达到了 10 亿参数级开源模型的 SOTA 水平Jinja00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0239
项目优选
收起
deepin linux kernel
C
32
16
暂无描述
Dockerfile
750
4.87 K
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.58 K
172
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
841
1.84 K
Ascend Extension for PyTorch
Python
690
834
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
234
98
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
451
419
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.02 K
1.04 K
暂无简介
Dart
998
259
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
642
1.27 K