Linux 系统管理必备:Bash 脚本编程完全指南
2025-06-06 14:45:38作者:牧宁李
Bash(Bourne Again SHell)作为 Linux 系统的标准 shell,其脚本编程能力是每位系统管理员和开发人员必须掌握的技能。本文将全面介绍 Bash 脚本编程的核心概念和实践技巧。
一、Bash 脚本基础入门
1.1 什么是 Bash 脚本
Bash 脚本本质上是包含一系列 Bash 命令的文本文件,它能够:
- 自动化重复性任务
- 组合复杂命令序列
- 创建自定义系统工具
- 实现系统管理自动化
1.2 创建第一个 Bash 脚本
创建一个完整的 Bash 脚本需要遵循以下步骤:
#!/bin/bash
# 这是一个注释行
echo "欢迎来到Bash编程世界!"
关键步骤说明:
- 使用
.sh扩展名保存文件 - 首行必须包含 shebang(
#!/bin/bash) - 通过
chmod +x script.sh赋予执行权限 - 使用
./script.sh执行脚本
二、变量与数据处理
2.1 变量基础操作
#!/bin/bash
# 字符串变量
username="李四"
department="技术部"
# 数值变量
years_of_service=5
# 使用变量
echo "$username 在 $department 工作已 $years_of_service 年"
# 命令替换
system_uptime=$(uptime -p)
echo "系统已运行: $system_uptime"
# 算术运算
disk_usage=$((100 - $(df -h / | awk 'NR==2 {print $5}' | tr -d '%')))
echo "根分区剩余空间: $disk_usage%"
2.2 特殊变量详解
| 变量 | 典型应用场景 |
|---|---|
$0 |
获取当前脚本名称 |
$1-$9 |
处理命令行参数 |
$# |
验证参数数量 |
$@ |
遍历所有参数 |
$? |
检查上条命令执行状态 |
$$ |
生成临时文件名 |
$RANDOM |
创建随机密码或临时值 |
$SECONDS |
脚本执行时间统计 |
三、流程控制结构
3.1 条件判断实战
#!/bin/bash
# 文件存在性检查
if [ -f "/etc/passwd" ]; then
echo "系统用户文件存在"
fi
# 多条件判断
memory=$(free -m | awk '/Mem:/ {print $2}')
if [ $memory -lt 1024 ]; then
echo "警告:内存不足1GB"
elif [ $memory -lt 2048 ]; then
echo "提示:内存小于2GB"
else
echo "内存资源充足"
fi
3.2 循环结构应用
#!/bin/bash
# 遍历目录文件
for file in /var/log/*.log; do
echo "处理日志文件: $file"
# 这里可以添加日志分析逻辑
done
# 计数器循环
counter=0
while [ $counter -lt 5 ]; do
echo "执行次数: $((counter+1))"
((counter++))
done
# 监控型循环
until ping -c1 example.com &>/dev/null; do
echo "等待网络连接..."
sleep 5
done
四、函数与模块化编程
4.1 函数开发实践
#!/bin/bash
# 带参数检查的函数
check_disk() {
local threshold=${1:-90} # 默认阈值90%
local usage=$(df -h / | awk 'NR==2 {print $5}' | tr -d '%')
if [ $usage -ge $threshold ]; then
echo "警告:磁盘使用率超过 ${threshold}%"
return 1
else
echo "磁盘空间正常"
return 0
fi
}
# 函数调用示例
if ! check_disk 95; then
# 触发告警逻辑
echo "执行磁盘清理..."
fi
五、高级特性应用
5.1 数组操作技巧
#!/bin/bash
# 关联数组(需要Bash 4.0+)
declare -A server_roles=(
["web"]="192.168.1.10"
["db"]="192.168.1.20"
["cache"]="192.168.1.30"
)
# 遍历关联数组
for role in "${!server_roles[@]}"; do
ip=${server_roles[$role]}
echo "服务器角色 $role 的IP地址是 $ip"
done
5.2 字符串处理
#!/bin/bash
path="/usr/local/bin/example.sh"
# 提取文件名
filename=${path##*/}
echo "文件名: $filename"
# 提取目录
dir=${path%/*}
echo "所在目录: $dir"
# 替换扩展名
new_path=${path/.sh/.bak}
echo "备份文件: $new_path"
六、错误处理与调试
6.1 健壮性编程实践
#!/bin/bash
# 严格模式设置
set -euo pipefail
# 自定义错误处理
trap 'echo "错误发生在行号 $LINENO"; exit 1' ERR
# 检查必需命令
required_commands=("awk" "sed" "curl")
for cmd in "${required_commands[@]}"; do
if ! command -v "$cmd" &> /dev/null; then
echo "错误: $cmd 命令未安装"
exit 1
fi
done
# 临时文件安全处理
temp_file=$(mktemp)
trap 'rm -f "$temp_file"' EXIT
七、脚本优化与最佳实践
-
代码可读性
- 使用有意义的变量名
- 添加段落注释
- 保持一致的缩进风格
-
性能优化
- 减少子shell创建
- 使用内置字符串操作代替外部命令
- 批量处理代替频繁IO操作
-
安全规范
- 总是引用变量扩展
- 验证用户输入
- 设置适当的文件权限
-
维护建议
- 添加版本注释
- 编写使用说明
- 记录修改历史
八、实战案例:系统监控脚本
#!/bin/bash
# 系统健康检查脚本
check_cpu() {
local threshold=${1:-80}
local usage=$(top -bn1 | grep "Cpu(s)" | sed "s/.*, *\([0-9.]*\)%* id.*/\1/" | awk '{print 100 - $1}')
if (( $(echo "$usage > $threshold" | bc -l) )); then
echo "CPU使用率过高: ${usage}%"
return 1
fi
return 0
}
generate_report() {
local status=$1
local message=$2
local timestamp=$(date +"%Y-%m-%d %T")
cat <<EOF
===== 系统健康报告 =====
时间: $timestamp
状态: $status
详情: $message
=======================
EOF
}
# 执行检查
if ! check_cpu 85; then
generate_report "警告" "CPU负载超过阈值" | tee /var/log/health_check.log
exit 1
fi
generate_report "正常" "所有检查项通过" | tee /var/log/health_check.log
通过本文的系统性学习,您应该已经掌握了 Bash 脚本编程的核心技能。建议从简单脚本开始,逐步尝试实现更复杂的系统管理自动化任务。记住,优秀的脚本应该是:功能完善、易于维护、安全可靠。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedJavaScript097- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
700
4.5 K
Ascend Extension for PyTorch
Python
563
691
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
JavaScript
535
95
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
957
953
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
411
338
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.6 K
939
Oohos_react_native
React Native鸿蒙化仓库
C++
340
387
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
128
209
昇腾LLM分布式训练框架
Python
148
177
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
140
221