ripgrep：现代化文本搜索工具完全指南

2026-03-08 04:35:22作者：余洋婵Anita

基础认知：认识 ripgrep

在软件开发过程中，我们经常需要在大量代码或文本文件中查找特定内容。ripgrep（简称 rg）是一款专为开发者设计的命令行文本搜索工具，它结合了速度、灵活性和智能过滤功能，能够帮助你在复杂项目中快速定位所需信息。与传统的 grep 工具相比，ripgrep 具有更快的搜索速度和更直观的默认行为，同时保持了对正则表达式的全面支持。

核心概念解析

递归搜索：默认情况下，ripgrep 会自动遍历当前目录及其所有子目录，无需额外参数
智能过滤：自动忽略版本控制忽略文件（如 .gitignore）和二进制文件
正则表达式引擎：内置支持完整的正则表达式语法，满足复杂模式匹配需求
多线程处理：利用现代 CPU 的多核心优势，实现并行搜索，大幅提升速度

快速上手：3步掌握基本搜索

步骤1：安装 ripgrep

ripgrep 适用于各种操作系统，你可以通过以下方式安装：

# Ubuntu/Debian
sudo apt-get install ripgrep

# macOS (Homebrew)
brew install ripgrep

# 从源码编译安装
git clone https://gitcode.com/GitHub_Trending/ri/ripgrep
cd ripgrep
cargo build --release

步骤2：基本文本搜索

最简单的用法是搜索指定模式：

# 在当前目录及子目录中搜索"hello world"
rg "hello world"

输出结果将显示：

文件名（带路径）
行号
包含匹配内容的行（匹配部分会高亮显示）

步骤3：指定文件或目录搜索

# 搜索特定文件
rg "function main" src/main.rs

# 搜索特定目录
rg "struct Config" src/config/

场景化应用：典型开发案例

案例1：在 Rust 项目中查找函数定义

假设你需要在 Rust 项目中找到所有名为 parse_args 的函数定义：

# 搜索 Rust 文件中 fn parse_args 模式
rg 'fn parse_args' -trust

这个命令会：

-trust 是 --type rust 的缩写，只搜索 Rust 源代码文件
fn parse_args 是 Rust 函数定义的典型模式
自动忽略 target/ 目录和 .gitignore 中指定的文件

案例2：排查日志文件中的错误

当应用程序抛出错误时，快速定位日志中的错误信息：

# 搜索所有日志文件中的 ERROR 信息，并显示前后3行上下文
rg 'ERROR' -g '*.log' -C 3

这里：

-g '*.log' 只搜索扩展名为 .log 的文件
-C 3 显示匹配行前后各3行内容，帮助理解错误上下文

案例3：跨项目搜索配置参数

在多个微服务项目中查找特定配置参数：

# 在当前目录及子目录中搜索数据库连接字符串
rg 'database_url' -g '*.{toml,yaml,json}' --hidden

该命令：

-g '*.{toml,yaml,json}' 只搜索特定配置文件类型
--hidden 包含隐藏文件（如 .env 文件）

进阶技巧：精准搜索策略

文件过滤技术

ripgrep 提供了多种方式来缩小搜索范围，提高搜索效率：

按文件类型过滤

# 新手简化版：搜索 Markdown 文件中的标题
rg '# ' -tmd

# 专业完整版：查看所有支持的文件类型
rg --type-list

常用文件类型简写：

-tpy：Python 文件
-tjs：JavaScript 文件
-thtml：HTML 文件
-tcss：CSS 文件
-tjson：JSON 文件

按文件名模式过滤

# 搜索所有测试文件中的 "test_" 前缀函数
rg 'test_' -g '*_test.rs'

# 排除特定目录
rg 'secret' -g '!node_modules/' -g '!target/'

自定义文件类型

为特定项目创建自定义文件类型：

# 定义 web 类型包含 html, css, js 文件
rg --type-add 'web:*.{html,css,js}' -tweb 'class='

高级搜索模式

正则表达式高级用法

# 搜索邮箱地址
rg '\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'

# 搜索 Rust 中的枚举定义
rg 'enum\s+\w+\s*{' -trust

反向匹配

查找不包含特定模式的行：

# 查找不包含 "TODO" 的代码行
rg -v 'TODO' src/

全词匹配

确保只匹配完整单词：

# 只匹配完整的 "error" 单词，不会匹配 "error_log"
rg -w 'error'

效率提升：5个效率倍增技巧

1. 利用配置文件保存常用设置

创建 ~/.ripgreprc 文件保存个性化配置：

# 设置默认颜色主题
--colors=path:fg:green
--colors=line:fg:yellow
--colors=match:fg:red,bg:yellow

# 默认包含隐藏文件
--hidden

# 自定义文件类型
--type-add=web:*.{html,css,js,ts}
--type-add=config:*.{json,yaml,yml,toml}

2. 结合管道和其他工具使用

# 搜索并打开匹配的文件（使用 fzf 模糊查找）
rg --files-with-matches 'fn main' | fzf | xargs code

# 统计每个文件的匹配次数并排序
rg --count 'error' | sort -nr

3. 使用预览和上下文显示

# 显示匹配行前后5行内容
rg 'panic!' -A 5 -B 5

# 显示匹配行周围10行内容
rg 'unimplemented!' -C 10

4. 文本替换技巧

虽然 ripgrep 主要用于搜索，但可以配合 sed 实现替换：

# 搜索并替换文件中的文本（先预览确认）
rg 'old_text' --files-with-matches | xargs sed -i.bak 's/old_text/new_text/g'

5. 性能优化策略

根据最新性能测试，采用以下策略可使搜索速度提升 30-50%：

使用更具体的模式：避免以通配符开头的模式（如 .*error）
限制搜索范围：明确指定文件类型或目录
创建 .rgignore 文件：在大型项目中排除 build、vendor 等目录
固定字符串搜索：对简单文本搜索使用 -F 标志

# 优化的固定字符串搜索
rg -F "user_id" -tpy src/

通过这些技巧，你可以充分发挥 ripgrep 的强大功能，将其整合到日常开发工作流中，显著提高代码搜索和分析效率。无论是小型脚本还是大型项目，ripgrep 都能成为你不可或缺的开发工具。

ripgrep

ripgrep recursively searches directories for a regex pattern while respecting your gitignore

项目地址：https://gitcode.com/GitHub_Trending/ri/ripgrep

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

458

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

255