Misskey项目中的全文搜索技术演进：从Meilisearch到PGroonga

2025-05-22 14:06:10作者：邵娇湘

背景与需求

Misskey作为一款开源社交网络平台，其搜索功能一直是用户体验的重要组成部分。随着用户数据量的增长，传统的SQL LIKE查询在性能和准确性上逐渐显现出不足。项目团队近期提出了将PGroonga作为新的搜索后端选项，旨在为不使用Meilisearch的服务器提供更强大的搜索能力。

技术方案对比

Misskey目前支持三种全文搜索方案：

SQL LIKE（默认）：使用PostgreSQL的标准LIKE操作符进行搜索，无需额外配置，但性能有限，尤其在大数据量场景下表现不佳。
Meilisearch：独立的搜索引擎，提供快速、准确的搜索结果，但需要额外部署和维护。
PGroonga：PostgreSQL的扩展，为多语言全文搜索提供支持，特别是对亚洲语言（如日语、中文）有良好支持。

PGroonga的技术优势

PGroonga作为PostgreSQL的扩展，具有以下特点：

全语言支持：不仅支持日语、中文等亚洲语言，也支持其他语言的全文搜索。
高性能：通过创建专用索引大幅提升搜索速度，相比LIKE查询有显著性能优势。
集成度高：作为PostgreSQL扩展，无需维护独立服务，降低系统复杂度。

实现细节

在2025.1.0版本后，Misskey通过配置文件(default.yml)新增了全文搜索提供商的配置项：

fulltextSearch:
  provider: sqlLike # 可选值: sqlLike, sqlPgroonga, meilisearch

开发者可以根据实际需求选择不同的搜索后端。值得注意的是，使用PGroonga需要手动执行以下SQL创建索引：

CREATE INDEX idx_note_text_with_pgroonga ON note USING pgroonga (text);

技术挑战与解决方案

多语言支持：PGroonga默认使用TokenBigram分词器，对于日语等语言可能需要定制分词器（如MeCab）以获得更好的搜索结果。
迁移复杂性：由于PGroonga是可选扩展，项目团队决定不自动创建索引，而是提供文档指导管理员手动操作。
架构设计：采用抽象化接口设计，便于未来集成其他搜索引擎（如Elasticsearch、OpenSearch等）。

实际应用建议

对于不同规模的Misskey实例，建议：

小型实例：使用默认的SQL LIKE方案，简单易用。
中型实例：考虑PGroonga，平衡性能与维护成本。
大型实例：Meilisearch或未来可能支持的其他专业搜索引擎可能更合适。

未来展望

Misskey的搜索功能仍在持续演进中，未来可能会：

支持更多搜索引擎后端
提供更细粒度的搜索配置选项
优化亚洲语言特别是日语的分词和搜索体验
探索混合搜索策略，结合不同引擎的优势

通过这次技术升级，Misskey为用户提供了更灵活的搜索解决方案选择，特别是为不使用Meilisearch的服务器提供了性能更优的替代方案，体现了项目团队对技术多样性和用户体验的持续关注。

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

deepin linux kernel

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook