FreeScout FasterSearch模块优化HTML内容索引问题
2025-06-24 12:37:47作者:余洋婵Anita
问题背景
在FreeScout客户支持系统中,FasterSearch模块负责提供快速搜索功能。该模块使用Meilisearch作为搜索引擎后端。用户报告了一个问题:当邮件或笔记内容包含HTML表格时,搜索功能无法正确返回结果。
问题分析
问题的根源在于HTML标签处理方式。原始代码使用PHP的strip_tags函数直接去除HTML标签,这会导致表格内容中的单元格文本被合并在一起。例如:
<table>
<tr><td>One</td><td>Two</td><td>Three</td></tr>
</table>
经过strip_tags处理后变为OneTwoThree,所有单元格内容连在一起,没有空格分隔。当用户搜索"Two"或"Three"时,Meilisearch无法匹配这些词,因为它们已经与其他内容合并成了一个长单词。
解决方案
通过以下技术手段解决了这个问题:
- 在处理HTML内容前,先在每个'<'符号前插入空格
- 然后使用
strip_tags去除HTML标签 - 这样处理后,表格内容会保留单词间的空格
具体实现代码修改如下:
$body = $thread->body ?? '';
// 在'<'前添加空格,确保标签去除后保留单词分隔
$body = str_replace('<', ' <', $body);
$body = strip_tags($body);
技术细节
这种解决方案基于以下原理:
- HTML标签总是以'<'开头
- 在'<'前添加空格,确保标签去除后内容不会粘连
- 虽然可能产生多余空格,但对搜索引擎影响不大
- 相比复杂的HTML解析,这种方法简单高效
注意事项
- 修改后需要重建搜索索引(通过Meilisearch设置中的"Rebuild index"功能)
- 重建索引可能需要较长时间,取决于数据量大小
- 此方案对大多数HTML内容有效,但在某些特殊情况下(如内联样式或特殊格式)可能不够完美
版本信息
该修复已包含在Faster Search Module v1.0.19版本中,适用于FreeScout 1.8.174及Meilisearch v1.14。
总结
这个优化显著改善了FreeScout系统对HTML内容的搜索能力,特别是包含表格的邮件和笔记。通过简单的预处理步骤,确保了HTML内容在去除标签后仍保持可搜索性,提升了用户体验。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0216
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
最新内容推荐
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
465
Ascend Extension for PyTorch
Python
758
968
昇腾LLM分布式训练框架
Python
185
231
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
698
1.4 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
878
2.03 K
暂无描述
Dockerfile
780
5.08 K
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
70
22
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
2.08 K
216