AdguardFilters项目中的重复规则清理实践
在广告过滤规则维护过程中,重复规则是一个常见但容易被忽视的问题。本文将以AdguardFilters项目中的AnnoyancesFilter(具体文件为mobile-app_specific.txt)为例,探讨如何识别和处理重复过滤规则,以及这类优化对过滤效率的实际影响。
重复规则的识别与分析
在mobile-app_specific.txt文件中,我们发现存在多种类型的重复规则:
-
完全相同的规则:例如针对togetter.com和posfie.com两个域名使用完全相同的选择器
###appdl_header,这种情况可以直接合并。 -
功能重叠的规则:如针对yahoo.co.jp域名的多个规则,其中
baseball.yahoo.co.jp,soccer.yahoo.co.jp,sports.yahoo.co.jp##.sn-modAppText已经覆盖了baseball.yahoo.co.jp##.sn-modAppText的功能,后者可以安全移除。 -
相似但不同的选择器:如针对nicovideo.jp的两个规则分别使用
###jsSmartAppBanner和##.launch_app_container,需要确认是否确实针对不同元素。
重复规则的优化策略
合并策略
对于完全相同的规则作用于不同域名的情况,可以采用逗号分隔域名的方式合并。例如:
togetter.com,posfie.com###appdl_header
这种合并方式既保持了原有功能,又减少了规则数量。
移除策略
对于被更广泛规则覆盖的特定规则,可以直接移除。例如:
移除baseball.yahoo.co.jp##.sn-modAppText,因为它已经被baseball.yahoo.co.jp,soccer.yahoo.co.jp,sports.yahoo.co.jp##.sn-modAppText包含。
功能验证
对于看似相似但选择器不同的规则,需要:
- 检查目标网页结构,确认是否确实需要多个规则
- 测试移除单个规则后过滤效果是否受影响
- 考虑使用更精确的选择器合并功能
优化带来的收益
-
性能提升:减少规则数量可以降低过滤引擎的解析负担,特别是在移动设备上效果更明显。
-
维护便利:合并后的规则更易于管理和更新,减少未来出现冲突的可能性。
-
规则清晰度:精简后的规则集更易于其他维护者理解和修改。
最佳实践建议
-
定期审查:建议每个季度对规则文件进行全面审查,识别可能的重复。
-
测试验证:任何规则修改后都应在实际环境中测试,确保不影响过滤效果。
-
文档记录:对于合并或移除的规则,建议在提交信息中详细说明原因。
通过这种系统性的规则优化,可以保持过滤规则集的高效和可维护性,为用户提供更流畅的浏览体验。AdguardFilters项目的这次清理工作展示了开源社区如何通过协作不断提升软件质量。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00