Harper项目中的英语语法检查功能增强：解决"another"错误用法

2025-06-16 14:31:03作者：昌雅子Ethen

Offline, privacy-first grammar checker. Fast, open-source, Rust-powered

项目地址：https://gitcode.com/gh_mirrors/har/harper

在软件开发和技术文档写作中，准确的英语表达至关重要。Harper项目团队最近针对非英语母语者常见的语法错误进行了功能增强，特别是关于"another"一词的错误使用模式。

问题背景

"another"是英语中一个常用但容易被误用的词汇。非英语母语者经常会出现以下三类错误用法：

与不定冠词连用（如"an another"）
与定冠词连用（如"the another"）
与复数名词搭配使用

这些错误源于对"another"和"other"两个词汇的混淆。"another"本身已经包含了"an"的含义，因此不需要再加冠词。正确的用法应该是单独使用"another"表示"又一个"或"另一个"。

技术实现方案

Harper项目通过以下方式实现了对这些语法错误的检测和修正建议：

模式匹配：建立错误用法的正则表达式模式，包括：
- /(a|an)\s+another/i
- /the\s+another/i
- /another\s+[a-z]+s\b/i（匹配复数名词）
智能建议系统：
- 对于冠词错误，提供"other"、"another"或"the other"等替代建议
- 对于复数搭配错误，建议将名词改为单数形式或使用"other"
上下文感知：根据句子结构判断最合适的修正建议，避免机械替换

实际应用案例

以下是该功能能够检测和修正的典型错误示例：

原始错误	建议修正
"the another resources"	"the other resources"或"another resource"
"a another package"	"another package"
"the another machine"	"the other machine"
"another browsers"	"another browser"或"other browsers"

技术挑战与解决方案

在实现过程中，开发团队面临的主要挑战包括：

误报处理：特别是复数形式的检测可能产生误报。解决方案是结合词性标注和上下文分析提高准确性。
建议相关性：针对不同错误类型提供最合适的修正建议。通过建立语法规则树和机器学习模型来实现智能建议。
性能优化：语法检查需要在不影响编辑器性能的前提下运行。采用增量分析和缓存机制来保证响应速度。

对开发者的价值

这项增强功能为技术文档编写者和开发者带来以下好处：

提高文档的专业性和可读性
减少非母语者的语法错误
通过即时反馈加速学习过程
统一团队文档风格

未来发展方向

Harper团队计划进一步扩展语法检查能力，包括：

增加更多常见非母语错误的检测
开发上下文相关的智能改写建议
支持自定义规则和例外处理
集成术语一致性检查

这项功能改进体现了Harper项目对开发者体验的持续关注，通过智能化的语法辅助，帮助全球开发者产出更专业的技术内容。

Offline, privacy-first grammar checker. Fast, open-source, Rust-powered

项目地址：https://gitcode.com/gh_mirrors/har/harper

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

deepin linux kernel

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook