Harper语言服务器对多语言注释的语法检查支持解析

2025-06-16 18:18:56作者：鲍丁臣Ursa

Harper作为一款专注于代码注释和文档语法检查的工具，其语言服务器harper_ls在开发者社区中逐渐受到关注。本文将从技术实现角度解析其多语言支持特性，帮助开发者更好地理解和使用这一工具。

核心功能定位

Harper的核心设计理念与传统的LSP服务器存在本质区别：

不提供代码语法检查（这是各语言专用LSP的职责）
专注于非代码文本的质量提升
主要检查范围包括：代码注释、文档字符串、Markdown文档等文本内容

实际支持的语言范围

根据项目最新文档，Harper目前可处理以下语言的注释内容：

主流编程语言：C/C++、C#、Go、Java、JavaScript/TypeScript、Python、Ruby、Rust等
脚本语言：Lua、Nix、Swift等
标记语言：HTML、Markdown
配置文件：TOML

典型使用场景示例

Python注释检查：

# Ths is is main  # 会提示"Ths"拼写错误和"is"重复
def func():
    """This are bad docstring"""  # 会提示主谓不一致

Go语言注释：

// Their is three issues here 
// 会同时检测：
// 1. Their/there混淆
// 2. is/are主谓一致
// 3. 单复数问题

Markdown文档：

# Header

This are some content.  # 会检测语法错误

技术实现特点

分层处理架构：
- 基础层：通用文本分析引擎
- 语言适配层：各语言的注释提取器
- 特别优化：对Go等语言有专门处理逻辑
智能规则引擎：
- 支持上下文感知的拼写检查
- 语法规则包括但不限于：
  - 常见混淆词（their/there）
  - 主谓一致
  - 冗余表达检测
  - 基础语法结构检查
性能考量：
- 仅分析注释区域降低计算开销
- 采用增量分析策略

使用建议

建议配合各语言专用LSP使用，Harper作为补充
对于新版本特性，推荐直接从源码构建获取最新功能
复杂文档建议拆分为Markdown文件获得完整支持

未来发展方向

根据社区反馈，项目正在完善：

更多语言的深度支持
增强对技术术语的识别
文档生成场景的特别优化
配置规则的灵活定制

通过理解这些技术细节，开发者可以更有效地将Harper集成到工作流中，提升代码文档的专业性和可读性。

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

deepin linux kernel

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook