Harper语言服务器中Span转换导致的崩溃问题分析

2025-06-16 10:34:23作者：余洋婵Anita

在Harper语言服务器(harper-ls)的开发过程中，我们发现了一个与文本范围(Span)转换相关的严重问题，该问题会导致语言服务器在特定情况下崩溃。本文将深入分析该问题的成因、影响范围以及解决方案。

问题现象

当用户在编辑器中打开一个仅包含单行注释且没有换行符的JavaScript文件时，如果尝试对注释中的错误部分进行悬停操作，Harper语言服务器会意外崩溃。崩溃日志显示，问题发生在harper-core/src/span.rs文件的第14行，具体是一个断言失败：assertion failed: start <= end。

技术背景

Harper语言服务器实现了Language Server Protocol(LSP)，需要在LSP的Range类型和Harper内部的Span类型之间进行转换。LSP中的Range使用行号和字符位置表示文本范围，而Harper的Span则使用字节偏移量表示。

问题根源

经过深入分析，我们发现问题的根本原因在于：

特殊情况处理不足：当文件内容仅包含单行且没有换行符时，LSP客户端发送的位置信息与Harper内部的位置转换逻辑产生了不一致。
位置转换算法缺陷：在将LSP的Range转换为Harper的Span时，算法没有充分考虑单行无换行文件的特殊情况，导致计算出的起始位置大于结束位置，触发了断言失败。
客户端行为差异：不同的编辑器对无换行文件的处理方式不同。例如，Neovim会自动添加换行符，而VS Code则保持原样，这解释了为什么问题在某些编辑器中更容易出现。

解决方案

修复方案主要包含以下改进：

增强特殊情况检查：在位置转换函数中添加对单行无换行文件的特殊处理逻辑。
完善断言条件：不仅检查start <= end，还增加对位置有效性的全面验证。
统一位置处理：确保无论文件是否以换行符结尾，位置转换都能正确工作。

经验总结

这个案例给我们以下启示：

全面考虑特殊情况：语言服务器需要处理各种边缘情况，包括空文件、单行文件、无换行文件等。
客户端兼容性测试：应该在多种编辑器环境下进行全面测试，因为不同客户端的行为可能存在差异。
防御性编程：对于外部输入的位置信息，应该进行充分验证后再进行转换。

该问题的修复显著提高了Harper语言服务器的稳定性，特别是在处理特殊格式文件时的表现。这也提醒我们在开发语言服务器时，需要特别注意位置信息的转换和处理。

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。