Highlight.js 对 Fortran 语言字面量解析问题的技术解析

2025-05-08 18:14:22作者：幸俭卉

Highlight.js是一款强大的JavaScript语法高亮库，适用于网页与服务器端代码展示。它能无缝融入各种网页环境，无需依赖其他框架，且自带自动识别语言功能。无论是传统的`<pre><code>`标签还是自定义元素，通过简单的配置即可实现优雅的代码着色，支持超过180种编程和标记语言。开发者可享受其灵活的定制性，从手动控制高亮时机到集成Vue.js等框架，乃至在Web Worker中运行以防页面卡顿，让技术文档与代码分享既美观又高效。轻松获取通过CDN或NPM，适应各类开发流程，是提升代码展现力的不二之选。

项目地址：https://gitcode.com/gh_mirrors/hig/highlight.js

问题背景

在代码高亮工具 Highlight.js 中，Fortran 语言的布尔/逻辑字面量存在解析异常。Fortran 的特殊语法要求布尔值必须使用点号包裹（如.true.和.false.），但当前版本(11.9.0)无法正确识别这种特殊格式。

技术细节分析

Fortran 语言特性

布尔字面量格式：必须使用点号包裹，如.true.和.false.
运算符格式：同样采用点号包裹，如.and.、.or.、.not.等
关系运算符：传统使用.lt.(小于)、.gt.(大于)等点号包裹形式
标识符规则：可以包含下划线，但必须以字母开头

问题根源

Highlight.js 的默认关键词匹配模式使用\w+正则表达式，该模式无法匹配包含点号的字符序列。核心问题在于：

默认词法分析器未考虑Fortran特有的点号包裹语法
大小写不敏感设置虽然正确，但格式匹配失效

解决方案实现

正则表达式优化

通过修改关键词匹配模式，增加对点号包裹格式的支持：

$pattern: /\b[a-z][a-z0-9_]+\b|\.[a-z][a-z0-9_]+\./

该模式包含两部分：

标准标识符匹配：\b[a-z][a-z0-9_]+\b
点号包裹格式匹配：\.[a-z][a-z0-9_]+\.

实现效果

修改后可以正确识别：

所有标准Fortran标识符
点号包裹的关键字和字面量
包含下划线的变量名

技术延伸

类似语言处理经验

这种特殊分隔符处理模式也可应用于：

某些SQL方言中的引号包裹标识符
R语言中的反引号包裹特殊变量名
正则表达式字面量处理

词法分析最佳实践

对于非标准标识符格式，必须显式定义匹配模式
需要考虑语言的大小写敏感性设置
边界情况测试应包括各种符号组合

总结

通过对Highlight.js Fortran语言模块的正则表达式优化，解决了特殊格式字面量的解析问题。这个案例展示了词法分析器中模式匹配的重要性，特别是对于具有非标准标识符格式的语言。开发者在处理类似语言特性时，应当特别注意分隔符和特殊格式的处理。

highlight.js

项目地址：https://gitcode.com/gh_mirrors/hig/highlight.js

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781