Lexy 2025.05.0 版本发布：解析库的重大更新与功能增强

2025-07-05 11:20:58作者：柏廷章Berta

Lexy 是一个现代化的 C++ 解析库，专注于提供高效、灵活且类型安全的解析解决方案。它采用了编译时解析器组合的方式，允许开发者通过组合各种解析规则来构建复杂的解析器，同时保持代码的高性能和可维护性。Lexy 特别适合用于构建编程语言解析器、配置文件解析器以及其他需要复杂文本处理的场景。

潜在的重大变更

本次 2025.05.0 版本引入了一些可能影响现有代码的变更：

API 重命名：scanner-common::capture_token 被重命名为 scanner-common::capture，同时移除了旧的 scanner-common::capture 实现。这一变更使得 API 命名更加一致，虽然旧代码可能会遇到编译错误，但这是向更清晰 API 设计迈出的一步。
解析树行为变更：lexy::parse_as_tree 现在会为原本为空的产生式节点添加位置标记。这一改进确保了没有产生式节点会是完全空的（除非直接使用构建器 API），使得解析树的结构更加一致和可靠。
错误恢复行为调整：lexy::dsl::try_() 的错误恢复行为现在会在可选的错误恢复规则后跳过空白字符，这更符合大多数场景下的预期行为。
API 弃用：弃用了不接收 remaining_input 参数的 lexy::parse_tree::builder::finish() 重载版本，开发者应该迁移到新版本。
拼写修正：修正了 lexy::code_point::spaing_mark 的拼写错误，现在正确的形式是 spacing_mark。

新功能亮点

实验性多遍解析支持

本次版本引入了实验性的多遍解析支持，通过新增的 lexy::parse_tree_input 和 lexy::dsl::tnode/lexy::dsl::pnode 功能，开发者可以实现更复杂的解析场景，其中需要对输入进行多次处理。

增强的字节匹配功能

新增了 lexy::dsl::byte 的一系列方法（if_/set/range/ascii），使得对特定字节的匹配更加灵活和强大。这些方法为处理二进制数据或特定编码格式提供了更多可能性。

错误处理改进

新增了扫描器上 fatal_error() 的重载版本，支持构造类型擦除的通用错误，这大大增强了错误处理的灵活性。同时修复了 lexy_ext::report_error 无条件写入 stderr 的问题，现在它会正确考虑输出迭代器。

缓冲区管理增强

新增了 lexy::buffer::release() 和 lexy::buffer::adopt() 方法，允许开发者解构缓冲区到其组件并在之后重新组装，这为缓冲区的生命周期管理提供了更多控制。

解析树功能增强

新增了 lexy::parse_tree::node::position() 和 ::covering_lexeme() 方法，使得从解析树节点获取位置信息和覆盖的词素更加方便。

其他实用改进

为 lexy::dsl::flag() 添加了默认参数，简化了常见用例
新增了 lexy::callback_with_state，支持带状态的回调
改进了 lexy::dsl::op 和 lexy::dsl::error 的标签构造函数，现在会传递解析状态（如果需要）
为子目录构建启用了 CMake 安装规则

重要错误修复

本次版本修复了多个关键问题：

无限循环问题：修复了 dsl::delimited 在处理无效代码点时可能出现的无限循环问题。
错误处理问题：修复了大小写折叠规则中错误被吞掉的问题，以及 dsl::scan 相关的多个错误。
解析树问题：修复了 lexy::parse_as_tree 中缺失 lexy::error_context::position 的问题，以及 lexy::parse_tree 中的静态断言问题。
位置比较问题：修复了 lexy::input_location::operator< 中的错误，确保位置比较的正确性。
编译问题：为容器回调和 lexy::as_string 添加了缺失的 constexpr，修复了多个编译器兼容性问题。

技术影响与升级建议

本次更新在保持 Lexy 核心设计理念的同时，显著增强了其功能和稳定性。多遍解析支持的引入为复杂语言解析开辟了新可能性，而错误处理和解析树的改进则提升了库的健壮性。

对于现有项目，建议开发者：

检查是否使用了被重命名或修改的 API，如 capture_token 或 try_() 的错误恢复行为。
考虑利用新的字节匹配功能简化现有解析逻辑。
评估是否可以从解析树的新功能中受益，如 position() 和 covering_lexeme() 方法。
对于需要复杂错误处理的场景，可以尝试新的 fatal_error() 重载。

Lexy 2025.05.0 版本标志着该项目在成熟度和功能丰富性上的重要进步，为 C++ 解析领域提供了更加强大和可靠的解决方案。

lexy

C++ parsing DSL

项目地址：https://gitcode.com/gh_mirrors/le/lexy

登录后查看全文

Lexy 2025.05.0 版本发布：解析库的重大更新与功能增强

潜在的重大变更

新功能亮点

实验性多遍解析支持

增强的字节匹配功能

错误处理改进

缓冲区管理增强

解析树功能增强

其他实用改进

重要错误修复

技术影响与升级建议

热门内容推荐

最新内容推荐

项目优选

Lexy 2025.05.0 版本发布：解析库的重大更新与功能增强

潜在的重大变更

新功能亮点

实验性多遍解析支持

增强的字节匹配功能

错误处理改进

缓冲区管理增强

解析树功能增强

其他实用改进

重要错误修复

技术影响与升级建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选