Compromise-dates插件中上下文参数对象突变问题解析

2025-05-19 21:14:08作者：江焘钦

Compromise是一个强大的自然语言处理库，而compromise-dates是其处理日期相关文本的插件。近期发现该插件在处理日期时存在一个潜在问题：调用.dates()相关方法时会意外修改传入的上下文参数对象。

问题现象

当开发者使用compromise-dates插件处理包含日期的文本时，通常会传入一个上下文参数对象，其中包含today等日期相关配置。例如：

const context = {
  timezone: 'Canada/Eastern',
  today: '2020-02-20',
  punt: { weeks: 2 },
  dayStart: '8:00am',
  dayEnd: '5:30pm'
}

在调用.dates(context)后，如果执行.json()、.get()或.format()等方法，会发现传入的context对象中的today属性被意外修改为一个SpaceTime对象，而非保持原始字符串值。

技术分析

这个问题本质上是一个副作用问题，即函数调用产生了预期之外的对象修改。在函数式编程范式中，纯函数不应该修改其输入参数，而应该返回新的对象或值。compromise-dates插件在内部处理日期时，将字符串形式的日期转换为SpaceTime对象以便于操作，但错误地直接修改了原始上下文对象而非创建副本。

影响范围

该问题影响compromise-dates 3.5.0及以下版本，主要影响以下方法：

.json()
.get()
.format()
其他.dates()返回对象的方法

解决方案

该问题已在compromise-dates 3.6.0版本中修复。升级到最新版本即可避免此问题。对于暂时无法升级的项目，开发者可以采用以下临时解决方案：

在调用日期方法前深拷贝上下文对象
在每次调用时重新创建上下文对象
接受today属性会被修改的事实，并在需要时重新设置

最佳实践

为避免类似问题，建议开发者在处理可能修改输入参数的库时：

仔细阅读文档了解API行为
对重要输入参数进行防御性拷贝
在测试中验证关键对象是否被意外修改
及时更新依赖版本以获取修复

日期处理在自然语言处理中是一个复杂但常见的需求，理解这些潜在问题有助于开发者构建更健壮的应用程序。compromise和compromise-dates作为优秀的NLP工具链，其维护团队对这类问题的快速响应也体现了开源社区的优势。

compromise

modest natural-language processing

项目地址：https://gitcode.com/gh_mirrors/co/compromise

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

438

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

454

5.07 K