Gensim项目中的scipy.linalg.triu函数弃用问题解析
在自然语言处理领域广泛使用的Gensim库近期出现了一个与科学计算库SciPy相关的兼容性问题。这个问题源于Gensim内部依赖了已被弃用的scipy.linalg.triu函数,导致用户在导入Gensim或相关依赖库时遇到错误。
问题背景
scipy.linalg.triu是SciPy中用于获取矩阵上三角部分的函数。随着SciPy版本的更新,该函数已被标记为弃用状态,这意味着虽然它目前还能工作,但未来版本可能会完全移除。Gensim库的某些功能间接依赖了这个即将被淘汰的函数接口。
影响范围
这个问题影响了所有使用最新版SciPy并尝试导入Gensim或其衍生工具(如zeugma.EmbeddingTransformer)的用户。错误表现为导入时直接抛出关于triu函数弃用的警告或错误信息。
临时解决方案
对于急需使用Gensim的用户,目前有以下几种临时解决方案:
-
降级SciPy版本:安装较旧版本的SciPy(1.10.0之前的版本),这些版本尚未弃用
triu函数。 -
使用开发版Gensim:该问题在Gensim的主分支(master)中已经修复,但尚未发布正式版本。技术熟练的用户可以尝试从源代码安装最新开发版。
-
等待官方更新:Gensim维护团队已计划近期发布包含此修复的正式版本(4.3.3)。
技术团队响应
Gensim核心开发团队已确认此问题,并讨论了发布计划。考虑到即将发布的NumPy 2.0可能带来的兼容性变化,团队正在评估最佳发布策略,以确保新版本既能解决当前问题,又能适应即将到来的NumPy重大更新。
对用户的建议
普通用户建议暂时采用降级SciPy的方案,这是最稳定可靠的临时解决方法。对于在开发环境中使用Gensim的开发者,建议关注官方发布动态,及时升级到包含修复的正式版本。
这个问题也提醒我们,在Python生态系统中,科学计算库的更新往往会引发一系列依赖问题。良好的版本管理和及时关注依赖库的更新公告,是避免类似问题的有效方法。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00