DeepChem项目与Numpy版本兼容性问题解析

2025-06-05 10:29:18作者：胡易黎Nicole

背景介绍

DeepChem作为一款开源的化学信息学和机器学习工具包，在药物发现和材料科学领域有着广泛应用。近期，Google Colab平台将其默认的Numpy版本升级至1.25.2后，部分用户在使用DeepChem进行分子特征提取时遇到了兼容性问题。

问题现象

当用户尝试使用DeepChem的MACCSKeysFingerprint特征提取器处理分子数据时，系统会抛出数组创建错误。具体表现为：

在Numpy 1.23版本下，代码能够运行但会显示"Creating an ndarray from ragged nested sequences"的弃用警告
升级到Numpy 1.25.2后，同样的警告变成了错误，导致程序崩溃

技术分析

这个问题本质上源于Numpy对不规则嵌套序列处理的严格化。在早期版本中，Numpy对这类操作只是发出警告，但从1.25版本开始，这种行为被明确禁止。

DeepChem的MACCSKeysFingerprint特征提取器在处理分子数据时，可能会生成不规则的数据结构。在Numpy 1.25+版本中，直接尝试将这些数据结构转换为ndarray会失败。

解决方案

DeepChem开发团队已经在新版本中解决了这个问题。目前推荐的解决方案是：

使用DeepChem 2.8.0预发布版本
该预发布版本已全面兼容Numpy 1.25+系列

最佳实践建议

对于使用DeepChem的开发人员，建议：

保持环境依赖项的最新状态
在项目开始时明确指定所有依赖包的版本
关注官方发布的更新信息
对于生产环境，建议等待正式版本发布后再进行升级

结论

软件生态系统的版本迭代是持续的过程。DeepChem团队积极响应依赖库的变化，通过预发布版本及时解决了Numpy升级带来的兼容性问题。这体现了开源社区快速响应和持续改进的优势，也为科学计算领域的开发者提供了更稳定的工具支持。

deepchem

Democratizing Deep-Learning for Drug Discovery, Quantum Chemistry, Materials Science and Biology

项目地址：https://gitcode.com/GitHub_Trending/de/deepchem

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

395

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989