ChEMBL Webresource Client 使用教程

2026-01-23 05:22:38作者：郜逊炳

1. 项目介绍

ChEMBL Webresource Client 是一个由 ChEMBL 团队开发的官方 Python 客户端库，旨在帮助用户从 Python 环境中访问 ChEMBL 数据和化学信息学工具。该库不需要用户了解 SQL 或 REST API 的交互细节，也不需要安装或编译任何化学信息学框架。所有结果都会被缓存，客户端会处理与 HTTPS 协议的交互，并将所有结果缓存在本地文件系统中，以便更快地检索。

该客户端的设计基于 Django QuerySet 接口，并实现了结果的惰性评估，这意味着只有在需要数据时才会执行请求。这种设计减少了网络请求的数量，提高了性能。

2. 项目快速启动

安装

首先，使用 pip 安装 chembl_webresource_client：

pip install chembl_webresource_client

基本使用

以下是一个简单的示例，展示如何使用该客户端从 ChEMBL 数据库中获取数据：

from chembl_webresource_client.new_client import new_client

# 创建一个客户端实例
client = new_client

# 获取所有化合物
compounds = client.molecule.all()

# 打印前5个化合物的名称
for compound in compounds[:5]:
    print(compound['pref_name'])

配置

在使用客户端之前，可以通过导入 Settings 来配置一些选项：

from chembl_webresource_client.settings import Settings

# 设置超时时间为10秒
Settings.Instance().TIMEOUT = 10

# 禁用本地缓存
Settings.Instance().CACHING = False

3. 应用案例和最佳实践

应用案例

ChEMBL Webresource Client 可以广泛应用于药物发现、化学信息学研究和数据分析等领域。例如，研究人员可以使用该客户端快速获取大量化合物的结构和生物活性数据，用于机器学习模型的训练和验证。

最佳实践

缓存使用：建议启用本地缓存以提高数据检索速度，特别是在需要多次访问相同数据的情况下。
并发请求：通过调整 CONCURRENT_SIZE 参数，可以控制并发请求的数量，以适应不同的网络环境和性能需求。
错误处理：在实际应用中，建议添加适当的错误处理机制，以应对网络请求失败或数据检索异常的情况。

4. 典型生态项目

ChEMBL Webresource Client 是 ChEMBL 生态系统中的一个重要组成部分。以下是一些与之相关的典型项目：

ChEMBL Database：ChEMBL 数据库是一个广泛使用的化学信息学数据库，包含了大量化合物的生物活性数据。
RDKit：RDKit 是一个开源的化学信息学工具包，可以与 ChEMBL Webresource Client 结合使用，进行更复杂的化学结构分析和处理。
DeepChem：DeepChem 是一个用于化学信息学和药物发现的深度学习库，可以利用 ChEMBL Webresource Client 获取的数据进行模型训练和预测。

通过这些生态项目的结合，用户可以构建更强大的化学信息学和药物发现工具链。

chembl_webresource_client

Official Python client for accessing ChEMBL API

项目地址：https://gitcode.com/gh_mirrors/ch/chembl_webresource_client

登录后查看全文