【亲测免费】 ClearML 官方教程

2026-01-17 09:32:59作者：翟江哲Frasier

1. 项目介绍

ClearML（原名Allegro Trains）是一款强大的开源MLOps工具，旨在简化人工智能工作流，提供实验管理、数据管理、管道编排、调度及模型服务等功能。它支持多种机器学习和深度学习框架，如PyTorch、TensorFlow等，同时也兼容Jupyter Notebook和PyCharm等开发环境。

主要特点：

实验管理：自动跟踪实验，记录环境和结果。
MLOps/LLMOps：自动化操作和管道解决方案，适用于云端、本地服务器或 Kubernetes 集群。
数据管理：基于对象存储的数据版本控制和管理。
模型服务：云原生、可扩展的模型部署，五分钟内创建新的模型端点。

2. 项目快速启动

首先，确保已安装Python。接下来，通过pip安装ClearML：

pip install clearml

现在，我们可以运行一个简单的任务来体验ClearML的功能：

from clearml import Task, Dataset

# 创建一个新的任务
task = Task.init(project_name="my_project", task_name="quick_start")

# 使用内置示例数据集
dataset = Dataset.get("OpenImagesV6").download()

# 运行一个简单的命令
task.run_command(f"echo 'Hello, {task.name}! Processing dataset: {dataset.name}'")

执行上述脚本后，你将在ClearML界面中看到新创建的任务及其输出。

3. 应用案例和最佳实践

案例1：实验对比与复现

from clearml import Experiment, TensorBoard

# 启动新实验
exp = Experiment(name='cnn-training', project_name='image-classification')

with exp.start.logged():
    # 实验代码
    ...
    # 记录模型训练过程的TensorBoard日志
    tb_callback = TensorBoard(log_dir=exp.get_local_logdir(), histogram_freq=1)
    model.fit(X_train, y_train, callbacks=[tb_callback])

最佳实践：远程调试

在Jupyter Notebook中配置ClearML以进行远程调试：

from clearml import Task

# 获取或创建任务
task = Task.attach_or_create('remote-debugging-notebook')

# 设置任务属性，如输入参数
task.set_parameters({'input_data': 'path/to/data'})

# 在Notebook中启动任务
task.execute_as_notebook()