【亲测免费】 sklearn-onnx使用指南

2026-01-20 01:30:00作者：韦蓉瑛

项目介绍

sklearn-onnx 是一个开源工具，它使得将基于scikit-learn构建的模型及管道转换成ONNX（Open Neural Network Exchange）格式成为可能。ONNX是一种开放格式，用于表示机器学习模型，以促进不同框架之间的互操作性。此项目特别适合那些希望在生产环境中利用ONNX运行环境（如ONNX Runtime），追求高效部署和统一标准的开发者和数据科学家。支持的最新ONNX操作集（opset）是21，意味着它可以转化出兼容该版本ONNX规范的模型。

项目快速启动

要开始使用sklearn-onnx，首先确保你的开发环境已安装Python，并通过pip安装库：

pip install sklearn-onnx

接下来，我们通过一个简单的例子来展示如何将一个scikit-learn模型转换为ONNX格式并进行预测。

示例代码

导入所需的库并准备数据：

import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
iris = load_iris()
X, y = iris.data, iris.target
X_train, X_test, _, _ = train_test_split(X, y)

# 训练模型
clf = RandomForestClassifier(random_state=0)
clf.fit(X_train, y)

将模型转换为ONNX格式：

from skl2onnx import to_onnx
# 转换模型到ONNX格式
onnx_model = to_onnx(clf, initial_types=[('input', np.array([1, X.shape[1]], dtype=np.float32))])
with open("model.onnx", "wb") as f:
    f.write(onnx_model.SerializeToString())

使用ONNX Runtime进行预测：

import onnxruntime as ort
sess = ort.InferenceSession("model.onnx")
input_name = sess.get_inputs()[0].name
label_name = sess.get_outputs()[0].name
prediction = sess.run([label_name], {input_name: X_test.astype(np.float32)})[0]

应用案例和最佳实践

应用案例通常涉及在高性能的在线服务中部署经过训练的scikit-learn模型，以减少推理时间并保持一致性。最佳实践包括选择合适的操作集(opset)，对模型进行优化以减小模型大小，以及确保转换后的ONNX模型能够精确反映原生模型的行为。

典型生态项目

在机器学习的生态系统中，sklearn-onnx与其他几个关键组件共同作用。例如：

ONNX Runtime：作为ONNX模型的执行引擎，提供高效的推理能力。
onnxmltools：可以用来转换其他模型格式，如libsvm、LightGBM、XGBoost等至ONNX。
PyTorch ONNX、TensorFlow-ONNX：分别用于将PyTorch和TensorFlow模型转换为ONNX格式，拓宽了模型来源的范围。
ONNX-MXNet：提供了MXNet模型到ONNX的转换接口，进一步丰富了模型的迁移选项。

这些工具和sklearn-onnx一起，形成了一个强大的生态系统，促进了模型在不同平台和框架间的流动性和可复用性，简化了模型从研发到部署的流程。

sklearn-onnx

Convert scikit-learn models and pipelines to ONNX

项目地址：https://gitcode.com/gh_mirrors/sk/sklearn-onnx

登录后查看全文