探索 Nyoka:Python 中的 PMML 魅力
2024-06-01 09:28:03作者:幸俭卉
Nyoka 是一个强大的 Python 库,它为广泛支持最新 PMML(PMML 4.4)标准提供了全面的支持。数据科学家可以通过这个库将多种机器学习模型从流行的 Python 框架导出为 PMML 格式,无论是利用众多即插即用的内置导出器,还是简单地通过调用一系列构造函数自定义特殊或个性化的模型导出。
项目概览
Nyoka 的核心在于提供大约 500 个 Python 类,每个类都对应 PMML 的一个标签及其所有构造参数和属性。此外,还有便利的类和函数,使数据科学家能够更轻松地在 Python 环境中进行单行代码读写 PMML 文件。不仅如此,还附带了完整的源代码、扩展的 HTML 文档以及不断增长的 Jupyter 笔记本教程,帮助您熟悉如何利用 PMML 作为您的首选数据科学传输文件格式。
访问 Nyoka 官方文档 获取更多详细信息。
支持的库与模型
Nyoka 已经对以下库和模型提供了支持:
Scikit-Learn(版本 <= 1.3.0)
包括但不限于:
- 监督学习模型如线性回归、逻辑回归、决策树分类器等。
- 预处理工具如标准化、最小最大规范化等。
- 无监督学习模型如 K 均值聚类等。
LightGBM
涵盖 LGBMClassifier 和 LGBMRegressor。
XGBoost(版本 <= 1.7.6)
包括 XGBClassifier 和 XGBRegressor。
Statsmodels(版本 <= 0.14.0)
涉及时间序列分析模型如 ARIMA、VARMAX 和指数平滑等。
快速上手
Nyoka 需要 Python 3.6 及以上版本,并依赖 lxml。安装非常简便,只需一条命令:
pip install --upgrade nyoka
为了使用 Nyoka,您可以从库中导入特定的导出器:
from nyoka import skl_to_pmml, lgb_to_pmml # 更多选项...
项目特点
- 全面覆盖 PMML 4.4:Nyoka 提供了 PMML 规范中的几乎全部元素,使得数据科学家能够充分利用 PMML 标准的优势。
- 易用性: Nyoka 设计简洁,让导出和导入 PMML 文件变得前所未有的简单,无论您是使用哪个框架构建的模型。
- 广泛的模型支持:除了基本的预处理工具外,Nyoka 还兼容多个流行的数据科学库,如 Scikit-Learn、LightGBM 和 XGBoost。
- 高度可扩展: Nyoka 允许创建自定义导出器以满足特定需求,增加了其灵活性和适用性。
总的来说,Nyoka 是数据科学家的理想工具,无论是在团队协作、模型部署还是跨平台工作流程中,它都能成为连接不同环境和工具的强大桥梁。现在就加入 Nyoka 社区,探索 PMML 的无限潜力吧!
登录后查看全文
热门项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0220- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
AntSK基于.Net9 + AntBlazor + SemanticKernel 和KernelMemory 打造的AI知识库/智能体,支持本地离线AI大模型。可以不联网离线运行。支持aspire观测应用数据CSS01
热门内容推荐
项目优选
收起
deepin linux kernel
C
27
13
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
626
4.12 K
Ascend Extension for PyTorch
Python
464
554
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
930
802
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
114
181
暂无简介
Dart
872
207
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
130
189
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
1.43 K
378
昇腾LLM分布式训练框架
Python
136
160