Diffusers项目中ONNX推理会话的Provider配置优化

2025-05-06 02:18:56作者：殷蕙予

Diffusers：在PyTorch中用于图像和音频生成的最先进扩散模型。

项目地址：https://gitcode.com/GitHub_Trending/di/diffusers

在深度学习模型部署过程中，ONNX Runtime作为跨平台推理引擎被广泛应用。近期在huggingface/diffusers项目中，开发者提出了关于优化ONNX推理会话配置的需求，特别是在使用特定硬件加速模块时的provider选项配置问题。

背景与现状

当前diffusers项目中的ONNX推理会话创建接口支持基本的provider参数配置，但缺乏对provider_options的支持。这在某些特定硬件加速场景下会带来限制，例如在使用QNN执行提供程序(QNN-ExecutionProvider)时，开发者需要配置额外的选项来优化模型在Windows ARM64平台上的运行性能。

技术细节分析

ONNX Runtime的执行提供程序(Execution Provider)机制允许针对不同硬件后端进行优化。每个提供程序都有其特定的配置选项，通过provider_options参数传递。这些选项通常包括：

性能调优参数
硬件特定标志
内存分配策略
并行计算配置

在当前的实现中，diffusers项目虽然支持指定provider参数，但无法传递这些细粒度的配置选项，导致无法充分发挥硬件加速潜力。

解决方案设计

针对这一问题，技术方案需要在以下两个层面进行修改：

ONNX工具模块(onnx_utils.py)中扩展InferenceSession的创建接口，增加provider_options参数支持
管道(pipeline)创建流程中，将provider_options参数从顶层API一直传递到实际的会话创建处

这种修改保持了向后兼容性，同时为高级用户提供了更细粒度的控制能力。

实现意义

这一优化将为diffusers项目带来以下优势：

支持更多硬件加速场景，特别是移动端和边缘设备
允许用户根据具体硬件特性进行性能调优
提升模型在异构计算环境中的部署灵活性
为未来支持更多执行提供程序奠定基础

结语

ONNX Runtime的provider选项配置优化是模型部署过程中的重要环节。diffusers项目的这一改进体现了对多样化部署场景的考虑，将使更多开发者能够充分利用硬件加速能力，提升模型推理效率。这种类型的优化也反映了开源项目持续演进、适应技术生态发展的特点。

Diffusers：在PyTorch中用于图像和音频生成的最先进扩散模型。

项目地址：https://gitcode.com/GitHub_Trending/di/diffusers

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息