OpenVINO Notebooks项目中Flux.1模型迁移至OpenVINO.genai的技术实践

2025-06-28 08:41:46作者：裘晴惠Vivianne

在OpenVINO Notebooks项目的最新更新中，Flux.1模型从原先的optimum.intel迁移到了openvino_genai模块。这一变更带来了API调用方式的变化，同时也引发了一些值得注意的技术问题。

模型迁移带来的API变化

原先使用optimum.intel的调用方式：

from optimum.intel.openvino import OVDiffusionPipeline
model_dir = model_base_dir / "INT4" if use_quantized_models.value else model_base_dir / "FP16"
ov_pipe = OVDiffusionPipeline.from_pretrained(model_dir, device=device.value)

迁移至openvino_genai后的新调用方式：

import openvino_genai as ov_genai
model_dir = model_base_dir / "INT4" if use_quantized_models.value else model_base_dir / "FP16"
ov_pipe = ov_genai.Text2ImagePipeline(model_dir, device=device.value)

环境配置要点

在迁移过程中，环境配置是确保模型正常运行的关键。经过实践验证，以下软件包版本组合能够稳定工作：

onnx: 1.17.0
openvino: 2025.0.0
openvino-genai: 2025.0.0.0
openvino-tokenizers: 2025.0.0.0
optimum: 1.24.0
optimum-intel: 1.23.0.dev0+6cceb30

值得注意的是，不同版本的软件包之间可能存在兼容性问题。如果遇到问题，建议完全卸载后重新安装最新版本。

生成图像中的文本质量问题

在测试过程中发现了一个有趣的现象：当提示语中包含"hello OpenVINO"时，生成的图像中文本部分可能出现问题；而将提示语改为"happy birthday"时，则能正常生成。这一现象在GPU设备上尤为明显。

经过深入分析，这可能是由于以下原因造成的：

GPU推理过程中的数值精度问题
随机种子设置的影响
推理步数(step)或引导比例(guidance_scale)参数需要调整

解决方案与优化建议

针对上述问题，我们推荐以下解决方案：

环境配置：确保使用最新版本的软件包组合，特别是openvino、openvino-genai和openvino-tokenizers这三个核心组件。
设备选择：如果GPU上出现文本生成问题，可以尝试切换到CPU设备，通常能获得更稳定的结果。对于GPU用户，可以尝试调整以下参数：
- 增加推理步数
- 调整引导比例
- 尝试不同的随机种子

参数调优：对于文本生成质量要求高的场景，建议进行以下参数实验：

# 示例参数设置
result = ov_pipe.generate(
    prompt="A cat holding a sign that says hello OpenVINO",
    num_inference_steps=30,  # 增加步数
    guidance_scale=7.5,      # 调整引导比例
    seed=42                  # 固定随机种子
)