Kubeflow KFServing中Hugging Face模型概率分数返回问题分析

2025-06-16 20:25:37作者：柯茵沙

问题背景

在Kubeflow KFServing项目中，当使用Hugging Face服务器部署序列分类模型时，开发者期望通过--return_probabilities参数获取完整的预测概率分布。然而实际测试发现，该功能并未按预期工作，模型仅返回了预测类别标签而非概率分数。

在Hugging Face模型的部署配置中，--return_probabilities参数被定义为action="store_true"类型，这意味着当参数存在时，其值应自动设为True。但在实际代码实现中，这个参数值并未被正确传递到模型初始化环节。

通过分析HuggingfaceEncoderModel的初始化过程发现，虽然参数解析器正确接收了--return_probabilities标志，但在创建模型实例时，该参数并未被包含在传递给构造函数的kwargs字典中。这导致模型始终使用默认的False值，无法返回概率分布。

预期行为：

实际行为：

要解决这个问题，需要在以下两个层面进行修改：

参数传递层：确保从命令行参数解析得到的return_probabilities值能够正确传递到模型初始化环节。这需要修改参数处理逻辑，将解析后的值显式包含在模型构造函数的kwargs中。
模型实现层：在HuggingfaceEncoderModel类中，确保return_probabilities参数能够正确影响预测结果的生成逻辑。对于序列分类任务，当该参数为True时，模型应返回完整的softmax概率分布而非仅类别标签。

该问题主要影响以下使用场景：

对于仅需要最终分类结果的简单应用，此问题不会造成功能缺失。

建议的修复方案应包括：

这个问题展示了在复杂机器学习部署系统中参数传递完整性的重要性。开发者在使用KFServing部署Hugging Face模型时，应注意验证所有功能参数是否按预期工作，特别是当需要获取模型中间输出或详细预测信息时。通过修复此问题，可以增强框架的功能完整性，满足更广泛的模型部署需求。

登录后查看全文