KServe项目中HuggingFace模型服务器的远程代码执行支持解析

2025-06-16 19:26:11作者：戚魁泉Nursing

在KServe项目的最新版本中，HuggingFace模型服务器（HuggingFaceServer）新增了对远程代码执行的支持功能。这项功能主要针对HuggingFace模型库中那些包含自定义预处理代码或工具函数的特殊模型。

技术背景

部分HuggingFace模型（如falcon-7b-instruct等）在模型文件中嵌入了自定义Python代码。这些代码可能包含：

数据预处理逻辑
特殊工具函数
模型特有的辅助功能

传统加载方式会因安全限制而无法执行这些远程代码，导致模型加载失败。

解决方案实现

KServe提供了两种技术方案来支持这类模型：

VLLM后端（默认）：通过添加--trust-remote-code启动参数即可启用远程代码执行支持

原生HuggingFace后端：需要显式设置trust_remote_code=True参数，可通过以下方式实现：

model_config = AutoConfig.from_pretrained(model_config_path, trust_remote_code=True)

或者更灵活的kwargs传递方式：

model_config = AutoConfig.from_pretrained(model_config_path, **kwargs)

安全考量

虽然该功能为模型使用提供了更大灵活性，但需要注意：

可能执行恶意代码的风险
需要用户自行承担启用该功能的安全责任
建议仅对可信模型源启用此功能

最佳实践

对于生产环境，建议：

严格审核模型来源
在隔离环境中测试模型
仅对已验证的安全模型启用远程代码执行
使用最小权限原则运行服务

这项改进使得KServe能够更好地支持HuggingFace生态中的各种特殊模型，为AI服务部署提供了更完整的解决方案。

kserve

Standardized Serverless ML Inference Platform on Kubernetes

项目地址：https://gitcode.com/gh_mirrors/ks/kserve

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781