GLM-4项目中使用vLLM引擎时参数传递问题解析

2025-06-04 17:14:50作者：姚月梅Lane

在GLM-4大语言模型项目的实际部署过程中，开发者可能会遇到一个典型的API服务端错误。本文将从技术原理和解决方案两个维度，深入分析这一问题。

问题现象

当运行GLM-4项目中的openai_api_server.py脚本时，系统会抛出TypeError异常，提示"generate() got an unexpected keyword argument 'inputs'"。这表明在调用vLLM引擎的generate方法时，传递了一个不被接受的参数名。

技术背景

vLLM是一个高效的大语言模型推理引擎，其API接口在不同版本中存在差异。GLM-4项目设计时基于特定版本的vLLM接口规范，而用户环境中安装的vLLM版本可能与之不兼容。

根本原因分析

经过排查，这个问题主要源于以下技术细节：

API接口变更：vLLM引擎在不同版本中对generate方法的参数命名进行了调整，早期版本使用"inputs"作为输入参数名，而新版本可能改为其他命名如"prompts"
版本不匹配：用户环境中安装的vLLM版本(0.4.0+cu118)与项目要求的版本不一致，导致接口规范不兼容
依赖管理不足：项目未严格锁定依赖版本，使得不同环境可能安装不兼容的依赖包

解决方案

针对这一问题，推荐以下解决步骤：

严格版本控制：使用项目提供的requirements.txt文件安装依赖，确保所有包版本完全匹配：
```
pip install -r requirements.txt
```
参数名适配：如果必须使用特定vLLM版本，可以修改openai_api_server.py中的相关代码，将：
```
async for output in engine.generate(inputs=inputs, ...)
```
改为新版本接受的参数名，如：
```
async for output in engine.generate(prompts=inputs, ...)
```
环境隔离：建议使用虚拟环境(如conda或venv)隔离项目依赖，避免全局Python环境中的包版本冲突