lm-evaluation-harness项目中vLLM-VLM模型参数解析问题分析

2025-05-26 15:08:31作者：房伟宁

在lm-evaluation-harness项目中使用vLLM-VLM模型时，开发者可能会遇到一个参数解析问题。这个问题主要出现在尝试设置limit_mm_per_prompt参数时，特别是当参数值中包含等号(=)的情况下。

问题背景

当用户尝试通过命令行参数为vLLM-VLM模型设置limit_mm_per_prompt参数时，例如设置为"image=50"，会遇到参数解析错误。这是因为lm-evaluation-harness使用的简单参数解析器会将等号作为键值对的分隔符，而参数值本身也包含等号，导致解析器无法正确识别。

技术细节

问题的核心在于参数解析器的设计。当前实现中，参数解析器会按照以下逻辑工作：

将整个参数字符串按逗号分割成多个键值对
对每个键值对，再按第一个等号分割为键和值
当值本身包含等号时（如"image=50"），会导致分割结果出现三个部分（['limit_mm_per_prompt', 'image', '50']），而解析器预期只有两部分

解决方案

项目团队已经通过PR #2387提供了临时解决方案。虽然技术上可以实现类似limit_mm_per_prompt="{'image':50}"这样的复杂参数传递方式，但考虑到用户体验，团队选择了更直接的修复方式。

影响范围

这个问题主要影响以下使用场景：

使用vLLM-VLM模型进行多模态评估
需要限制每个提示中多媒体内容数量的情况
通过命令行参数直接配置模型参数的情况

最佳实践建议

对于需要使用类似复杂参数配置的情况，建议：

优先使用配置文件而非命令行参数
对于必须使用命令行参数的情况，可以考虑将复杂参数JSON序列化后传递
关注项目更新，了解参数解析器的改进情况

这个问题展示了在开发评估框架时处理复杂参数配置的挑战，也提醒我们在设计命令行接口时需要考虑到各种边界情况。

lm-evaluation-harness

A framework for few-shot evaluation of language models.

项目地址：https://gitcode.com/GitHub_Trending/lm/lm-evaluation-harness

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

394

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989

lm-evaluation-harness项目中vLLM-VLM模型参数解析问题分析

问题背景

技术细节

解决方案

影响范围

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

lm-evaluation-harness项目中vLLM-VLM模型参数解析问题分析

问题背景

技术细节

解决方案

影响范围

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选