LMDeploy项目对Qwen2-VL系列模型的支持现状分析

2025-06-04 12:43:28作者：廉皓灿Ida

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

项目地址：https://gitcode.com/gh_mirrors/lm/lmdeploy

背景概述

LMDeploy作为一款高效的大语言模型部署工具，近期在社区中引发了关于其对Qwen2-VL系列模型支持情况的讨论。Qwen2-VL是通义千问团队推出的多模态大语言模型系列，包含2B、7B和72B等不同参数规模的版本，具备强大的视觉-语言理解能力。

当前支持情况

根据LMDeploy项目的最新进展，其主分支(main branch)已经实现了对Qwen2-VL系列模型的初步支持。然而需要注意的是，这一功能尚未包含在正式发布的版本中。目前最新的稳定版本v0.6.0尚不支持Qwen2-VL架构，这导致用户在尝试部署时会遇到模型架构识别错误的问题。

技术细节分析

当用户尝试使用v0.6.0版本部署Qwen2-VL模型时，系统会首先尝试使用PyTorch引擎运行，因为该模型架构未被明确支持。随后会抛出"Can not found rewrite for architectures: ['Qwen2VLForConditionalGeneration']"的错误，这表明当前的模型架构重写规则中尚未包含Qwen2-VL的特殊处理逻辑。

对于AWQ量化版本的Qwen2-VL模型，用户同样会遇到类似问题，系统会提示"ValueError: The checkpoint you are trying to load has model type qwen2_vl but Transformers does not recognize this architecture"，这进一步验证了当前版本对Qwen2-VL系列支持不足的情况。

未来版本展望

根据项目维护者的最新消息，Qwen2-VL的完整支持将包含在即将发布的v0.6.1版本中。这一更新预计将在近期发布，届时用户将能够顺利部署Qwen2-VL系列的各种模型，包括2B、7B和72B等不同规模的版本。

建议与注意事项

对于急需使用Qwen2-VL模型的开发者，可以考虑以下方案：

等待官方v0.6.1版本的正式发布
如有紧急需求，可考虑从源码构建最新主分支版本

需要注意的是，不同规模的Qwen2-VL模型对硬件资源的需求差异较大，特别是72B版本需要充足的GPU内存支持。在部署前应充分评估硬件资源配置，确保能够满足模型推理的计算需求。

随着多模态大模型应用的普及，LMDeploy对Qwen2-VL系列的支持将为视觉-语言联合任务提供更高效的部署方案，值得开发者关注和期待。

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

项目地址：https://gitcode.com/gh_mirrors/lm/lmdeploy

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。