Qwen-VL项目中的TypeError问题分析与解决方案

2025-06-05 08:54:00作者：宣利权Counsellor

问题背景

在Qwen-VL项目中，用户在使用WebUI进行对话时遇到了一个TypeError错误。该错误发生在用户输入任何内容后，系统尝试生成响应时。错误信息显示isin()函数接收到了无效的参数组合，导致程序无法正常输出结果。

错误分析

该错误的根本原因是PyTorch的isin()函数参数传递方式与当前transformers版本不兼容。具体表现为：

在transformers的generation模块中，_prepare_attention_mask_for_generation方法调用torch.isin()时参数顺序不正确
当前transformers版本(4.41.2)与PyTorch 2.3的接口规范存在差异
错误发生在模型生成响应时处理attention mask的环节

技术细节

错误的核心在于PyTorch的isin()函数期望的参数顺序与transformers传递的顺序不一致。该函数设计用于检查输入张量中的元素是否存在于测试集合中，但在当前实现中参数被反转传递。

解决方案

经过分析，我们提供了两种可行的解决方案：

方案一：修改模型加载代码

在模型加载函数中，显式地将token ID转换为张量形式：

def _load_model_tokenizer(args):
    tokenizer = AutoTokenizer.from_pretrained(
        args.checkpoint_path, trust_remote_code=True, resume_download=True, revision='master',
    )

    if args.cpu_only:
        device_map = "cpu"
    else:
        device_map = "cuda"

    model = AutoModelForCausalLM.from_pretrained(
        args.checkpoint_path,
        device_map=device_map,
        trust_remote_code=True,
        resume_download=True,
        revision='master',
    ).eval()
    model.generation_config = GenerationConfig.from_pretrained(
        args.checkpoint_path, trust_remote_code=True, resume_download=True, revision='master',
    )

    if model.generation_config.pad_token_id is not None:
        model.generation_config.pad_token_id = torch.tensor(
            [model.generation_config.pad_token_id], device=model.device
        )
    if model.generation_config.eos_token_id is not None:
        model.generation_config.eos_token_id = torch.tensor(
            [model.generation_config.eos_token_id], device=model.device
        )

    return model, tokenizer