Swift项目多模态模型采样随机性问题分析与解决方案

2025-05-31 02:05:25作者：段琳惟

魔搭大模型训练推理工具箱，支持LLaMA、千问、ChatGLM、BaiChuan等多种模型及LoRA等多种训练方式(The LLM training/inference framework of ModelScope community, Support various models like LLaMA, Qwen, Baichuan, ChatGLM and others, and training methods like LoRA, ResTuning, NEFTune, etc.)

项目地址：https://gitcode.com/GitHub_Trending/swift1/swift

问题背景

在使用Swift项目中的Qwen2.5-VL-72B-Instruct多模态大模型进行文本生成时，开发者发现当设置num_return_sequences参数为3时，模型返回的三个生成结果完全相同，缺乏应有的随机性。这种现象在自然语言处理任务中是不符合预期的，因为通常我们希望模型能够提供多样化的生成结果。

技术分析

采样机制原理

在大型语言模型中，采样(sampling)是通过概率分布随机选择下一个token的过程。常见的采样策略包括：

贪婪搜索(Greedy Search)：总是选择概率最高的token
束搜索(Beam Search)：保留多个候选序列
随机采样(Sampling)：根据概率分布随机选择
Top-k采样：从概率最高的k个token中随机选择
Top-p采样(核采样)：从累积概率超过p的最小token集合中随机选择

问题根源

经过技术团队分析，该问题可能由以下几个因素导致：

多模态存储问题：项目中的多模态数据处理部分存在缺陷，导致随机种子被固定或采样策略未被正确应用
采样参数配置不当：默认的温度(temperature)参数设置为1.0，虽然理论上应该产生随机性，但可能与其他参数组合导致确定性输出
模型实现细节：特定版本的多模态模型在处理采样请求时可能有特殊实现

解决方案

技术团队提供了以下解决方案：

更新代码库：修复了多模态存储相关的问题，建议用户拉取最新代码
调整采样参数：推荐使用--top_p 0.9参数，启用核采样策略
- top_p参数控制采样时考虑的token集合大小
- 设置为0.9意味着从累积概率达到90%的最小token集合中随机选择
组合参数优化：可以尝试同时调整温度和top_p参数以获得更好的多样性