Qdrant FastEmbed项目中Late Interaction模型的兼容性问题解析

2025-07-05 15:15:18作者：韦蓉瑛

问题背景

在Qdrant的FastEmbed项目中，用户在使用Late Interaction模型时遇到了一个运行时错误。该问题最初出现在用户尝试运行qdrant/workshop-ultimate-hybrid-search演示代码时，系统抛出了维度不匹配的错误信息。

错误现象

核心错误表现为ONNXRuntime在执行Expand节点时的维度不匹配问题。具体错误信息显示：

Non-zero status code returned while running Expand node. Name:'/bert/Expand' Status Message: /bert/Expand: left operand cannot broadcast on dim 1 LeftShape: {1,512}, RightShape: {20,513}

这个错误表明在模型处理过程中，输入张量的形状{20,513}无法与预期的{1,512}形状进行广播操作，特别是在维度1上存在不匹配。

技术分析

模型架构特性：Late Interaction模型（如ColBERT）通常采用双编码器架构，分别处理查询和文档。这种架构对输入序列长度有特定要求。
维度不匹配根源：
- 预期输入形状为{1,512}，表示单一样本、512维特征
- 实际接收形状为{20,513}，表示20个样本、513维特征
- 差异可能源于：
  - 输入预处理阶段未正确截断或填充序列
  - 分词器产生的特殊标记未被正确处理
  - 批次处理逻辑存在缺陷
批次处理影响：当batch_size=20时，部分批次处理正常，部分失败，说明问题可能与动态输入长度或某些边缘案例有关。