Langchain-Chatchat项目中使用Xinference适配问题的分析与解决

2025-05-04 20:24:43作者：段琳惟

问题背景

在Langchain-Chatchat项目0.3.1.3版本中，用户在使用多功能对话功能时遇到了"An error occurred during streaming"的错误提示。该问题主要出现在使用Xinference作为模型推理框架，并加载GLM-4-9B模型的情况下。错误日志显示系统抛出了"int() argument must be a string, a bytes-like object or a real number, not 'NoneType'"的异常。

环境配置分析

从用户提供的环境信息来看，项目部署采用了以下关键组件：

模型推理框架：Xinference
LLM模型：GLM-4-9B
Embedding模型：bge-large-zh-v1.5
向量库：faiss
操作系统：Ubuntu 20.04
Python版本：3.10.12
硬件：GPU

在basic_model_settings.yaml配置文件中，用户正确设置了Xinference的平台信息，包括API基础URL和模型列表。然而，当调用多功能对话功能时，系统无法正确处理Xinference返回的流式响应。

问题根源

经过技术分析，该问题的根本原因是Langchain-Chatchat项目与Xinference新版本(0.16.0)之间存在兼容性问题。具体表现为：

版本不匹配：Xinference 0.16.0版本对API接口和响应格式进行了调整，而Langchain-Chatchat项目尚未完全适配这些变更。
类型转换错误：在处理流式响应时，系统尝试将None值转换为整数类型，导致类型转换异常。
流式处理中断：由于上述错误，多功能对话的流式响应处理流程被意外中断，最终呈现给用户"An error occurred during streaming"的错误提示。

解决方案

针对这一问题，目前有以下几种可行的解决方案：

降级Xinference版本：将Xinference降级到0.15.x版本可以解决兼容性问题。这是最快速直接的解决方案，已在多个用户环境中验证有效。
等待官方适配：关注Langchain-Chatchat项目的更新，等待官方发布对新版Xinference的适配支持。
手动修改代码：对于有开发能力的用户，可以自行修改项目中处理Xinference响应的代码逻辑，确保正确处理新版API的返回格式。

技术建议

对于使用类似技术栈的开发者，建议：

版本控制：在使用开源项目时，注意记录各依赖组件的版本信息，便于问题排查。
环境隔离：使用虚拟环境(如conda或venv)管理项目依赖，避免不同项目间的版本冲突。
日志收集：配置详细的日志记录，包括请求和响应的完整信息，有助于快速定位问题。
兼容性测试：在升级关键组件前，进行充分的兼容性测试，确保核心功能不受影响。

总结

Langchain-Chatchat项目与Xinference的集成问题是一个典型的版本兼容性案例。通过分析错误日志和环境配置，我们确定了问题根源并提出了有效的解决方案。这类问题的解决不仅需要技术分析能力，还需要对开源生态中各组件版本关系的深入理解。

对于开源项目使用者而言，保持对项目动态的关注，及时了解已知问题和解决方案，能够显著提高开发效率和使用体验。同时，积极参与社区讨论和问题报告，也有助于推动项目的持续改进和完善。

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优