Langchain-Chatchat项目中调用讯飞星火API与本地模型的技术方案

2025-05-04 04:13:24作者：郜逊炳

Langchain-Chatchat

项目地址：https://gitcode.com/gh_mirrors/lang/Langchain-Chatchat

在Langchain-Chatchat项目中，开发者经常需要整合不同的AI模型服务来构建完整的对话系统。本文将详细介绍如何在该项目中同时使用讯飞星火API和本地模型的技术方案。

在线API与本地模型的区别

在线API如讯飞星火提供即用型的AI服务，开发者只需通过API密钥即可调用，无需关心模型部署细节。而本地模型则需要自行部署和管理，通常需要额外的工具支持。

讯飞星火API的集成

对于讯飞星火这类在线API，集成过程相对简单：

获取API密钥
在项目配置文件中填写API密钥
无需使用Xinference等本地部署工具

本地模型的部署方案

当需要使用本地模型(如Embedding模型)时，推荐采用以下方案：

使用Xinference工具将本地模型运行起来
Xinference会提供一个兼容OpenAI API格式的本地端点
在配置文件中指定该本地端点的URL

混合部署方案

对于同时使用在线LLM和本地模型的场景：

LLM部分：直接配置讯飞星火API密钥
Embedding部分：通过Xinference部署本地模型
在配置文件中分别指定不同的模型来源

高级配置建议

对于自行搭建的VLLM服务器：

即使没有API密钥，也可以通过HTTP头部验证
在配置文件中需要明确指定验证头信息
确保服务器地址和端口配置正确

最佳实践

优先使用在线API简化部署流程
对性能敏感或数据隐私要求高的模块使用本地模型
通过OneAPI等工具统一管理不同来源的API调用
合理规划模型部署位置，平衡性能与成本

通过以上方案，开发者可以在Langchain-Chatchat项目中灵活地组合使用讯飞星火API和本地模型，构建出既强大又符合特定需求的对话系统。

Langchain-Chatchat

项目地址：https://gitcode.com/gh_mirrors/lang/Langchain-Chatchat

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统