DB-GPT项目中如何正确连接本地模型服务

2025-05-14 08:43:13作者：翟萌耘Ralph

DB-GPT - 一个开源的数据库领域大模型框架，旨在简化构建数据库大模型应用的过程。

项目地址：https://gitcode.com/GitHub_Trending/db/DB-GPT

在使用DB-GPT项目时，许多开发者会遇到如何正确连接本地部署的模型服务（如LLM和文本嵌入模型）的问题。本文将详细介绍解决方案，帮助开发者顺利集成本地模型服务到DB-GPT生态中。

问题背景

当开发者在本地Linux系统上成功启动了LLM（如Qwen1.5-14B-Chat）和文本嵌入模型（如text2vec-large-chinese）服务后，尝试通过AWEL（AI Workflow Expression Language）示例代码调用这些服务时，经常会遇到404 Not Found错误或模型不匹配的问题。

核心解决方案

部署API Server

正确的做法是先部署一个API Server作为中间层，该服务提供兼容标准API的HTTP接口。通过以下命令启动API Server：

dbgpt start apiserver \
--controller_addr http://127.0.0.1:8000 \
--api_keys EMPTY \
--port 8100

注意要将controller_addr参数替换为实际的Model Controller地址。

代码集成方式

部署好API Server后，可以通过以下Python代码连接远程DB-GPT模型服务：

from dbgpt.core import Embeddings
from dbgpt.model.proxy import OpenAILLMClient
from dbgpt.rag.embedding import DefaultEmbeddingFactory

# 初始化LLM客户端
llm_client = OpenAILLMClient(
    api_key="EMPTY", 
    api_base="http://127.0.0.1:8100/api/v1", 
    model_alias="Qwen1.5-14B-Chat"
)

# 初始化嵌入模型
embeddings: Embeddings = DefaultEmbeddingFactory.remote(
    api_url="http://127.0.0.1:8100/api/v1/embeddings", 
    api_key="EMPTY", 
    model_name="text2vec"
)

常见问题及解决

模型不匹配错误

当出现类似"Only Qwen1.5-14B-Chat allowed now, your model gpt-3.5-turbo"的错误时，需要检查代码中的模型配置。这是因为OpenAILLMClient默认会尝试使用gpt-3.5-turbo模型，而本地部署的是Qwen1.5-14B-Chat模型。

解决方案是在创建OpenAILLMClient实例时明确指定model_alias参数为本地部署的模型名称。

性能优化建议

对于生产环境，建议设置合理的API密钥而非使用"EMPTY"
可以考虑启用API Server的批处理功能提高吞吐量
监控API Server的性能指标，适时调整并发参数

技术原理

DB-GPT的API Server实际上是一个适配层，它将标准的API请求转换为DB-GPT内部模型服务的调用。这种设计带来了几个优势：

兼容性：现有基于标准API的代码可以无缝迁移
灵活性：可以随时切换底层模型服务而不影响上层应用
可扩展性：方便添加认证、限流等企业级功能

总结

通过部署API Server并正确配置客户端代码，开发者可以轻松地将本地部署的LLM和嵌入模型集成到DB-GPT生态系统中。这种方法不仅解决了连接问题，还为未来的扩展和维护提供了良好的基础架构。

对于初学者，建议先从简单的文本生成和嵌入任务开始，逐步扩展到更复杂的应用场景。同时，密切关注DB-GPT项目的更新，以获取最新的功能改进和性能优化。

DB-GPT - 一个开源的数据库领域大模型框架，旨在简化构建数据库大模型应用的过程。

项目地址：https://gitcode.com/GitHub_Trending/db/DB-GPT

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

ohos_react_native

React Native鸿蒙化仓库

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力