WrenAI离线环境部署中的嵌入模型配置问题解析

2025-05-29 09:37:14作者：江焘钦

Give AI agents the context to query business data correctly through the open context layer that gives AI agents grounded, governed memory, context, SQL across 20+ data sources, that helps you build agentic GenBI, text-to-sql, dashboards, and agentic analytics.

项目地址：https://gitcode.com/GitHub_Trending/wr/WrenAI

背景介绍

WrenAI是一款开源的数据分析平台，它结合了AI技术来帮助用户通过自然语言查询数据。在实际生产环境中，很多企业由于安全合规要求需要在完全离线的环境中部署这类AI系统。本文将以一个典型的离线部署场景为例，深入分析WrenAI服务在离线环境中遇到的嵌入模型配置问题及其解决方案。

问题现象

在RedHat系统的离线环境中部署WrenAI时，wren-ai-service容器启动失败。具体表现为容器尝试从网络下载嵌入模型，而实际上环境中已经通过另一台Windows服务器部署了Ollama服务，并加载了nomic-embed-text和llama3.2模型。

环境配置分析

典型离线部署架构包含两个关键节点：

Windows Server 2019节点：运行Ollama服务(版本0.5.4)，已预加载nomic-embed-text和llama3.2模型
RedHat节点：运行Docker环境，部署WrenAI各组件

测试表明，通过curl命令可以正常访问Ollama服务的嵌入和生成接口，证明基础网络连接正常。

配置问题深入分析

通过日志分析发现几个关键配置问题：

版本兼容性问题：最初使用的wren-ai-service 0.14.3版本在离线环境中会尝试下载模型文件，这是不符合离线环境要求的。
配置格式问题：在config.yaml文件中，embedder配置存在两种不同格式：
- 使用api_base参数格式
- 使用url参数格式混合使用导致解析异常。
维度参数缺失：nomic-embed-text模型需要明确指定dimension参数(768)，否则会导致初始化失败。
新版管道缺失：升级到0.15.5版本后，缺少sql_generation_reasoning管道配置，导致服务启动失败。

解决方案与最佳实践

针对上述问题，我们总结出离线环境部署WrenAI的最佳实践：

版本选择：至少使用wren-ai-service 0.15.5或更高版本，这些版本对离线部署支持更好。
正确配置嵌入服务：

type: embedder
provider: ollama_embedder
models:
  - model: nomic-embed-text
    dimension: 768
url: http://ollama-host:11434
timeout: 120

完整管道配置：确保包含所有必要的管道配置，特别是新版增加的sql_generation_reasoning管道：

- name: sql_generation_reasoning
  llm: litellm_llm.gpt-4o-mini-2024-07-18

离线部署准备：

预先下载所有需要的Docker镜像
确保Ollama服务已加载所需模型
验证网络连通性

经验总结

在离线环境中部署AI系统需要特别注意以下几点：

组件版本间的兼容性
配置文件的完整性
所有依赖资源的预加载
严格的网络访问控制

通过本文的分析和解决方案，企业可以在完全离线的环境中成功部署WrenAI平台，既满足了安全合规要求，又能充分利用AI技术进行数据分析。

WrenAI

项目地址：https://gitcode.com/GitHub_Trending/wr/WrenAI

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677