AIChat项目多Ollama服务配置的灵活化实践

2025-06-02 17:36:56作者：薛曦旖Francesca

在AI工具链的配置管理中，如何优雅地处理同类型服务的多实例配置一直是个值得探讨的技术问题。最近AIChat项目中关于Ollama多服务配置的讨论，为我们提供了一个很好的案例研究。

问题背景

当用户需要在同一环境中配置多个Ollama服务端点时（例如本地开发机和远程服务器），传统的配置方式会遇到识别冲突。AIChat默认的配置结构通过name字段来标识服务类型，这导致当用户添加多个同类型服务时，系统可能无法正确区分各个实例。

技术解决方案演进

初始方案：显式模型声明

项目维护者提出的解决方案是在配置中显式声明每个服务端点支持的模型列表。这种方法虽然直接，但需要用户手动维护模型信息，失去了自动发现模型的便利性。

示例配置：

- type: openai-compatible
  name: ollama-remote
  api_base: http://192.168.1.202:11434/v1
  models:
    - name: qwen2.5-coder
      max_input_tokens: 32768
      supports_function_calling: true

改进方案：名称前缀匹配

经过深入讨论，项目决定采用更智能的名称匹配策略。现在系统会检查名称是否以平台类型开头，而非严格相等匹配。这意味着用户可以这样配置：

- type: openai-compatible
  name: ollama-local
  api_base: http://localhost:11434/v1

- type: openai-compatible
  name: ollama-remote
  api_base: http://192.168.1.202:11434/v1

技术实现细节

模型类型处理：AIChat会区分聊天模型和嵌入模型，在自动补全时只显示合适的模型类型。
配置加载优先级：
- 首先检查配置中的显式models声明
- 其次根据客户端类型匹配预设模型
- 对于openai-compatible类型，采用改进的名称前缀匹配策略
向后兼容性：新策略完全兼容现有配置，确保平滑升级。