LLocalSearch项目中的模型切换功能设计与实现

2025-06-05 04:38:07作者：裘晴惠Vivianne

LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the final answer. No OpenAI or Google API keys are needed.

项目地址：https://gitcode.com/GitHub_Trending/ll/LLocalSearch

背景介绍

LLocalSearch是一个本地化搜索项目，近期开发者正在考虑改进其聊天模型切换功能。当前系统中，用户需要重启应用才能切换不同的量化模型或专用模型，这在实际使用中带来了不便。项目维护者Nils Herzig提出了一个创新的基础设施规划方案，旨在通过"聊天层"和"链式调用"架构来解决这一问题。

架构设计方案

核心思想是构建一个分层的聊天系统架构：

聊天层(Chat Layer)：作为用户交互的前端，负责维护完整的对话历史记录(绿色和紫色消息)。这一层可以直接响应用户请求，也可以在需要时调用其他专用处理链。
自主处理链(Autonomous Chains)：这些是独立运行的专用处理模块，采用自我批判循环机制运行，无需用户直接交互。例如可以设计：
- 编程专用链(使用deepseek-coder模型)
- 文档分析链
- 数据查询链等

这种架构的优势在于：

模块化设计，易于扩展新功能
不同类型任务可以自动路由到最适合的模型
保持主聊天界面的简洁性

技术实现细节

模型切换的即时实现

作为过渡方案，开发者已经实现了基础的模型切换功能：

通过HTML选择器界面展示Ollama实例上加载的所有可用模型
用户可以即时切换不同模型而无需重启应用

目前面临的挑战：

不同LLM模型需要不同的参数配置
提示词模板可能因模型而异
这些配置目前无法通过Web界面进行调整

配置管理方案

未来计划引入统一的链式配置格式，主要包含：

触发条件(何时调用该链)
输入/输出字符串处理规则
模型参数预设
专用提示词模板

用户界面改进

最新开发进展包括：

模型切换弹出窗口设计
直观的模型选择界面
清晰的当前模型状态显示

这些改进显著提升了用户体验，使专业用户能够更灵活地根据任务需求切换专用模型。

未来发展方向

该架构为系统未来发展提供了坚实基础：

可轻松添加更多专用处理链
支持模型混合使用(如将通用聊天与专用模型结合)
实现更智能的任务自动路由
提供用户自定义链的扩展能力

这种设计既解决了当前模型切换不便的问题，又为系统长期演进提供了清晰的技术路线。

LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the final answer. No OpenAI or Google API keys are needed.

项目地址：https://gitcode.com/GitHub_Trending/ll/LLocalSearch

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统