Jan项目架构演进：消息与线程模块向Cortex层迁移的技术解析

2025-05-06 17:57:38作者：昌雅子Ethen

Jan 是一个开源的 ChatGPT 替代品，它完全在您的电脑上离线运行。

项目地址：https://gitcode.com/GitHub_Trending/ja/jan

背景与目标

Jan项目正在经历一次重要的架构升级，核心目标是将业务逻辑与界面呈现彻底解耦。当前方案计划将消息管理（/messages）和线程管理（/threads）等核心功能从Jan UI层下沉至Cortex平台，使Jan转变为纯粹的展示层，而Cortex则演进为具备完整OpenAPI兼容性的AI服务平台。

架构设计理念

分层架构优化
Jan将专注处理跨平台渲染（移动端/桌面端/服务端）和用户交互，所有AI相关能力包括：

对话线程管理
消息持久化
模型推理
硬件资源调度都将由Cortex统一提供API服务。

兼容性设计
Cortex层将实现完整的OpenAPI协议兼容，这意味着：

开发者可以无缝替换后端服务
支持标准化的API调用方式
为未来生态扩展奠定基础

关键技术迁移项

核心功能迁移

消息管理重构
原Jan中的消息存储、上下文维护、流式传输等逻辑将迁移至Cortex，通过RESTful API提供服务。包括：
- 消息创建/更新/删除
- 对话上下文保持
- 流式响应处理
线程管理升级
线程作为对话的基本组织单元，其生命周期管理、状态同步等逻辑将重构为Cortex的微服务，支持：
- 多线程并行管理
- 历史记录追溯
- 跨设备同步

基础设施增强

硬件抽象层
Cortex.cpp正在构建统一的硬件API（ISSUE#1165），未来将支持：
- 多GPU负载均衡
- 异构计算调度
- 实时资源监控（CPU/RAM/GPU利用率）
模型服务化
模型仓库功能将升级为独立服务，支持：
- 动态模型热更新
- 版本控制
- 混合精度推理（FP16/INT8）

实施路径

接口标准化阶段
定义清晰的API边界和协议规范，包括：

错误处理机制
认证鉴权流程
数据格式标准

功能迁移阶段
采用渐进式重构策略：

优先迁移无状态服务
逐步处理有状态服务
建立回滚机制

性能优化阶段
重点提升：

大规模消息处理的吞吐量
长对话上下文的内存效率
分布式部署能力

技术挑战与解决方案

状态管理一致性
采用乐观锁机制解决多端并发修改问题，结合操作日志实现最终一致性。
实时性保障
通过WebSocket长连接实现：

消息实时推送
输入状态同步
断线自动恢复

跨平台兼容
抽象各平台原生能力为统一接口，包括：

本地存储加密
硬件加速调用
通知系统集成

未来展望

本次架构升级将为Jan带来更强大的扩展能力，后续可支持：

多模态模型协同（文本+视觉）
TensorRT等推理引擎深度集成
企业级插件体系通过清晰的层级划分，使各模块能够独立演进，最终构建更健壮的AI应用开发生态。

Jan 是一个开源的 ChatGPT 替代品，它完全在您的电脑上离线运行。

项目地址：https://gitcode.com/GitHub_Trending/ja/jan

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统