SmallCloudAI/Refact v1.9.0版本发布：新增AI模型支持与离线模式

2025-06-24 12:03:10作者：董斯意

项目简介

SmallCloudAI/Refact是一个专注于人工智能模型部署与管理的开源项目，旨在为开发者提供灵活、高效的AI模型服务解决方案。该项目支持多种主流AI模型，并提供了便捷的API接口，使开发者能够快速集成AI能力到自己的应用中。

核心更新内容

新增第三方AI模型支持

本次v1.9.0版本最显著的更新是增加了对多个新兴AI模型的支持：

Gemini模型：Google推出的新一代多模态AI模型，具备强大的文本理解和生成能力。
Grok(XAI)：由XAI(马斯克旗下公司)开发的开源AI模型，以其高效的推理能力和独特的架构设计著称。
OpenAI o1：OpenAI最新推出的优化版本模型，在保持性能的同时提高了响应速度。

这些新增的模型支持使得Refact项目能够覆盖更广泛的AI应用场景，为开发者提供了更多选择。

离线模式实现

v1.9.0版本引入了一项重要功能——离线模式。这一特性允许服务器在完全断开与HuggingFace连接的情况下，依然能够正常运行预先加载的模型。这一改进带来了几个显著优势：

增强的隐私保护：敏感数据无需离开本地环境
提高可靠性：在网络不稳定的环境下仍可提供服务
降低延迟：减少了对远程服务器的依赖

离线模式的实现采用了本地缓存机制，开发者可以预先下载所需的模型权重和配置文件，系统会自动识别并使用这些本地资源。

技术优化与改进

除了主要功能更新外，本次版本还包含了一些重要的技术优化：

模型列表变更时的能力重载修复：解决了当模型列表发生变化时，系统能力(caps)未能及时更新的问题，确保了系统状态的准确性。
淘汰模型清理：移除了项目中已过时的模型支持，精简了代码库，提高了维护效率。这些被移除的模型大多已被更先进的版本所替代。

技术意义与应用前景

v1.9.0版本的发布标志着Refact项目在以下方面取得了重要进展：

模型生态扩展：通过支持Gemini、Grok等新兴模型，Refact保持了技术前沿性，能够满足不同领域开发者的需求。
部署灵活性提升：离线模式的引入使得Refact可以在更多场景下部署，包括对数据隐私要求严格的行业、边缘计算环境等。
系统稳定性增强：通过修复关键问题和清理技术债务，提高了整体系统的可靠性和可维护性。

对于开发者而言，这些更新意味着可以更自由地选择适合自己业务需求的AI模型，同时在各种网络环境下都能获得稳定的服务。特别是对于需要处理敏感数据或在受限网络环境中工作的团队，离线模式将大大提升他们的工作效率。

随着AI技术的快速发展，Refact项目通过持续更新和优化，正逐步成为一个功能全面、适应性强的人工智能模型服务平台。

refact

WebUI for Fine-Tuning and Self-hosting of Open-Source Large Language Models for Coding

项目地址：https://gitcode.com/GitHub_Trending/re/refact

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781