Puter项目AI模型列表公共端点设计与实现

2025-05-05 05:05:52作者：魏侃纯Zoe

在Puter项目的开发过程中，团队需要为AI聊天功能提供一个公开可访问的模型列表接口。这个技术需求源于现代AI应用开发中的常见场景：当用户使用AI服务时，前端需要知道当前系统支持哪些AI模型，以便提供相应的选择界面。

技术背景

Puter是一个基于JavaScript的后端项目，采用模块化设计。其AI聊天功能通过AIChatService集中管理所有AI模型的实现。在原有架构中，获取模型列表需要经过复杂的权限验证流程，这不符合公共接口的设计原则。

解决方案设计

项目团队决定实现一个不经过身份验证的公共端点，主要考虑以下技术要点：

服务层分离：新增ChatAPIService专门处理公共端点请求，与需要认证的API服务隔离
系统用户调用：利用现有的SUService以系统用户身份调用底层驱动，避免权限问题
直接模型查询：作为优化方案，也可以绕过驱动服务直接查询AIChatService中注册的实现

实现细节

在具体实现上，开发人员参考了项目中现有的权限API端点设计，确保新端点符合项目的整体架构风格。关键技术实现包括：

端点注册：在路由系统中添加新的GET端点，路径类似于/ai/models
模型收集：通过AIChatService获取所有已注册的AI聊天实现
数据格式化：将内部模型表示转换为客户端友好的JSON格式
性能优化：考虑添加缓存机制，避免频繁查询带来的性能开销

架构影响

这一改动对系统架构产生了积极影响：

前后端解耦：前端不再需要硬编码模型列表，提高了灵活性
扩展性增强：新增AI模型时无需修改前端代码
安全性保持：虽然端点公开，但仅返回模型元数据，不暴露敏感信息

最佳实践

通过这个案例，我们可以总结出一些通用的AI服务开发经验：

公共接口应该尽可能简单，只暴露必要信息
系统服务账号机制可以有效解决内部调用的权限问题
参考现有实现可以保持代码风格一致，减少学习成本
在AI项目中，模型元数据管理是基础但重要的功能

这个功能的实现展示了Puter项目在AI集成方面的技术演进，为后续更多AI能力的开放打下了良好的基础架构。

puter

项目地址：https://gitcode.com/GitHub_Trending/pu/puter

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.26 K

692