Cube-Studio v2025.01.01 版本技术解析与架构演进

2025-06-28 16:16:15作者：霍妲思

cube studio开源云原生一站式机器学习/深度学习/大模型AI平台，支持sso登录，大数据平台对接，notebook在线开发，拖拉拽任务流pipeline编排，多机多卡分布式训练，超参搜索，推理服务VGPU，边缘计算，标注平台，自动化标注，大模型微调，vllm大模型推理，llmops，私有知识库，AI模型应用商店，支持模型一键开发/推理/微调，支持国产cpu/gpu/npu芯片，支持RDMA，支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式，deepseek微调推理

项目地址：https://gitcode.com/gh_mirrors/cub/cube-studio

Cube-Studio 是一个面向 AI 开发者的全栈式机器学习平台，集成了从数据准备、模型训练到推理部署的全生命周期管理能力。最新发布的 v2025.01.01 版本带来了多项重要改进，特别是在大模型支持、国产计算芯片适配、安全增强和用户体验优化等方面实现了显著突破。

大模型支持能力全面升级

本次版本在大模型领域进行了深度优化，新增了 DeepSeek 系列模型的完整支持。平台不仅提供了 DeepSeek 的推理服务部署能力，还专门开发了对应的 Chat 应用模板，使开发者能够快速构建基于 DeepSeek 的对话系统。

在模型推理方面，平台增强了 VLLM 分布式推理支持，显著提升了大规模语言模型的推理效率。同时新增了 Xinference 内部服务集成，为用户提供了更多元化的推理框架选择。针对国产计算芯片生态，特别优化了 MindIE 推理服务的性能表现，使其在国产计算硬件上能够发挥更佳的计算效能。

模型管理模块进行了重要改进，支持用户直接从模型管理界面跳转到相关应用，大幅提升了工作流衔接的顺畅度。平台还设置了更合理的大模型最大 token 数限制，既保证了模型性能又避免了资源浪费。

国产计算芯片深度适配与优化

v2025.01.01 版本在国产计算芯片支持方面取得了重大进展。平台新增了完整的国产计算 NPU 监控体系，使管理员能够清晰掌握国产计算资源的使用情况。针对国产计算环境特别优化了 PyTorch 训练任务模板，确保深度学习模型能够高效利用国产计算硬件加速。

在开发环境方面，新增了国产计算专用的 Jupyter Notebook 和 VSCode 开发环境，为国产计算开发者提供了更友好的交互式编程体验。特别值得注意的是，平台现在支持国产计算的共享占用模式，使计算资源能够更灵活地分配给不同任务。

针对大模型场景，新增了国产计算大模型示例 Pipeline，展示了如何在国产计算硬件上构建端到端的大模型应用。这些改进使得 Cube-Studio 成为国内少数能够全面支持国产计算生态的机器学习平台之一。

安全体系与权限管理增强

安全方面，本版本进行了全面加固。用户密码现在采用密文存储，大幅提升了认证安全性。平台增加了 LDAP 单点登录支持，方便企业用户集成现有身份认证体系。针对 API 访问，完善了安全扫描机制，确保所有接口调用都经过严格验证。

权限管理系统进行了重构优化，新增了 Gamma 角色权限体系，使权限分配更加精细。普通用户现在可以清晰查看自己所属的项目组，而管理员则拥有更完善的项目组管理能力。特别加强了任务模板的权限控制，确保只有管理员能够添加或修改核心任务模板。

在应用安全方面，修复了多个 XSS 安全隐患，对特殊字符进行了严格转义处理。同时优化了 Cookie 的 401 认证机制，确保所有子服务（如 Notebook、NNI、AIHub）都具备一致的安全认证标准。

用户体验与功能优化

本次更新包含了大量用户体验改进。AIHub 应用现在支持离线缓存目的地设置，方便内网环境使用。数据可视化模块新增了弹窗功能，使分析结果展示更加灵活。任务流系统增加了固化能力，用户可以保存常用工作流模板。

在开发环境方面，优化了 VSCode 的远程 SSH 服务能力，使开发者能够更方便地连接云端开发环境。Jupyter Notebook 现在支持查看挂起消息，并解决了 Conda 环境使用问题。针对分布式训练场景，优化了任务模板，使多机训练配置更加简单。

模型部署流程进行了简化，新增了推理服务的"0代码发布"首页自动化配置功能，大幅降低了模型上线的技术门槛。同时优化了模型下载机制，增加全局挂载支持，使大模型文件共享更加高效。

架构改进与性能优化

在系统架构层面，v2025.01.01 版本进行了多项基础性改进。数据库结构升级新增了 expand 字段，为未来功能扩展预留了空间。多集群管理现在支持内外双网卡配置，适应更复杂的网络环境。

资源调度系统进行了深度优化，修复了 GPU 虚拟化值处理问题，使资源配额管理更加准确。批量删除操作现在会同步更新服务状态，确保系统信息实时一致。消息系统改用 Redis 缓存，显著提高了推送效率。

容器运行时支持方面，增强了对 Containerd 的兼容性，允许自定义 Containerd 位置，为 RKE2 等新型 Kubernetes 发行版提供了更好支持。镜像拉取机制也进行了优化，避免内网环境下的域名解析问题。

机器学习算法增强

在传统机器学习方面，本次更新丰富了算法库。新增了多种多分类算法支持，包括 XGBoost、LightGBM、KNN、GBDT 以及决策树等。这些算法现在能够自动转换输出概率列名为原始标签值，使预测结果更加直观。

针对计算机视觉领域，优化了 YOLOv8 任务模板，升级了镜像版本。新增了视频多目标跟踪自动化标注功能，为目标检测任务提供了更完整的解决方案。同时改进了 YOLOv7 的内网示例，使其在离线环境中更易部署。

总结

Cube-Studio v2025.01.01 版本标志着该平台在大模型支持、国产计算芯片适配和企业级特性方面的成熟。通过本次更新，开发者能够更高效地构建和部署 AI 应用，特别是在国产计算硬件和大模型场景下获得了显著的生产力提升。安全体系的强化使平台更加适合企业生产环境，而众多用户体验优化则降低了 AI 开发的技术门槛。这些改进共同巩固了 Cube-Studio 作为全功能机器学习平台的地位，为各类 AI 应用开发提供了坚实基础

cube-studio

项目地址：https://gitcode.com/gh_mirrors/cub/cube-studio

登录后查看全文

Cube-Studio v2025.01.01 版本技术解析与架构演进

大模型支持能力全面升级

国产计算芯片深度适配与优化

安全体系与权限管理增强

用户体验与功能优化

架构改进与性能优化

机器学习算法增强

总结

热门内容推荐

最新内容推荐

项目优选

Cube-Studio v2025.01.01 版本技术解析与架构演进

大模型支持能力全面升级

国产计算芯片深度适配与优化

安全体系与权限管理增强

用户体验与功能优化

架构改进与性能优化

机器学习算法增强

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选