首页
/ dstack项目0.18.43版本发布:CLI自动补全与云平台增强

dstack项目0.18.43版本发布:CLI自动补全与云平台增强

2025-06-27 05:59:08作者:舒璇辛Bertina

dstack是一个开源的机器学习基础设施编排工具,它允许数据科学家和机器学习工程师在云平台上轻松运行训练任务、开发环境和模型服务。该项目通过声明式配置和命令行工具简化了云资源的申请和管理流程,支持AWS、GCP、Azure和OCI等主流云平台。

CLI自动补全功能增强

本次0.18.43版本为dstack命令行工具引入了shell自动补全功能,支持bash和zsh两种主流shell环境。这一改进显著提升了开发者的工作效率,特别是在处理复杂命令和长资源名称时。

自动补全功能分为两个层次:首先是子命令补全,当用户输入部分命令时,CLI会智能提示可能的完整命令。其次是动态资源名称补全,这在处理运行日志、停止任务等需要指定资源名称的场景下尤为实用。

运行时长控制策略优化

新版本对max_duration参数的默认行为进行了重要调整。该参数原本在不同类型的运行配置中有不同的默认值:任务为72小时,开发环境为6小时,服务则为无限。这种不一致性常导致用户困惑和意外中断。

现在,所有运行类型的max_duration默认值统一设置为"off",即不自动终止运行。这一变更使行为更加可预测,用户需要显式设置该参数才能启用自动终止功能。对于依赖原有默认值的用户,建议检查并更新运行配置。

多云平台支持增强

GCP日志存储支持

为满足生产环境需求,dstack服务器现在支持将运行日志存储在GCP Logging服务中。这一功能特别适合在GCP上部署多副本服务器的情况,之前仅支持AWS CloudWatch的限制被打破,使dstack的部署选择更加灵活。

AWS自定义IAM实例配置

AWS后端配置新增了iam_instance_profile参数,允许用户指定与EC2实例关联的IAM实例配置文件。这一改进使得在不需要显式传递凭证的情况下,运行中的任务能够安全访问其他AWS资源。配置方式简单直观,只需在backend配置中指定角色名称即可。

Oracle Cloud抢占式实例

OCI后端现在支持抢占式(spot)实例,为能够容忍中断的工作负载提供了更具成本效益的GPU资源选择。用户可以通过简单的命令行参数启用这一功能,系统会显示不同实例类型的实时价格,便于做出经济高效的选择。

技术细节与兼容性说明

本次更新包含一些重要的技术调整和兼容性变更:

  1. 移除了对Python 3.8的运行环境支持,用户需要升级到更高版本的Python。
  2. 改进了云平台凭证验证机制,提升了配置的可靠性。
  3. 修复了分布式任务和复制服务的日志显示问题。
  4. 优化了资源筛选逻辑,确保后端基础配置被正确应用。
  5. 增强了OS镜像,包括Fabric Manager支持和DCGM Exporter的预安装。

这些变更体现了dstack项目对稳定性和用户体验的持续关注,同时也展示了其在多云环境下的灵活性和适应能力。对于生产环境用户,建议仔细评估兼容性影响,特别是关于运行时长控制和Python版本支持的变更。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
153
1.98 K
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
505
42
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
194
279
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
992
395
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
938
554
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
332
11
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
146
191
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
75
70