首页
/ dstack项目0.19.10版本发布:任务优先级与Azure Fsv2系列支持

dstack项目0.19.10版本发布:任务优先级与Azure Fsv2系列支持

2025-06-26 08:36:12作者:盛欣凯Ernestine

dstack作为一个开源的机器学习工作流编排平台,致力于简化AI/ML项目的开发、测试和部署流程。通过提供统一的接口来管理计算资源和工作流,dstack让研究人员和工程师能够更专注于模型开发本身,而无需花费大量时间在基础设施配置上。

任务优先级管理

本次0.19.10版本引入了一个重要的新特性——任务优先级管理。在之前的版本中,所有任务都是按照先进先出(FIFO)的原则进行调度,这在某些场景下可能不够灵活。新版本允许用户为每个运行配置指定一个0到100之间的优先级数值,数值越高表示优先级越高。

优先级机制的工作方式是:系统首先按照优先级降序排列任务,然后在同一优先级组内保持FIFO顺序。值得注意的是,高优先级任务如果因资源限制无法调度,不会阻塞低优先级任务的执行,这保证了系统资源的高效利用。

在实际应用中,可以将关键实验或生产任务设置为高优先级(如80-100),而将非紧急的测试或探索性任务设置为中等或低优先级(如20-50)。同时,结合重试策略(retry),可以确保重要任务在遇到容量限制时能够保持排队状态,直到资源可用。

CLI工具改进

命令行界面(CLI)也迎来了重要更新。新版本用更直观的dstack project命令取代了原有的dstack config命令,提供了更清晰的项目管理体验:

  1. dstack project list可以列出所有配置的项目及其详细信息
  2. dstack project set-default可以设置默认项目
  3. dstack project add用于添加新项目配置

此外,dstack ps命令新增了-n/--last参数,方便用户快速查看最近的N个运行记录,这在日常监控和调试中非常实用。

Azure Fsv2系列支持

对于使用Azure作为后端的用户,本次更新增加了对Fsv2系列计算优化型虚拟机的支持。Fsv2系列基于Intel Xeon Platinum 8168处理器,提供出色的计算性能与性价比平衡,特别适合计算密集型工作负载。

在资源选择时,系统会自动将Fsv2系列纳入考虑范围,用户可以通过dstack apply命令查看不同配置的价格和性能信息,选择最适合自己需求的实例类型。

其他重要改进

  1. 多节点任务支持:修复了在空闲实例上无法运行多节点任务的bug,提升了资源利用率
  2. 本地代码上传限制:使本地代码上传的大小限制可配置,适应不同项目需求
  3. Docker镜像优化:默认Docker镜像中移除了conda,改用更轻量级的uv工具
  4. 主题持久化:UI界面的深色/浅色主题选择现在会持久化保存
  5. 自动缩放保护:增加了对缩放目标值的校验,防止意外配置错误

总结

dstack 0.19.10版本通过引入任务优先级、改进CLI体验和扩展Azure支持,进一步提升了平台的灵活性和用户体验。这些改进使得资源调度更加智能,管理更加便捷,同时也为不同预算和性能需求的用户提供了更多选择。对于机器学习团队来说,这些增强功能将有助于更高效地管理和执行复杂的计算工作流。

登录后查看全文
热门项目推荐

项目优选

收起
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
136
187
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
881
521
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
361
381
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
181
264
kernelkernel
deepin linux kernel
C
22
5
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
83
4
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
613
60
open-eBackupopen-eBackup
open-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。
HTML
118
78