首页
/ dstack项目0.19.10版本发布:任务优先级与Azure Fsv2系列支持

dstack项目0.19.10版本发布:任务优先级与Azure Fsv2系列支持

2025-06-26 15:16:00作者:盛欣凯Ernestine

dstack作为一个开源的机器学习工作流编排平台,致力于简化AI/ML项目的开发、测试和部署流程。通过提供统一的接口来管理计算资源和工作流,dstack让研究人员和工程师能够更专注于模型开发本身,而无需花费大量时间在基础设施配置上。

任务优先级管理

本次0.19.10版本引入了一个重要的新特性——任务优先级管理。在之前的版本中,所有任务都是按照先进先出(FIFO)的原则进行调度,这在某些场景下可能不够灵活。新版本允许用户为每个运行配置指定一个0到100之间的优先级数值,数值越高表示优先级越高。

优先级机制的工作方式是:系统首先按照优先级降序排列任务,然后在同一优先级组内保持FIFO顺序。值得注意的是,高优先级任务如果因资源限制无法调度,不会阻塞低优先级任务的执行,这保证了系统资源的高效利用。

在实际应用中,可以将关键实验或生产任务设置为高优先级(如80-100),而将非紧急的测试或探索性任务设置为中等或低优先级(如20-50)。同时,结合重试策略(retry),可以确保重要任务在遇到容量限制时能够保持排队状态,直到资源可用。

CLI工具改进

命令行界面(CLI)也迎来了重要更新。新版本用更直观的dstack project命令取代了原有的dstack config命令,提供了更清晰的项目管理体验:

  1. dstack project list可以列出所有配置的项目及其详细信息
  2. dstack project set-default可以设置默认项目
  3. dstack project add用于添加新项目配置

此外,dstack ps命令新增了-n/--last参数,方便用户快速查看最近的N个运行记录,这在日常监控和调试中非常实用。

Azure Fsv2系列支持

对于使用Azure作为后端的用户,本次更新增加了对Fsv2系列计算优化型虚拟机的支持。Fsv2系列基于Intel Xeon Platinum 8168处理器,提供出色的计算性能与性价比平衡,特别适合计算密集型工作负载。

在资源选择时,系统会自动将Fsv2系列纳入考虑范围,用户可以通过dstack apply命令查看不同配置的价格和性能信息,选择最适合自己需求的实例类型。

其他重要改进

  1. 多节点任务支持:修复了在空闲实例上无法运行多节点任务的bug,提升了资源利用率
  2. 本地代码上传限制:使本地代码上传的大小限制可配置,适应不同项目需求
  3. Docker镜像优化:默认Docker镜像中移除了conda,改用更轻量级的uv工具
  4. 主题持久化:UI界面的深色/浅色主题选择现在会持久化保存
  5. 自动缩放保护:增加了对缩放目标值的校验,防止意外配置错误

总结

dstack 0.19.10版本通过引入任务优先级、改进CLI体验和扩展Azure支持,进一步提升了平台的灵活性和用户体验。这些改进使得资源调度更加智能,管理更加便捷,同时也为不同预算和性能需求的用户提供了更多选择。对于机器学习团队来说,这些增强功能将有助于更高效地管理和执行复杂的计算工作流。

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
165
2.05 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
954
563
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
60
16
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
0
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
408
387
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
77
71
rainbondrainbond
无需学习 Kubernetes 的容器平台,在 Kubernetes 上构建、部署、组装和管理应用,无需 K8s 专业知识,全流程图形化管理
Go
14
1