dstack项目0.19.10版本发布:任务优先级与Azure Fsv2系列支持
dstack作为一个开源的机器学习工作流编排平台,致力于简化AI/ML项目的开发、测试和部署流程。通过提供统一的接口来管理计算资源和工作流,dstack让研究人员和工程师能够更专注于模型开发本身,而无需花费大量时间在基础设施配置上。
任务优先级管理
本次0.19.10版本引入了一个重要的新特性——任务优先级管理。在之前的版本中,所有任务都是按照先进先出(FIFO)的原则进行调度,这在某些场景下可能不够灵活。新版本允许用户为每个运行配置指定一个0到100之间的优先级数值,数值越高表示优先级越高。
优先级机制的工作方式是:系统首先按照优先级降序排列任务,然后在同一优先级组内保持FIFO顺序。值得注意的是,高优先级任务如果因资源限制无法调度,不会阻塞低优先级任务的执行,这保证了系统资源的高效利用。
在实际应用中,可以将关键实验或生产任务设置为高优先级(如80-100),而将非紧急的测试或探索性任务设置为中等或低优先级(如20-50)。同时,结合重试策略(retry),可以确保重要任务在遇到容量限制时能够保持排队状态,直到资源可用。
CLI工具改进
命令行界面(CLI)也迎来了重要更新。新版本用更直观的dstack project命令取代了原有的dstack config命令,提供了更清晰的项目管理体验:
dstack project list可以列出所有配置的项目及其详细信息dstack project set-default可以设置默认项目dstack project add用于添加新项目配置
此外,dstack ps命令新增了-n/--last参数,方便用户快速查看最近的N个运行记录,这在日常监控和调试中非常实用。
Azure Fsv2系列支持
对于使用Azure作为后端的用户,本次更新增加了对Fsv2系列计算优化型虚拟机的支持。Fsv2系列基于Intel Xeon Platinum 8168处理器,提供出色的计算性能与性价比平衡,特别适合计算密集型工作负载。
在资源选择时,系统会自动将Fsv2系列纳入考虑范围,用户可以通过dstack apply命令查看不同配置的价格和性能信息,选择最适合自己需求的实例类型。
其他重要改进
- 多节点任务支持:修复了在空闲实例上无法运行多节点任务的bug,提升了资源利用率
- 本地代码上传限制:使本地代码上传的大小限制可配置,适应不同项目需求
- Docker镜像优化:默认Docker镜像中移除了conda,改用更轻量级的uv工具
- 主题持久化:UI界面的深色/浅色主题选择现在会持久化保存
- 自动缩放保护:增加了对缩放目标值的校验,防止意外配置错误
总结
dstack 0.19.10版本通过引入任务优先级、改进CLI体验和扩展Azure支持,进一步提升了平台的灵活性和用户体验。这些改进使得资源调度更加智能,管理更加便捷,同时也为不同预算和性能需求的用户提供了更多选择。对于机器学习团队来说,这些增强功能将有助于更高效地管理和执行复杂的计算工作流。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00