BuildKit v0.20.0-rc1 发布:支持GPU设备与GitHub Actions缓存升级
BuildKit 是一个现代化的容器镜像构建工具包,它采用模块化设计,支持高效的缓存机制和并行构建,能够显著提升容器镜像构建的性能。作为 Docker 构建引擎的后继者,BuildKit 提供了更灵活、更高效的构建体验。
近日,BuildKit 发布了 v0.20.0-rc1 版本,这是即将发布的 v0.20.0 正式版的第一个候选版本。本次更新带来了多项重要改进和新功能,特别是在设备支持和缓存机制方面有显著增强。
核心功能更新
1. CDI设备支持(实验性功能)
本次版本最引人注目的新特性是增加了对 CDI(Container Device Interface)设备的支持。CDI 是一个标准化的设备接口规范,允许容器运行时动态地将设备(如GPU)注入到容器中。
在 BuildKit 中,这意味着构建步骤现在可以请求特定的设备资源。例如,在机器学习相关的构建过程中,可以直接使用GPU加速某些计算密集型任务。这一功能目前处于实验阶段,需要通过 Dockerfile 的"labs"通道启用。
2. GitHub Actions缓存后端升级
随着GitHub官方宣布将在2025年3月1日停止支持V1 API,BuildKit 及时更新了其GitHub Actions缓存后端,全面支持V2 API。这一变更确保了使用GitHub Actions作为缓存后端的用户能够无缝过渡到新API。
3. 历史记录API增强
历史记录API现在支持服务器端过滤和返回记录数量限制,这为管理大量构建记录提供了更好的控制和灵活性。用户现在可以根据特定条件筛选历史记录,并限制返回的结果数量,提高查询效率。
重要变更与修复
1. Azure远程缓存后端移除
由于依赖项问题,本版本暂时移除了对Azure远程缓存后端的支持。开发团队表示可能会在未来的版本中重新引入这一功能。
2. 嵌入式binfmt更新
内置的binfmt模拟器已升级至QEMU 9.2.0版本,这提高了跨架构构建的兼容性和性能。
3. 稳定性改进
- 修复了长时间构建中可能出现的凭据过期问题
- 解决了S3远程缓存后端可能导致的崩溃问题
- 修复了Bolt数据库中的记录泄漏问题
依赖项更新
BuildKit v0.20.0-rc1 更新了多个依赖库,包括:
- Azure SDK相关组件升级到最新版本
- containerd相关组件更新
- Docker CLI和引擎更新至27.5.1
- gRPC升级到1.69.4
总结
BuildKit v0.20.0-rc1 是一个功能丰富的预发布版本,特别是在设备支持和缓存机制方面带来了重要改进。CDI设备的支持为需要特殊硬件加速的构建场景开辟了新的可能性,而GitHub Actions缓存的升级则确保了与平台演进的兼容性。
对于生产环境用户,建议等待正式版发布后再进行升级。但对于希望体验新功能的开发者,这个候选版本已经提供了稳定可靠的功能预览。开发团队鼓励用户测试并反馈遇到的问题,以帮助完善即将发布的正式版本。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00