Amazon EKS AMI v20250514 版本发布：新增对 p6-b200 实例的 Nvidia 支持

2025-06-18 03:08:32作者：宣海椒Queenly

Packer configuration for building a custom EKS AMI

项目地址：https://gitcode.com/GitHub_Trending/am/amazon-eks-ami

Amazon EKS AMI 是 AWS 官方维护的 Amazon Elastic Kubernetes Service (EKS) 节点镜像项目，为运行在 EKS 上的工作节点提供经过优化和测试的基础操作系统镜像。该项目持续更新以支持最新的 Kubernetes 版本、安全补丁和硬件特性。

核心更新内容

本次 v20250514 版本的主要亮点是为 AL2023 Nvidia 变体增加了 nvlsm 支持，这使得该 AMI 能够支持 AWS 最新推出的 p6-b200 实例类型。p6-b200 是 AWS 基于 NVIDIA H200 Tensor Core GPU 构建的高性能计算实例，专为 AI/ML 工作负载设计。

技术细节解析

Nvidia 支持增强

在 AL2023 操作系统的 Nvidia 变体镜像中，本次更新引入了以下关键组件：

NVIDIA 驱动更新：采用了 570.133.20 版本的驱动程序，为最新的 GPU 硬件提供更好的兼容性和性能优化。
NVLSM 支持：新增的 NVLink Shared Memory (NVLSM) 功能是本次更新的核心，它允许多个 GPU 之间通过 NVLink 高速互连共享内存，这对于大规模模型训练等场景至关重要。
容器工具链完善：保持了 1.17.6 版本的 NVIDIA 容器工具包，确保容器化 GPU 工作负载的隔离性和性能。

多架构支持

项目继续维护对多种处理器架构的支持：

x86_64 架构：适用于大多数通用计算场景
ARM64 架构：为基于 Graviton 处理器的实例提供优化支持
针对不同架构提供了标准版和 GPU 加速版镜像

容器运行时更新

所有镜像版本都包含了最新稳定的容器运行时组件：

containerd 1.7.27：作为默认的容器运行时
runc 1.2.4：提供底层容器执行环境
这些组件都经过了与 Kubernetes 各版本的兼容性测试

版本兼容性

本次更新覆盖了从 Kubernetes 1.26 到 1.32 的主要版本，每个版本都提供了：

标准版镜像
GPU 加速版镜像
Neuron 加速版镜像（适用于机器学习推理场景）
ARM64 架构镜像

这种全面的版本覆盖确保了用户无论使用哪个 Kubernetes 版本，都能获得一致的功能和安全更新。

安全增强

所有镜像都集成了最新的安全改进：

内核更新到稳定版本，解决了已知问题
系统组件如 amazon-ssm-agent 更新到最新安全版本
持续集成的基础操作系统安全更新

使用建议

对于计划使用 p6-b200 实例的用户，建议：

选择 AL2023 Nvidia 变体的 AMI
确保 Kubernetes 版本在支持范围内
验证 GPU 相关 Kubernetes 设备插件是否兼容

对于现有集群的用户，如果不需要使用新硬件特性，可以按原有节奏进行升级，但建议在测试环境验证新 AMI 的兼容性后再进行生产环境部署。

总结

Amazon EKS AMI v20250514 版本通过增加对 p6-b200 实例的支持，进一步强化了 AWS 在 AI/ML 基础设施方面的能力。这种定期的更新机制确保了 EKS 用户能够始终获得最新的硬件支持、性能优化和安全增强，同时保持与 Kubernetes 生态系统的良好兼容性。

Packer configuration for building a custom EKS AMI

项目地址：https://gitcode.com/GitHub_Trending/am/amazon-eks-ami

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。