AWS Deep Learning Containers 发布 v1.8-djl-0.28.0-inf-lmi-10.0.0 版本
AWS Deep Learning Containers 是亚马逊云科技提供的一套预配置的深度学习容器镜像,旨在简化深度学习模型的训练和推理部署流程。这些容器镜像预先集成了主流深度学习框架、工具和依赖库,用户可以直接使用而无需花费大量时间配置环境。
本次发布的 v1.8-djl-0.28.0-inf-lmi-10.0.0 版本主要针对推理场景进行了优化,特别集成了 DJL(Deep Java Library)0.28.0 和 LMI(Large Model Inference)10.0.0 版本,支持 CUDA 12.4 计算架构。这个版本特别适合需要部署大型语言模型(LLM)进行推理的应用场景。
在深度学习框架支持方面,该版本预装了 PyTorch 2.3.0(CUDA 12.1 版本)和 TorchVision 0.18.0,为计算机视觉任务提供了强大的支持。同时,容器中还包含了 Transformers 4.41.1 和 Tokenizers 0.19.1 等自然语言处理相关的核心库,方便用户处理文本数据。
值得注意的是,该版本对 CUDA 生态系统的支持相当全面,包含了 CUDA 12.4 命令行工具、cuBLAS 12.4 库(含开发版本)、cuDNN 9(CUDA 12 版本)以及 NCCL 通信库。这些组件的预装确保了深度学习模型能够充分利用 GPU 的并行计算能力,获得最佳性能表现。
在数据处理方面,容器预装了 Datasets 2.19.1 和 Pandas 2.2.3 等常用数据处理库,方便用户进行数据预处理和分析。科学计算方面则包含了 NumPy 1.26.4 和 SciPy 1.14.1 等基础库,以及 scikit-learn 1.6.0 这样的机器学习工具包。
对于开发者而言,该容器还包含了构建工具如 Ninja 1.11.1.2 和 MPI4py 4.0.1,支持并行计算应用的开发。AWS 命令行工具 awscli 1.36.18 的预装则简化了与 AWS 云服务的交互过程。
这个版本的发布体现了 AWS 对深度学习推理场景的持续优化,特别是针对大型语言模型的部署需求。通过预装这些经过测试和优化的组件,开发者可以节省大量环境配置时间,专注于模型开发和业务逻辑实现。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00