Tenstorrent/tt-metal v0.58.0-rc15版本技术解析与架构演进

2025-07-10 21:55:57作者：苗圣禹Peter

Tenstorrent/tt-metal项目是一个专注于高性能计算和AI加速的开源项目，它提供了一套完整的软件栈来支持Tenstorrent的AI加速硬件。该项目包含了从底层硬件驱动到高层神经网络框架的全栈实现，旨在为AI工作负载提供极致的性能和效率。

核心架构改进

本次发布的v0.58.0-rc15版本带来了多项重要的架构改进，其中最值得注意的是对DRAM预取器性能模式的增强支持。这一改进允许系统根据工作负载特性动态调整预取策略，从而显著提升内存密集型应用的性能表现。

在内存管理方面，项目团队移除了DispatchMemMap单例模式，将其所有权转移至MetalContext。这一架构调整简化了内存管理模型，提高了系统的模块化程度，同时也为未来的多设备支持打下了更坚实的基础。

新版本在多方面进行了性能优化，包括：

在编程接口方面，本次更新带来了多项重要改进：

异步API清理：移除了遗留的异步模式API，简化了编程模型，使开发者能够更专注于业务逻辑。
TTNN扩展：
- 新增了stack操作支持
- 增强了upsample操作对非均匀分片的支持
- 添加了broadcast_to实验性操作
- 为add操作添加了uint16支持
数据类型扩展：为关系运算和零比较操作添加了整型支持，丰富了操作符的数据类型兼容性。

在系统稳定性方面，本次更新包含了多项重要修复：

新版本增强了开发者工具链：

从本次更新可以看出，Tenstorrent/tt-metal项目正朝着以下几个方向发展：

这个版本为Tenstorrent硬件平台带来了显著的性能提升和功能扩展，同时也为未来的架构演进奠定了坚实基础。项目团队在保持系统稳定性的同时，不断推进技术创新，值得开发者关注和尝试。

登录后查看全文