TVM项目中AutoScheduler最佳调度选择机制解析

2025-05-18 08:37:42作者：管翌锬

背景介绍

在深度学习编译器TVM的自动调度优化过程中，用户可能会遇到一个看似矛盾的现象：多次运行相同的自动调度脚本会产生不同的性能评估结果，但最终生成的底层TIR代码却保持不变。这种现象实际上揭示了TVM自动调度器（特别是Ansor模块）的一个重要工作机制。

现象分析

当用户在Arm64架构上反复运行矩阵乘法（matmul）的自动调度脚本时，可以观察到：

每次运行都会产生10个不同的调度方案评估结果（MeasureResult No.1-No.10）
这些评估结果显示出不同的性能指标（如运行时间、GFLOPS等）
但最终通过tvm.lower输出的TIR代码却始终保持一致

技术原理

这种现象背后的核心机制在于TVM的自动调度器采用了"数据库积累"的工作模式：

历史记录保存：Ansor和Meta-Schedule都会将每次调度的日志信息追加到数据库中（如matmul.json文件）
全局最优选择：apply_best方法会从整个数据库历史记录中选择最优方案，而不仅仅是当前运行的评估结果
性能继承：只要数据库文件存在，后续运行就会基于历史最优结果继续优化

验证方法

要验证这一机制，可以执行以下步骤：

删除自动生成的数据库文件（如matmul.json）
重新运行自动调度脚本
此时可以观察到输出的TIR代码确实会发生变化
再次运行脚本时，TIR代码又会保持稳定

技术演进

需要注意的是，TVM社区已经逐步淘汰了Ansor调度器，转向更先进的Meta-Schedule架构。Meta-Schedule在Ansor的基础上进行了多项改进：

更高效的搜索算法
更智能的代价模型
更完善的硬件特性支持
更稳定的性能表现

实践建议

对于TVM使用者来说，理解这一机制有助于：

合理管理调度数据库文件
在开发过程中适时清理历史记录以获得新的优化方向
理解自动调度器的长期学习特性
平滑过渡到Meta-Schedule架构

通过深入理解TVM自动调度器的工作机制，开发者可以更好地利用这一强大工具来优化深度学习模型的部署性能。

tvm

Open Machine Learning Compiler Framework

项目地址：https://gitcode.com/gh_mirrors/tv/tvm

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

392

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

986