PyTorch Lightning中TensorBoard日志记录的正确使用方法

2025-05-05 22:32:43作者：郁楠烈Hubert

pytorch-lightning是一个高性能深度学习框架，专为训练、微调和部署AI模型设计。具备简洁稳定API，支持多GPU与TPU加速，实现轻松扩展。集成4大核心模块：PyTorch Lightning简化代码结构，分离科学与工程；Lightning Fabric提供专家级控制；Lightning Data快速分布式数据流处理；Lightning Apps助您构建AI产品及ML工作流程。利用自动化的硬件适配能力，减少重复劳动，确保实验可复现性，同时保持PyTorch灵活性，适用于专业研究到实际应用的全场景需求。

项目地址：https://gitcode.com/gh_mirrors/pyt/pytorch-lightning

在使用PyTorch Lightning进行深度学习模型训练时，TensorBoard是一个非常有用的可视化工具。然而，许多开发者在尝试记录模型计算图时会遇到一个常见错误。

问题现象

当开发者按照某些文档示例尝试使用log_graph方法时，可能会遇到如下错误：

Exception has occurred: AttributeError
'SummaryWriter' object has no attribute 'log_graph'

错误原因分析

这个错误通常源于对PyTorch Lightning日志记录接口的误解。开发者往往会错误地访问self.logger.experiment属性，而实际上应该直接使用self.logger。

正确使用方法

在PyTorch Lightning中，正确的TensorBoard日志记录方式应该是：

# 初始化TensorBoard日志记录器
tensorboard = TensorBoardLogger(save_dir="logs", log_graph=True)

# 在训练步骤中
def training_step(self, batch, batch_idx):
    # 训练逻辑...
    
    # 正确获取logger实例
    tensorboard = self.logger  # 注意不是self.logger.experiment
    
    # 创建输入示例
    prototype_array = torch.Tensor(32, 1, 28, 27)
    
    # 记录计算图
    tensorboard.log_graph(model=self, input_array=prototype_array)