如何在WandB项目中自定义日志输出方案

2025-05-24 22:37:49作者：凤尚柏Louis

The AI developer platform. Use Weights & Biases to train and fine-tune models, and manage models from experimentation to production.

项目地址：https://gitcode.com/gh_mirrors/wa/wandb

背景介绍

WandB是一个流行的机器学习实验跟踪工具，它默认会向终端输出大量运行信息。在实际项目中，我们经常需要将这些输出信息整合到自己的日志系统中，以便统一管理和分析。

问题分析

WandB默认使用自己的输出函数(termlog/termwarn/termerror)而非Python标准logging模块，这导致开发者无法直接通过Python的logging配置来捕获这些输出。虽然可以通过获取"wandb"日志器来添加处理器，但这种方法会捕获到大量调试信息，而无法精确控制需要记录的内容。

解决方案

我们可以通过重写WandB的输出函数来实现自定义日志记录。以下是具体实现步骤：

1. 创建自定义日志器

首先需要创建一个独立的日志器实例，并配置所需的处理器：

import logging
from rich.logging import RichHandler

# 创建自定义日志器
custom_logger = logging.getLogger("wandb_terminal")
custom_logger.setLevel(logging.INFO)
custom_logger.propagate = False  # 防止日志向上传播

# 添加Rich处理器用于控制台输出
rich_handler = RichHandler()
custom_logger.addHandler(rich_handler)

# 添加文件处理器用于持久化日志
file_handler = logging.FileHandler("wandb_redirected_terminal.log")
formatter = logging.Formatter("%(asctime)s - %(levelname)s - %(message)s")
file_handler.setFormatter(formatter)
custom_logger.addHandler(file_handler)

2. 重写WandB输出函数

保存原始函数引用，然后创建自定义函数来同时调用原始函数和自定义日志记录：

import wandb

# 保存原始函数引用
original_termlog = wandb.termlog
original_termwarn = wandb.termwarn
original_termerror = wandb.termerror

def custom_termlog(string="", newline=True, repeat=True):
    original_termlog(string)  # 保持原有终端输出
    if string:
        custom_logger.info(string)  # 记录到自定义日志器
        
def custom_termwarn(string="", newline=True, repeat=True):
    original_termwarn(string)
    if string:
        custom_logger.warning(string)
        
def custom_termerror(string="", newline=True, repeat=True):
    original_termerror(string)
    if string:
        custom_logger.error(string)

3. 替换WandB默认函数

# 替换WandB的默认输出函数
wandb.termlog = custom_termlog
wandb.termwarn = custom_termwarn
wandb.termerror = custom_termerror

4. 初始化WandB并测试

# 初始化WandB
wandb.init(project="misc-test")

# 测试日志输出
for i in range(10):
    wandb.log({"step": i})

wandb.finish()

技术要点解析

日志器隔离：创建独立的日志器实例可以避免干扰其他模块的日志配置。
函数重写：通过保存原始函数引用并创建包装函数，我们可以在保持原有功能的同时添加自定义行为。
日志级别控制：可以根据需要调整日志级别，只记录重要信息。
格式统一：通过自定义Formatter可以统一所有日志的输出格式。

扩展应用

这种技术方案不仅适用于WandB，也可以应用于其他使用自定义输出函数的库。通过类似的方法，我们可以：

将不同来源的日志统一到同一个系统中
添加额外的日志处理逻辑（如过滤敏感信息）
实现日志的多目的地输出（控制台、文件、网络等）
集成更丰富的日志展示工具（如Rich）

注意事项

确保在WandB初始化前完成函数替换
考虑线程安全性，特别是在多线程环境中
对于生产环境，建议添加日志轮转机制防止日志文件过大
可以根据项目需要调整日志格式和内容

通过这种方案，开发者可以灵活地将WandB的输出集成到自己的日志系统中，实现更专业的日志管理和分析。

The AI developer platform. Use Weights & Biases to train and fine-tune models, and manage models from experimentation to production.

项目地址：https://gitcode.com/gh_mirrors/wa/wandb

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统