最完整的Trae Agent日志分析指南：从海量输出中精准提取关键信息

2026-02-04 04:39:37作者：薛曦旖Francesca

你是否还在为Trae Agent的海量日志输出而困扰？当代理执行复杂任务时，成百上千行的日志让你难以快速定位问题所在？本文将系统介绍如何从Trae Agent的轨迹记录（Trajectory）中提取关键信息，帮助你在3分钟内完成常规需要30分钟的故障排查工作。读完本文，你将掌握日志结构解析、关键指标提取、异常检测和可视化分析的全套技能。

日志分析的核心价值

Trae Agent作为基于大型语言模型（LLM）的通用软件开发任务代理，其日志记录了代理执行过程中的每一个决策和动作。通过分析这些日志，你可以：

追踪代理的思考过程，理解其决策逻辑
识别性能瓶颈，优化代理执行效率
排查任务失败原因，快速定位问题
积累成功经验，改进提示词设计

Trae Agent的日志系统主要通过trajectory_recorder.py实现，该模块负责记录代理的完整执行轨迹。

日志文件结构解析

Trae Agent的日志文件采用JSON格式，默认保存在trajectories/目录下，文件名格式为trajectory_YYYYMMDD_HHMMSS.json。日志文件包含以下核心部分：

{
  "task": "任务描述",
  "start_time": "开始时间",
  "end_time": "结束时间",
  "provider": "LLM提供商",
  "model": "使用的模型",
  "max_steps": "最大步骤数",
  "llm_interactions": "LLM交互记录",
  "agent_steps": "代理执行步骤",
  "success": "任务是否成功",
  "final_result": "最终结果",
  "execution_time": "执行时间(秒)"
}

关键数据结构

LLM交互记录：包含每次调用LLM的输入消息、响应内容、使用的token数等详细信息
代理执行步骤：记录代理每一步的状态、工具调用、工具返回结果和反思内容

下面是一个简化的日志结构示意图：

graph TD
    A[Trajectory Root] --> B[基本信息]
    A --> C[LLM交互记录]
    A --> D[代理执行步骤]
    C --> E[输入消息]
    C --> F[响应内容]
    C --> G[Token使用统计]
    D --> H[步骤编号]
    D --> I[状态]
    D --> J[工具调用]
    D --> K[工具结果]
    D --> L[反思内容]

关键信息提取方法

1. 基本执行信息提取

要快速了解任务的整体执行情况，可以提取以下基本信息：

import json

def extract_basic_info(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    return {
        "任务描述": data["task"],
        "开始时间": data["start_time"],
        "结束时间": data["end_time"],
        "执行时长": f"{data['execution_time']:.2f}秒",
        "成功状态": data["success"],
        "使用模型": f"{data['provider']} {data['model']}",
        "步骤数": len(data["agent_steps"])
    }

2. Token使用分析

Trae Agent的日志详细记录了每次LLM调用的token使用情况，包括输入token、输出token等：

def analyze_token_usage(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    total_input = 0
    total_output = 0
    
    for interaction in data["llm_interactions"]:
        usage = interaction["response"]["usage"]
        total_input += usage["input_tokens"]
        total_output += usage["output_tokens"]
    
    return {
        "总输入Token": total_input,
        "总输出Token": total_output,
        "总Token": total_input + total_output,
        "平均每步Token": (total_input + total_output) / len(data["agent_steps"]) if data["agent_steps"] else 0
    }

3. 工具调用统计

Trae Agent通过调用各种工具完成任务，日志中记录了所有工具调用及其结果：

def analyze_tool_usage(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    tool_stats = {}
    
    for step in data["agent_steps"]:
        if step["tool_calls"]:
            for call in step["tool_calls"]:
                tool_name = call["name"]
                if tool_name not in tool_stats:
                    tool_stats[tool_name] = {
                        "调用次数": 0,
                        "成功次数": 0
                    }
                tool_stats[tool_name]["调用次数"] += 1
                
                # 查找对应的工具结果
                if step["tool_results"]:
                    for result in step["tool_results"]:
                        if result["call_id"] == call["call_id"] and result["success"]:
                            tool_stats[tool_name]["成功次数"] += 1
    
    return tool_stats

异常检测与故障排查

常见错误类型

通过分析日志，我们可以识别出Trae Agent常见的几种错误类型：

工具调用失败：工具返回success=false
LLM响应异常：finish_reason包含error
步骤超时：单步执行时间过长
Token超限：接近或超过模型的最大token限制

错误定位示例

def detect_errors(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    errors = []
    
    for i, step in enumerate(data["agent_steps"]):
        if step["error"]:
            errors.append({
                "步骤": i+1,
                "类型": "步骤错误",
                "信息": step["error"]
            })
        
        if step["tool_results"]:
            for result in step["tool_results"]:
                if not result["success"]:
                    errors.append({
                        "步骤": i+1,
                        "类型": "工具调用失败",
                        "工具": result["call_id"].split(":")[0],
                        "信息": result["error"]
                    })
    
    return errors

日志可视化工具

虽然Trae Agent本身不提供可视化工具，但你可以使用Python的matplotlib或seaborn库将日志数据可视化：

import matplotlib.pyplot as plt
import json

def visualize_token_usage(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    steps = []
    input_tokens = []
    output_tokens = []
    
    for i, interaction in enumerate(data["llm_interactions"]):
        steps.append(i+1)
        usage = interaction["response"]["usage"]
        input_tokens.append(usage["input_tokens"])
        output_tokens.append(usage["output_tokens"])
    
    plt.figure(figsize=(12, 6))
    plt.bar([s-0.2 for s in steps], input_tokens, width=0.4, label='输入Token')
    plt.bar([s+0.2 for s in steps], output_tokens, width=0.4, label='输出Token')
    plt.xlabel('交互次数')
    plt.ylabel('Token数量')
    plt.title('Token使用趋势')
    plt.legend()
    plt.show()

高级分析技巧

1. 轨迹比较分析

当你对同一任务运行多次或尝试不同参数时，可以比较不同轨迹文件找出性能差异：

def compare_trajectories(paths):
    results = {}
    
    for path in paths:
        with open(path, 'r') as f:
            data = json.load(f)
        
        results[path] = {
            "执行时间": data["execution_time"],
            "成功状态": data["success"],
            "步骤数": len(data["agent_steps"]),
            "总Token": sum(
                interaction["response"]["usage"]["input_tokens"] + 
                interaction["response"]["usage"]["output_tokens"] 
                for interaction in data["llm_interactions"]
            )
        }
    
    return results

2. 自动化分析脚本

你可以创建一个完整的分析脚本，整合上述所有功能：

#!/bin/bash
# analyze_trajectory.sh

if [ $# -ne 1 ]; then
    echo "用法: $0 <trajectory_file>"
    exit 1
fi

python - <<END
import json
import sys
from pprint import pprint

def analyze(trajectory_path):
    with open(trajectory_path, 'r') as f:
        data = json.load(f)
    
    print("=== 基本信息 ===")
    pprint({
        "任务": data["task"],
        "状态": "成功" if data["success"] else "失败",
        "执行时间": f"{data['execution_time']:.2f}秒",
        "步骤数": len(data["agent_steps"]),
        "模型": f"{data['provider']} {data['model']}"
    })
    
    # 添加更多分析...

analyze(sys.argv[1])
END "$1"