Guidance项目实战：高效处理大模型推理与结构化输出

2025-05-10 14:33:34作者：宣聪麟

在自然语言处理领域，微软开源的Guidance项目为大型语言模型(LLM)的交互提供了优雅的解决方案。本文将通过典型应用场景，深入解析如何利用Guidance实现高效推理和结构化输出。

核心功能解析

Guidance的核心价值在于简化LLM交互流程，主要提供三大核心能力：

对话管理：通过system/user/assistant上下文管理器，清晰划分对话角色
结构化输出：支持选择(select)和JSON格式输出
批处理支持：可轻松应用于列表数据的循环处理

典型应用场景实现

基础分类任务

以下示例展示如何实现姓名来源国家分类：

from guidance import guidance, models, gen, select, user, assistant, system

# 初始化模型（以Phi-3-mini为例）
lm = models.Transformers("microsoft/Phi-3-mini-4k-instruct", trust_remote_code=True, echo=False)

@guidance
def get_origin(lm, name):
    with system():
        lm += """任务说明：根据姓名推测最可能的来源国家
        可选国家：'United States', 'India', 'Brazil'"""
    with user():
        lm += f"姓名：{name}"
    with assistant():
        lm += "最可能来源国家：" + select(["India", "Brazil", "United States"], name="country")
    return lm

# 批量处理示例
name_list = ["张三", "李四", "王五"]
results = [lm + get_origin(name) for name in name_list]

结构化JSON输出

对于需要复杂结构输出的场景，Guidance的json功能配合Pydantic模型可完美解决：

from guidance import json as g_json
from pydantic import BaseModel

# 定义输出结构
class SolutionStep(BaseModel):
    reasoning: str
    operation: str

class MathSolution(BaseModel):
    steps: list[SolutionStep]
    final_answer: str

@guidance
def solve_math(lm, problem):
    with system():
        lm += "请用JSON格式分步解决数学问题，包含最终答案"
    with user():
        lm += f"数学问题：{problem}"
    with assistant():
        lm += g_json("solution", schema=MathSolution)
    return lm

# 使用示例
solution = lm + solve_math("(15 + 5) × 2")