Guidance项目中的模型响应处理技巧

2025-05-10 09:06:12作者：田桥桑Industrious

在Guidance项目中，处理大型语言模型(LLM)的响应输出是一个常见需求。许多开发者希望简单地获取模型生成的最终文本结果，而不需要处理复杂的中间过程或流式输出。本文将详细介绍几种在Guidance中高效获取和处理模型响应的方法。

基础响应获取

最基本的场景是获取模型对特定问题的直接回答。Guidance提供了简洁的语法来实现这一需求：

from guidance import guidance, models, select, user, assistant, system

lm = models.Transformers("microsoft/Phi-3-mini-4k-instruct", trust_remote_code=True, echo=False)

@guidance
def get_origin(lm, name):
    with system():
        lm += "确定名字最可能的来源国家"
    with user():
        lm += f"名字: {name}"
    with assistant():
        lm += "来源国家可能是: " + select(["印度", "巴西", "美国"], name="country")
    return lm

name_list = ["张三", "李四", "王五"]
countries = []
for name in name_list:
    result = lm + get_origin(name)
    countries.append(result['country'])

这种方法特别适合分类任务，其中select函数限定了模型只能从给定选项中选择回答，结果存储在指定的变量名中。

结构化JSON响应处理

对于需要结构化输出的场景，Guidance提供了json函数，可以与Pydantic模型或JSON Schema配合使用：

from guidance import json as g_json
from pydantic import BaseModel

class 解题步骤(BaseModel):
    解释: str
    输出: str

class 数学解答(BaseModel):
    步骤: list[解题步骤]
    最终答案: str

@guidance
def 数学助手(lm, 问题):
    with system():
        lm += "以JSON格式写出解题步骤和最终答案"
    with user():
        lm += f"数学问题: {问题}"
    with assistant():
        lm += g_json("json_答案", schema=数学解答)
    return lm

解答 = lm + 数学助手("(22 + 8) * 5")
解析结果 = json.loads(解答['json_答案'])

这种方法确保了输出的结构化，便于后续程序处理，同时保持了生成内容的灵活性。

响应处理的最佳实践

明确输出范围：使用with语句块明确界定系统指令、用户输入和助手响应的范围
变量命名：为关键输出指定有意义的变量名，便于后续引用
结果提取：通过字典键或属性访问方式获取特定部分的生成内容
类型转换：对于JSON输出，使用标准库进行解析和类型转换
批量处理：结合循环结构实现多个输入的批量处理

Guidance的设计理念是平衡灵活性和易用性，开发者可以根据具体需求选择简单直接的响应获取方式，或者使用更高级的结构化输出功能。理解这些核心模式后，就能高效地处理各种模型响应场景。

guidance

A guidance language for controlling large language models.

项目地址：https://gitcode.com/gh_mirrors/gu/guidance

登录后查看全文

Guidance项目中的模型响应处理技巧

基础响应获取

结构化JSON响应处理

响应处理的最佳实践

项目优选