Guardrails项目中的流式JSON输出验证增强方案

2025-06-11 19:37:31作者：农烁颖Land

背景介绍

在现代AI应用开发中，Guardrails作为一个强大的验证框架，能够确保大型语言模型(LLM)的输出符合预期格式和内容要求。其中，流式处理能力尤为重要，它允许开发者实时获取和处理模型输出，而不必等待完整响应生成完毕。

Guardrails目前支持对OpenAI调用和自定义LLM包装器的流式输出进行验证。当在guard调用中设置stream=True时，框架期望可调用对象返回一个生成器(产生数据块)。然而，在处理结构化(JSON)输出时，存在一个关键限制：

框架假设原始模型输出仅包含纯净的JSON数据，才能成功进行验证。如果原始输出包含任何附加文本，解析和验证过程就会失败。例如：

纯净JSON输出可以成功验证：

{
"name": "John Doe",
"age": 39
}

但包含附加文本的输出会导致验证失败：

这里是你请求的有效JSON对象：
{
"name": "John Doe",
"age": 39
}

这种限制在实际应用中带来了几个问题：

流式验证的健壮性不足，过度依赖原始LLM输出纯净JSON
支持的使用场景和提供商有限。测试表明，只有部分OpenAI模型(gpt-3.5-turbo、gpt-4-turbo等)能在详细提示下产生纯净JSON输出，许多开源模型即使使用相同提示也无法做到

针对上述问题，我们提出以下增强方案：

在StreamRunner工作流中添加两个关键检查点：
- 检查点1：分析每个数据块，等待出现开放标签(可选包含代码类型)或"{"字符，忽略之前的所有数据块
- 检查点2：检测"}"或闭合标签，忽略之后的所有数据块
技术实现要点：
- 修改现有的JSON提取逻辑，使其能够处理非纯净JSON输出
- 增强流式处理能力，使其能够智能识别和提取嵌入在文本中的JSON内容
- 保持现有API的兼容性，确保不影响已有功能