Burr项目中的流式输出功能设计与实现
2025-07-10 13:24:13作者:宣利权Counsellor
概述
在现代LLM应用开发中,流式输出是一个关键需求。Burr项目通过创新的设计,为开发者提供了优雅的流式输出解决方案。本文将深入解析Burr框架中流式输出功能的设计思路、API演进和实现细节。
核心设计理念
Burr团队在设计流式输出功能时,主要考虑了以下几个关键点:
- 即时性与完整性:既要支持实时流式输出,又要保证最终结果的完整性
- 状态管理:流式输出过程中如何与Burr的状态管理机制协同工作
- API简洁性:提供直观易用的API接口,降低开发者学习成本
API演进历程
初始方案:Stream容器
最初设计考虑引入专门的Stream容器来包装生成器:
@action(writes=["response", "chat_history"])
def streaming_text_response(state: State, prompt: str) -> tuple[dict, State]:
generator = query_streaming(...).stream
stream = Stream.string(generator)
result = {"response": generator}
return result, state.update(response=generator).append(chat_history=result)
这种方案虽然可行,但引入了额外的概念和复杂度,不够Pythonic。
优化方案:直接使用生成器
经过深入讨论,团队决定利用Python生成器的原生特性:
@action(reads=["query"], writes=["response"])
def streaming_output_action(state: State) -> Generator[dict, None, Tuple[dict, State]]:
buffer = []
for word in ["hello", "world", "this", "is", "a", "test"]:
buffer.append(word)
yield {"response": word}
response = " ".join(buffer)
return {"response": response}, state.update(response=response)
这种设计更加简洁,充分利用了Python语言特性,特别是生成器的yield和return结合使用的特性。
最终API设计
Burr最终确定的流式输出API包含同步和异步两种形式:
同步API
result_generator = app.stream_result(halt_after=...)
for result in result_generator: # 获取中间结果
yield result['...']
action, state, result = result_generator.get() # 阻塞直到完成
异步API
result_generator = app.astream_result(halt_after=...)
async for result in result_generator: # 获取中间结果
yield result['...']
action, state, result = result_generator.get() # 阻塞直到完成
关键技术实现
-
生成器返回值处理:利用生成器可以同时
yield和return的特性,yield用于流式输出中间结果,return用于返回最终结果和状态 -
状态管理:流式处理过程中,状态更新会被延迟到生成器完全执行完毕
-
生命周期控制:
halt_before和halt_after参数控制执行流程- 创建
StreamingResultContainer来管理流式结果
-
异常处理:确保在流式输出中断时,系统状态能够保持一致
最佳实践
- 流式LLM响应:
@action(reads=["prompt"], writes=["response"])
def streaming_llm_response(state: State) -> Generator[dict, None, Tuple[dict, State]]:
buffer = ""
for token in query_llm(state["prompt"]):
buffer += token
yield {"response": token}
return {"response": buffer}, state.update(response=buffer)
- 进度指示器:
@action(writes=["progress"])
def long_running_task(state: State) -> Generator[dict, None, Tuple[dict, State]]:
for i in range(100):
# 执行任务的一部分
yield {"progress": i}
return {"progress": 100}, state.update(progress=100)
设计考量
-
同步优先:当前版本优先实现了同步生成器支持,异步支持将在后续版本中完善
-
中间结果处理:对于中间步骤的流式输出,框架会自动执行完生成器
-
钩子执行时机:确保步骤完成钩子只在生成器完全执行后触发
总结
Burr的流式输出功能通过巧妙利用Python生成器特性,为开发者提供了强大而简洁的API。这种设计既满足了实时流式输出的需求,又与Burr的状态管理机制完美融合,为构建复杂的流式应用提供了坚实基础。随着异步支持的完善,这一功能将更加强大和灵活。
登录后查看全文
热门项目推荐
相关项目推荐
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-OCRDeepSeek-OCR是一款以大语言模型为核心的开源工具,从LLM视角出发,探索视觉文本压缩的极限。Python00
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Jinja00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
项目优选
收起
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
278
2.57 K
deepin linux kernel
C
24
6
React Native鸿蒙化仓库
JavaScript
223
302
Ascend Extension for PyTorch
Python
105
135
暂无简介
Dart
568
127
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
599
164
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.03 K
607
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.03 K
448
openGauss kernel ~ openGauss is an open source relational database management system
C++
154
205
一个用于服务器应用开发的综合工具库。
- 零配置文件
- 环境变量和命令行参数配置
- 约定优于配置
- 深刻利用仓颉语言特性
- 只需要开发动态链接库,fboot负责加载、初始化并运行。
Cangjie
283
26