Anthropic SDK Python 中流式消息输出令牌计数问题解析

2025-07-07 15:03:48作者：牧宁李

探索 Anthropic SDK for Python，轻松访问Anthropic REST API，适用于Python 3.7+。库内含类型定义、同步和异步客户端，集成httpx，助你无缝交互。通过python-dotenv管理API密钥，保持安全。支持流式响应与Server Side Events，提供便利的工具使用功能，覆盖AWS Bedrock和Google Vertex AI。智能错误处理，自动重试机制，自定义超时设置。启用日志调试，提升开发体验。立即开始你的对话式AI应用之旅！

项目地址：https://gitcode.com/gh_mirrors/an/anthropic-sdk-python

在 Anthropic SDK Python 项目中，开发人员发现了一个关于流式消息处理中输出令牌计数不准确的技术问题。本文将深入分析该问题的本质、影响范围以及解决方案。

问题背景

当使用 Anthropic SDK 的流式消息处理功能时，stream.get_final_message()方法返回的output_tokens值始终为1，而实际上根据原始HTTP流响应，输出令牌数应为6。这种差异会导致使用此方法获取令牌使用情况的开发者得到不准确的数据。

技术细节分析

在流式处理过程中，API会发送多个事件：

message_start事件：包含初始令牌计数(output_tokens=1)
多个content_block_delta事件：包含消息内容的增量更新
message_delta事件：包含最终令牌计数(output_tokens=6)
message_stop事件：标记流结束

问题的根源在于SDK最初仅捕获了message_start事件中的令牌计数，而忽略了后续message_delta事件中提供的最终准确计数。

影响范围

这个问题会影响：

需要精确计算API使用成本的应用程序
监控和分析模型使用情况的系统
基于令牌使用量进行计费的集成方案

解决方案

Anthropic团队通过修改_messages.py文件中的accumulate_event方法解决了这个问题。修复后的版本会正确捕获最终的令牌计数，确保get_final_message()返回的值与直接API调用一致。

验证方法

开发者可以通过以下方式验证修复效果：

比较流式处理和非流式处理的令牌计数
检查原始HTTP流响应中的事件序列
使用相同的输入参数进行并行测试

最佳实践建议

对于生产环境，建议使用最新版本的SDK
在关键计费场景中，考虑双重验证机制
定期检查API响应中的原始数据以确保准确性

这个问题展示了在流式API处理中维护准确元数据的挑战，也体现了开源社区通过issue报告和PR贡献共同改进项目的价值。

anthropic-sdk-python

项目地址：https://gitcode.com/gh_mirrors/an/anthropic-sdk-python

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

758