Google Python GenAI 1.10.0版本发布：增强多模态与长文本处理能力

2025-06-28 21:00:13作者：胡唯隽

Google Python GenAI是一个基于Python的生成式AI开发库，它为开发者提供了访问Google最新生成式AI模型的接口。该项目简化了与Google AI模型的交互过程，支持文本、图像、视频等多种模态的生成和处理。

核心功能升级

多模态处理能力增强

1.10.0版本在多模态处理方面进行了多项改进。新增了对视频元数据处理的优化，移除了实验性警告标志，使视频生成功能更加稳定可靠。同时引入了媒体分辨率支持，开发者现在可以更精确地控制生成媒体的质量参数。

长文本处理优化

新版本特别关注了长文本处理的改进：

新增上下文窗口压缩功能(Context Window Compression)，有效解决了大模型处理长文本时的内存和性能问题
支持连续会话的滑动窗口机制，使模型能够更好地处理超长对话或文档
新增思考预算(thinking_budget)配置，允许开发者精细控制Gemini思考模型的资源分配

性能与稳定性提升

1.10.0版本在系统稳定性方面做了多项改进：

新增会话恢复功能，确保长时间运行的会话不会因网络问题而中断
完善了超时处理机制，当请求超时设置时会自动填充X-Server-Timeout头
文件上传功能现在支持从http_options或客户端配置超时时间(毫秒级)

元数据与监控增强

新版本丰富了系统监控和元数据收集能力：

在GenerateContentResponseUsageMetadata中新增流量类型标识
LiveServerMessage现在包含使用元数据(UsageMetadata)
Web GroundingChunk新增域名信息，提高了内容来源的可追溯性

适配器与模型支持

针对Gemini 2.0模型：

新增了适配器大小2的支持，为模型调优提供了更多灵活性
完善了语音检测配置类型，使语音处理更加精准

开发体验优化

1.10.0版本移除了多项功能的实验性警告标志，包括视频生成、操作API和实时API等，标志着这些功能已经达到生产就绪状态。这使得开发者可以更自信地在生产环境中使用这些功能。

这个版本的发布进一步巩固了Google Python GenAI作为生成式AI开发首选工具库的地位，特别是在处理复杂多模态内容和长文本场景下表现出色。开发者现在可以更轻松地构建需要处理视频、长文档等复杂内容的AI应用。

python-genai

Google Gen AI Python SDK provides an interface for developers to integrate Google's generative models into their Python applications.

项目地址：https://gitcode.com/gh_mirrors/py/python-genai

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

437

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Google Python GenAI 1.10.0版本发布：增强多模态与长文本处理能力

核心功能升级

多模态处理能力增强

长文本处理优化

性能与稳定性提升

元数据与监控增强

适配器与模型支持

开发体验优化

热门内容推荐

最新内容推荐

项目优选

Google Python GenAI 1.10.0版本发布：增强多模态与长文本处理能力

核心功能升级

多模态处理能力增强

长文本处理优化

性能与稳定性提升

元数据与监控增强

适配器与模型支持

开发体验优化

相关内容推荐

热门内容推荐

最新内容推荐

项目优选