Python GenAI 1.22.0版本发布：视频生成与图像增强能力升级

2025-06-28 22:50:22作者：仰钰奇

Google Gen AI Python SDK provides an interface for developers to integrate Google's generative models into their Python applications.

项目地址：https://gitcode.com/gh_mirrors/py/python-genai

Google的Python GenAI项目是一个专注于生成式人工智能的Python SDK，它为开发者提供了访问Google最新AI模型的能力。该项目持续迭代更新，为开发者带来更强大的AI功能和更便捷的开发体验。

核心功能增强

本次1.22.0版本带来了多项重要更新，特别是在多媒体内容生成方面有了显著提升：

视频生成质量控制：新增了compressionQuality枚举参数，开发者现在可以更精细地控制生成的视频质量。这一改进使得在需要不同质量等级的视频场景下，如社交媒体分享或专业演示，都能获得最佳效果。
图像增强能力扩展：在图像放大功能中引入了两个新字段：
- enhance_input_image：允许开发者选择是否对输入图像进行增强处理
- image_preservation_factor：提供对图像保真度的控制参数这些改进使得图像放大过程更加可控，开发者可以根据需求在细节增强和原始特征保留之间找到平衡点。

开发者体验优化

响应头信息访问：现在开发者可以访问generateContent方法和generateContentStream的响应头信息，这为调试和监控API调用提供了更多上下文信息。
JSON Schema支持：GenerateContentConfig中现在公开了responseJsonSchema，这一改进使得开发者能够更好地理解和验证API返回的数据结构。
Pydantic对象表示改进：优化了Pydantic对象的__repr__方法，使得在开发和调试过程中能够更清晰地查看对象内容。
IntEnum支持：在处理JSON schema时新增了对IntEnum的支持，这提高了类型系统的灵活性和表达能力。

批处理任务管理

本次更新引入了对批处理任务的全生命周期管理支持，开发者现在可以通过API：

创建批处理任务
获取批处理任务状态
列出所有批处理任务
取消正在进行的批处理任务

这一功能特别适合需要处理大量生成任务的企业级应用场景。

问题修复与稳定性提升

流式响应改进：修复了在启用思维摘要功能时，流式响应中内容块历史记录丢失的问题，确保了数据的完整性。
Blob输入处理：修正了使用Blob类型作为输入时的send_client_content函数行为，提高了API的健壮性。

文档完善

图像生成文档：改进了图像生成相关的文档说明，使开发者更容易理解和使用相关功能。
thinking_budget参数：更新了thinking_budget参数的描述，更准确地解释了其在模型推理过程中的作用。

Python GenAI 1.22.0版本的这些更新，进一步强化了其在生成式AI领域的地位，为开发者构建更复杂、更可靠的AI应用提供了坚实基础。特别是多媒体处理能力的增强，使得在创意内容生成、数字媒体处理等场景下的应用变得更加得心应手。

Google Gen AI Python SDK provides an interface for developers to integrate Google's generative models into their Python applications.

项目地址：https://gitcode.com/gh_mirrors/py/python-genai

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。