AIstudioProxyAPI v3.5.7版本发布：新增图片多模态支持与Docker优化

2025-07-07 20:53:50作者：廉彬冶Miranda

Node.js+Playwright服务器，通过模拟 OpenAI API 的方式来访问 Google AI Studio 网页版，服务器无缝交互转发gemini模型对话。这使得兼容 OpenAI API 的客户端（如 Open WebUI, NextChat 等）可以使用 AI Studio 的无限额度及能力。经测试因无法绕过自动化检测故暂不支持无头模式启动实例

项目地址：https://gitcode.com/gh_mirrors/ai/AIstudioProxyAPI

AIstudioProxyAPI是一个开源项目，旨在为AI开发者和研究人员提供便捷的API服务，帮助用户更高效地访问和使用AI相关资源。该项目通过提供稳定可靠的接口，简化了AI开发过程中的各种复杂配置，让开发者能够专注于核心业务逻辑的实现。

核心更新内容

1. 图片多模态兼容性支持

本次3.5.7版本最重要的更新是新增了对图片多模态的兼容性支持。这项实验性功能允许API处理包含图片数据的请求，采用标准的base64编码格式传输图片信息。具体实现上，系统现在能够识别和处理"data:image/${base64}"格式的数据，这为开发多模态AI应用提供了更灵活的数据传输方式。

这项功能的加入意味着开发者现在可以通过API同时传输文本和图像数据，为构建更复杂的多模态AI应用（如图像描述生成、视觉问答等）提供了基础支持。需要注意的是，由于这是实验性功能，不同客户端的适配效果可能会有所差异，建议开发者在生产环境中充分测试后再进行部署。

2. Docker相关优化

本次更新对Docker支持进行了多项改进：

增加了Docker一键更新脚本，简化了容器化部署的维护流程
优化了Docker相关文档说明，使配置过程更加清晰明了
修正了README中关于Docker的部分内容，确保文档准确性

这些改进使得使用Docker部署AIstudioProxyAPI变得更加简单可靠，特别是对于需要频繁更新版本的场景，一键更新脚本大大减少了运维工作量。

技术实现细节

在图片多模态支持方面，项目采用了OpenAI的图片协议标准，通过base64编码将图片数据嵌入到请求中。这种实现方式有几个显著优势：

兼容性强：base64是广泛支持的编码格式，几乎所有的编程语言和平台都能处理
传输可靠：将二进制数据转换为文本格式，避免了二进制传输可能带来的问题
易于调试：编码后的数据可以直接查看，方便开发过程中的问题排查

对于Docker的优化，项目团队特别关注了用户体验，通过自动化脚本减少了手动操作步骤，降低了使用门槛。同时完善的文档也帮助用户更快上手，减少了配置过程中的困惑。

适用场景与建议

新版本的AIstudioProxyAPI特别适合以下场景：

需要同时处理文本和图像数据的多模态AI应用开发
使用容器化技术部署AI服务的场景
需要频繁更新API版本的环境

对于考虑使用图片多模态功能的开发者，建议：

先在测试环境中充分验证功能稳定性
注意不同客户端可能存在的兼容性差异
监控API性能，特别是处理大尺寸图片时的响应时间

总结

AIstudioProxyAPI v3.5.7版本通过引入图片多模态支持和优化Docker部署体验，进一步扩展了项目的应用场景和使用便利性。这些更新体现了项目团队对开发者需求的敏锐洞察和对技术趋势的及时跟进。随着多模态AI应用的兴起，这样的功能增强将为开发者构建更复杂的AI系统提供有力支持。

AIstudioProxyAPI

项目地址：https://gitcode.com/gh_mirrors/ai/AIstudioProxyAPI

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781