Roo Code项目中Gemini 2.5 Flash模型的提示缓存功能解析

2025-05-18 23:08:44作者：舒璇辛Bertina

在Roo Code项目的最新版本3.14.3中，开发者发现了一个关于Gemini 2.5 Flash模型提示缓存功能的有趣现象。虽然官方文档显示该模型支持提示缓存功能，但在实际使用OpenRouter提供商时，这一功能却无法启用。

提示缓存是一种优化技术，它允许模型记住并重用之前处理过的提示，从而减少重复计算，提高响应速度。对于频繁使用相似提示的应用场景，这项功能可以显著提升性能并降低成本。

目前，Roo Code项目中Gemini 2.5 Pro模型已经完整支持提示缓存功能，用户可以在提供商设置中手动勾选"启用提示缓存"选项来激活这一特性。但需要注意的是，由于Google缓存机制可能导致响应延迟，该功能默认是关闭状态。

对于Gemini 2.5 Flash模型，虽然Google官方文档和OpenRouter都表示支持提示缓存，但在Roo Code的实现中，该功能尚未完全就绪。开发团队已经确认，一旦Google正式发布这一功能，他们将尽快在项目中提供支持。

值得关注的是，Roo Code团队正在积极开发对Vertex AI提供商的支持，预计在下一个版本中就会加入对Gemini 2.5 Flash模型提示缓存的完整实现。这将为开发者提供更多选择，可以根据项目需求在不同提供商之间灵活切换。

对于需要使用Gemini 2.5 Flash模型的开发者，目前建议暂时使用不支持提示缓存的版本，或者考虑切换到Gemini 2.5 Pro模型以获得完整的缓存功能支持。随着项目的持续更新，这一功能差异有望很快得到解决。

Roo-Code

Roo Code gives you a whole dev team of AI agents in your code editor.

项目地址：https://gitcode.com/GitHub_Trending/ro/Roo-Code

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

517

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

285

Roo Code项目中Gemini 2.5 Flash模型的提示缓存功能解析

相关内容推荐

热门内容推荐

项目优选