Bedrock Access Gateway 使用教程
2024-09-22 02:04:42作者:贡沫苏Truman
1、项目介绍
Bedrock Access Gateway(BAG)是一个开源项目,旨在提供一个开箱即用、兼容OpenAI的代理功能,帮助用户轻松无缝地从OpenAI迁移到Amazon Bedrock。Amazon Bedrock服务支持一系列领先的基础模型,为客户提供多种选择,满足不同业务场景的需求。通过BAG,用户无需修改现有代码即可使用Amazon Bedrock的多种大型语言模型(LLM)。
2、项目快速启动
以下是快速启动Bedrock Access Gateway的步骤:
步骤 1:创建自定义API密钥(可选)
- 打开AWS管理控制台,导航到系统管理服务。
- 在左侧导航栏中,点击“参数存储”。
- 点击“创建参数”按钮。
- 在“创建参数”窗口中,选择以下选项:
- 名称:输入参数的描述性名称(例如:“BedrockProxyAPIKey”)。
- 描述:可选,提供参数的描述。
- 级别:选择“标准”。
- 类型:选择“SecureString”。
- 值:输入任何无空格的字符串。
- 点击“创建参数”。
- 记录您使用的参数名称(例如:“BedrockProxyAPIKey”),您将在下一步中使用它。
步骤 2:部署CloudFormation堆栈
- 登录AWS管理控制台,切换到要部署CloudFormation堆栈的区域。
- 点击以下按钮以在所选区域启动CloudFormation堆栈:
- 在“指定堆栈详情”页面上,提供以下信息:
- 堆栈名称:如有需要,更改堆栈名称。
- ApiKeyParam(如果您在步骤1中设置了API密钥):输入您用于存储API密钥的参数名称(例如:“BedrockProxyAPIKey”)。 如果您没有设置API密钥,请留空此字段。
- 点击“下一步”。
- 在“配置堆栈选项”页面上,您可以保留默认设置或根据需要自定义。
- 点击“下一步”。
- 在“审阅”页面上,审阅您即将创建的堆栈详情。
- 勾选底部的“我确认AWS CloudFormation可能会创建IAM资源”复选框。
- 点击“创建堆栈”。
一旦部署完成,点击CloudFormation堆栈并转到“输出”选项卡,您可以找到API Base URL。
步骤 3:使用API
部署后,您可以使用以下代码示例来调用API:
export OPENAI_API_KEY=<API key>
export OPENAI_BASE_URL=<API base url>
curl $OPENAI_BASE_URL/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '[ "model": "anthropic_claude-3-sonnet-20240229-v1:0", "messages": [ [ "role": "user", "content": "Hello" ] ] ]'
3、应用案例和最佳实践
应用案例
- 使用Bedrock Access Gateway将现有的OpenAI API调用无缝迁移到Amazon Bedrock。
- 在不直接支持Amazon Bedrock的开源项目或工具中,通过代理使用Amazon Bedrock模型。
最佳实践
- 在部署前,确保您的AWS账户有访问Amazon Bedrock模型的权限。
- 确保在部署过程中提供正确的API密钥和参数。
4、典型生态项目
目前,Bedrock Access Gateway项目作为一个开源解决方案,已经成为Amazon Bedrock生态系统中的一部分,它可以帮助开发者在不同的场景下更加灵活地使用Amazon Bedrock的模型。随着项目的不断发展和社区的贡献,我们可以期待更多基于Bedrock Access Gateway的创新应用出现。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
FreeSql功能强大的对象关系映射(O/RM)组件,支持 .NET Core 2.1+、.NET Framework 4.0+、Xamarin 以及 AOT。C#00
项目优选
收起
deepin linux kernel
C
27
14
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
659
4.26 K
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.54 K
894
Ascend Extension for PyTorch
Python
503
609
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
391
286
暂无简介
Dart
905
218
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
昇腾LLM分布式训练框架
Python
142
168
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
939
862
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
1.33 K
108