guidance-for-multi-provider-generative-ai-gateway-on-aws 的项目扩展与二次开发

2025-05-27 06:08:58作者：明树来

项目的基础介绍

guidance-for-multi-provider-generative-ai-gateway-on-aws 是一个基于 AWS 的开源项目，旨在提供一个简单的 Terraform 部署，将 LiteLLM 部署到 Amazon Elastic Container Service (ECS) 和 Amazon Elastic Kubernetes Service (EKS) 平台上。该项目预配置了默认设置，使得大多数用户能够快速开始使用 LiteLLM。它不仅支持 LiteLLM 的基本功能，还提供了额外的特性，如 AWS Bedrock 接口、AWS Bedrock Managed Prompts、Chat History 以及支持 Okta Oauth 2.0 JWT Token Auth。

项目的核心功能

该项目的主要功能包括：

提供一个统一的接口来访问所有语言模型（LLM）提供商，无需修改代码即可尝试不同的模型。
在用户、团队和 API 密钥级别集中管理和跟踪 LLM 使用情况。
配置预算和速率限制，限制对特定模型的访问，并在多个提供商之间设置重试/故障转移路由逻辑。
实现成本节约措施，如提示缓存。
提供安全特性，如支持 AWS Bedrock Guardrails。
提供一个 UI 界面，管理员可以配置用户和团队，用户可以生成 API 密钥并在聊天界面中测试不同的 LLM。

项目使用了哪些框架或库？

该项目使用了以下框架或库：

Terraform：用于部署和管理 AWS 资源。
LiteLLM：提供一致的接口访问所有 LLM 提供商。
Amazon Web Application Firewall (WAF)：保护应用程序免受常见网络攻击和机器人侵害。
Amazon Elastic Container Service (ECS) 和 Amazon Elastic Kubernetes Service (EKS)：用于运行容器化应用程序。
Amazon Bedrock：提供模型访问、防护栏、提示缓存和路由等功能。
Amazon ElastiCache、Amazon Relational Database Service (RDS)、AWS Secrets Manager：用于存储和管理配置设置、敏感信息等。

项目的代码目录及介绍

项目的代码目录结构如下：

config/：包含配置文件。
litellm-fake-llm-load-testing-server-terraform/：用于创建假的 LLM 负载测试服务器的 Terraform 配置。
litellm-private-load-balancer-ec2-terraform/：用于创建私有负载均衡器的 Terraform 配置。
litellm-s3-log-bucket-terraform/：用于创建日志存储桶的 Terraform 配置。
litellm-terraform-stack/：包含 Terraform 堆栈配置。
middleware/：包含中间件代码。
scripts/：包含各种脚本文件。
tests/：包含测试代码。
.env.template：环境变量模板文件。
Dockerfile：用于构建容器镜像。
README.md：项目说明文件。