ai-edge-apis 的项目扩展与二次开发
项目的基础介绍
ai-edge-apis 是由 Google AI Edge 提供的一个开源项目,它包含了一系列库和 SDKs,旨在帮助开发者轻松构建端到端的 应用程序,这些应用程序可以与 Google AI Edge 的 GenAI 管道集成。该项目提供了一个在设备上构建 Retrieval Augmented Generation (RAG) 管道的 SDK,以及一个允许设备上的大型语言模型 (LLM) 调用外部函数和 API 的 Function Calling SDK。
项目的核心功能
-
On-Device RAG SDK:为在设备上构建 RAG 管道提供了基础组件。这个 SDK 的模块化架构提供了易于使用的抽象和多样化的具体实现,目前支持 Java 语言。
-
On-Device Function Calling SDK:这个 SDK 使得开发者能够在设备上的 LLM 中使用函数调用。这允许模型生成结构化的函数调用来执行真实世界的操作,而不仅仅是生成文本。
项目使用了哪些框架或库?
项目主要使用了以下框架或库:
- Python:用于部分代码实现和开发。
- Java:用于 RAG SDK 的实现。
- C++:可能用于底层的一些功能实现。
- Starlark:可能用于构建和配置脚本。
- Jupyter Notebook:可能用于演示和文档。
- ANTLR:用于解析特定语言或格式。
项目的代码目录及介绍
项目的代码目录结构大致如下:
- examples:包含示例应用程序和代码片段。
- local_agents:可能包含本地代理相关的代码。
- third_party:包含第三方库和依赖。
- .bazelrc、.bazelversion、BUILD、MODULE.bazel、extensions.bzl、function_calling.bzl、rag_pipeline.bzl:这些文件与 Bazel 构建系统相关。
- requirements.txt、requirements_lock.txt:包含 Python 项目的依赖。
- Dockerfile:用于创建项目的 Docker 容器镜像。
- LICENSE:项目的许可文件。
- README.md:项目说明文件。
对项目进行扩展或者二次开发的方向
-
增加新的语言支持:目前 RAG SDK 只支持 Java,可以考虑增加对其他语言的支持。
-
集成更多 AI 功能:可以根据需要集成更多的 AI 功能,例如图像识别、自然语言处理等。
-
优化性能:对现有 SDK 进行性能优化,使其在设备上运行更加高效。
-
开发更多示例应用:为不同的使用场景开发更多的示例应用程序,帮助开发者更快地上手。
-
扩展 Function Calling SDK:增加更多的外部工具和 API 的支持,使模型能够执行更多类型的操作。
-
改进文档和指南:完善项目文档和开发指南,使二次开发更加容易。
通过这些扩展和二次开发的方向,ai-edge-apis 项目可以更好地服务于开发社区,推动边缘计算和人工智能的融合。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0168
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
BitCPM-CANN-8BBitCPM-CANN 是首个基于华为昇腾 NPU 原生构建的端到端 1.58 位(三值化)大语言模型训练系统。该系统将量化感知训练(QAT)集成到 Megatron-LM 框架中,并结合 MindSpeed 加速,覆盖了从自定义三值算子到基于昇腾 910B 的分布式并行训练的完整训练栈。Python00
MiniCPM5-1BMiniCPM5-1B,这是 MiniCPM5 系列的首款模型。它是一个专为端侧、本地部署和资源受限场景打造的 10 亿参数密集型 Transformer 模型,达到了 10 亿参数级开源模型的 SOTA 水平Jinja00
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0239