ai-edge-apis 的项目扩展与二次开发
项目的基础介绍
ai-edge-apis 是由 Google AI Edge 提供的一个开源项目,它包含了一系列库和 SDKs,旨在帮助开发者轻松构建端到端的 应用程序,这些应用程序可以与 Google AI Edge 的 GenAI 管道集成。该项目提供了一个在设备上构建 Retrieval Augmented Generation (RAG) 管道的 SDK,以及一个允许设备上的大型语言模型 (LLM) 调用外部函数和 API 的 Function Calling SDK。
项目的核心功能
-
On-Device RAG SDK:为在设备上构建 RAG 管道提供了基础组件。这个 SDK 的模块化架构提供了易于使用的抽象和多样化的具体实现,目前支持 Java 语言。
-
On-Device Function Calling SDK:这个 SDK 使得开发者能够在设备上的 LLM 中使用函数调用。这允许模型生成结构化的函数调用来执行真实世界的操作,而不仅仅是生成文本。
项目使用了哪些框架或库?
项目主要使用了以下框架或库:
- Python:用于部分代码实现和开发。
- Java:用于 RAG SDK 的实现。
- C++:可能用于底层的一些功能实现。
- Starlark:可能用于构建和配置脚本。
- Jupyter Notebook:可能用于演示和文档。
- ANTLR:用于解析特定语言或格式。
项目的代码目录及介绍
项目的代码目录结构大致如下:
- examples:包含示例应用程序和代码片段。
- local_agents:可能包含本地代理相关的代码。
- third_party:包含第三方库和依赖。
- .bazelrc、.bazelversion、BUILD、MODULE.bazel、extensions.bzl、function_calling.bzl、rag_pipeline.bzl:这些文件与 Bazel 构建系统相关。
- requirements.txt、requirements_lock.txt:包含 Python 项目的依赖。
- Dockerfile:用于创建项目的 Docker 容器镜像。
- LICENSE:项目的许可文件。
- README.md:项目说明文件。
对项目进行扩展或者二次开发的方向
-
增加新的语言支持:目前 RAG SDK 只支持 Java,可以考虑增加对其他语言的支持。
-
集成更多 AI 功能:可以根据需要集成更多的 AI 功能,例如图像识别、自然语言处理等。
-
优化性能:对现有 SDK 进行性能优化,使其在设备上运行更加高效。
-
开发更多示例应用:为不同的使用场景开发更多的示例应用程序,帮助开发者更快地上手。
-
扩展 Function Calling SDK:增加更多的外部工具和 API 的支持,使模型能够执行更多类型的操作。
-
改进文档和指南:完善项目文档和开发指南,使二次开发更加容易。
通过这些扩展和二次开发的方向,ai-edge-apis 项目可以更好地服务于开发社区,推动边缘计算和人工智能的融合。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
FreeSql功能强大的对象关系映射(O/RM)组件,支持 .NET Core 2.1+、.NET Framework 4.0+、Xamarin 以及 AOT。C#00