Google AI JavaScript SDK 使用教程
1. 项目介绍
Google AI JavaScript SDK 是一个专为 JavaScript 开发者设计的工具包,旨在简化与 Google Gemini API 的集成。Gemini API 提供了访问由 Google DeepMind 创建的 Gemini 模型的能力。这些模型从设计之初就支持多模态处理,能够无缝地处理文本、图像和代码。
该 SDK 主要用于 Node.js 和 TypeScript 环境,帮助开发者快速构建基于 Gemini 模型的应用。需要注意的是,直接在客户端应用中使用该 SDK 仅推荐用于原型开发。如果涉及到计费,强烈建议在服务器端调用 Gemini API,以确保 API 密钥的安全。
2. 项目快速启动
安装 SDK
首先,通过 npm 安装 Google AI JavaScript SDK:
npm install @google/generative-ai
初始化模型
在项目中引入 SDK 并初始化模型:
const [ GoogleGenerativeAI ] = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });
运行提示
使用模型生成内容:
const prompt = "Does this look store-bought or homemade?";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("cookie.png")).toString("base64"),
mimeType: "image/png"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
3. 应用案例和最佳实践
文本生成
使用 Gemini 模型生成文本内容:
const prompt = "Write a short story about a robot learning to cook.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
图像分析
结合图像和文本提示进行分析:
const prompt = "Describe the image in detail.";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("landscape.jpg")).toString("base64"),
mimeType: "image/jpeg"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
代码生成
生成或优化代码片段:
const prompt = "Generate a function to sort an array of numbers in JavaScript.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
4. 典型生态项目
1. Google AI Studio
Google AI Studio 是一个集成开发环境,专门用于构建和部署 AI 模型。它提供了丰富的工具和资源,帮助开发者快速上手并优化他们的 AI 项目。
2. Google Cloud AI Platform
Google Cloud AI Platform 提供了一个全面的平台,支持从模型训练到部署的全流程。它与 Google AI JavaScript SDK 无缝集成,使得开发者可以在云端高效地管理和扩展他们的 AI 应用。
3. TensorFlow.js
TensorFlow.js 是一个开源库,允许在浏览器和 Node.js 中运行机器学习模型。它与 Google AI JavaScript SDK 结合使用,可以进一步提升应用的性能和功能。
通过这些生态项目,开发者可以构建更加复杂和强大的 AI 应用,充分利用 Google 提供的先进技术和资源。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
FreeSql功能强大的对象关系映射(O/RM)组件,支持 .NET Core 2.1+、.NET Framework 4.0+、Xamarin 以及 AOT。C#00