Google AI JavaScript SDK 使用教程
1. 项目介绍
Google AI JavaScript SDK 是一个专为 JavaScript 开发者设计的工具包,旨在简化与 Google Gemini API 的集成。Gemini API 提供了访问由 Google DeepMind 创建的 Gemini 模型的能力。这些模型从设计之初就支持多模态处理,能够无缝地处理文本、图像和代码。
该 SDK 主要用于 Node.js 和 TypeScript 环境,帮助开发者快速构建基于 Gemini 模型的应用。需要注意的是,直接在客户端应用中使用该 SDK 仅推荐用于原型开发。如果涉及到计费,强烈建议在服务器端调用 Gemini API,以确保 API 密钥的安全。
2. 项目快速启动
安装 SDK
首先,通过 npm 安装 Google AI JavaScript SDK:
npm install @google/generative-ai
初始化模型
在项目中引入 SDK 并初始化模型:
const [ GoogleGenerativeAI ] = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });
运行提示
使用模型生成内容:
const prompt = "Does this look store-bought or homemade?";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("cookie.png")).toString("base64"),
mimeType: "image/png"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
3. 应用案例和最佳实践
文本生成
使用 Gemini 模型生成文本内容:
const prompt = "Write a short story about a robot learning to cook.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
图像分析
结合图像和文本提示进行分析:
const prompt = "Describe the image in detail.";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("landscape.jpg")).toString("base64"),
mimeType: "image/jpeg"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
代码生成
生成或优化代码片段:
const prompt = "Generate a function to sort an array of numbers in JavaScript.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
4. 典型生态项目
1. Google AI Studio
Google AI Studio 是一个集成开发环境,专门用于构建和部署 AI 模型。它提供了丰富的工具和资源,帮助开发者快速上手并优化他们的 AI 项目。
2. Google Cloud AI Platform
Google Cloud AI Platform 提供了一个全面的平台,支持从模型训练到部署的全流程。它与 Google AI JavaScript SDK 无缝集成,使得开发者可以在云端高效地管理和扩展他们的 AI 应用。
3. TensorFlow.js
TensorFlow.js 是一个开源库,允许在浏览器和 Node.js 中运行机器学习模型。它与 Google AI JavaScript SDK 结合使用,可以进一步提升应用的性能和功能。
通过这些生态项目,开发者可以构建更加复杂和强大的 AI 应用,充分利用 Google 提供的先进技术和资源。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust099- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00