Google AI JavaScript SDK 使用教程

2026-01-16 10:31:32作者：何将鹤

1. 项目介绍

Google AI JavaScript SDK 是一个专为 JavaScript 开发者设计的工具包，旨在简化与 Google Gemini API 的集成。Gemini API 提供了访问由 Google DeepMind 创建的 Gemini 模型的能力。这些模型从设计之初就支持多模态处理，能够无缝地处理文本、图像和代码。

该 SDK 主要用于 Node.js 和 TypeScript 环境，帮助开发者快速构建基于 Gemini 模型的应用。需要注意的是，直接在客户端应用中使用该 SDK 仅推荐用于原型开发。如果涉及到计费，强烈建议在服务器端调用 Gemini API，以确保 API 密钥的安全。

2. 项目快速启动

安装 SDK

首先，通过 npm 安装 Google AI JavaScript SDK：

npm install @google/generative-ai

初始化模型

在项目中引入 SDK 并初始化模型：

const [ GoogleGenerativeAI ] = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });

运行提示

使用模型生成内容：

const prompt = "Does this look store-bought or homemade?";
const image = {
  inlineData: {
    data: Buffer.from(fs.readFileSync("cookie.png")).toString("base64"),
    mimeType: "image/png"
  }
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());

3. 应用案例和最佳实践

文本生成

使用 Gemini 模型生成文本内容：

const prompt = "Write a short story about a robot learning to cook.";
const result = await model.generateContent({prompt});
console.log(result.response.text());

图像分析

结合图像和文本提示进行分析：

const prompt = "Describe the image in detail.";
const image = {
  inlineData: {
    data: Buffer.from(fs.readFileSync("landscape.jpg")).toString("base64"),
    mimeType: "image/jpeg"
  }
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());

代码生成

生成或优化代码片段：

const prompt = "Generate a function to sort an array of numbers in JavaScript.";
const result = await model.generateContent({prompt});
console.log(result.response.text());