Google AI JavaScript SDK 使用教程
1. 项目介绍
Google AI JavaScript SDK 是一个专为 JavaScript 开发者设计的工具包,旨在简化与 Google Gemini API 的集成。Gemini API 提供了访问由 Google DeepMind 创建的 Gemini 模型的能力。这些模型从设计之初就支持多模态处理,能够无缝地处理文本、图像和代码。
该 SDK 主要用于 Node.js 和 TypeScript 环境,帮助开发者快速构建基于 Gemini 模型的应用。需要注意的是,直接在客户端应用中使用该 SDK 仅推荐用于原型开发。如果涉及到计费,强烈建议在服务器端调用 Gemini API,以确保 API 密钥的安全。
2. 项目快速启动
安装 SDK
首先,通过 npm 安装 Google AI JavaScript SDK:
npm install @google/generative-ai
初始化模型
在项目中引入 SDK 并初始化模型:
const [ GoogleGenerativeAI ] = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.API_KEY);
const model = genAI.getGenerativeModel({ model: "gemini-1.5-flash" });
运行提示
使用模型生成内容:
const prompt = "Does this look store-bought or homemade?";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("cookie.png")).toString("base64"),
mimeType: "image/png"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
3. 应用案例和最佳实践
文本生成
使用 Gemini 模型生成文本内容:
const prompt = "Write a short story about a robot learning to cook.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
图像分析
结合图像和文本提示进行分析:
const prompt = "Describe the image in detail.";
const image = {
inlineData: {
data: Buffer.from(fs.readFileSync("landscape.jpg")).toString("base64"),
mimeType: "image/jpeg"
}
};
const result = await model.generateContent({prompt, image});
console.log(result.response.text());
代码生成
生成或优化代码片段:
const prompt = "Generate a function to sort an array of numbers in JavaScript.";
const result = await model.generateContent({prompt});
console.log(result.response.text());
4. 典型生态项目
1. Google AI Studio
Google AI Studio 是一个集成开发环境,专门用于构建和部署 AI 模型。它提供了丰富的工具和资源,帮助开发者快速上手并优化他们的 AI 项目。
2. Google Cloud AI Platform
Google Cloud AI Platform 提供了一个全面的平台,支持从模型训练到部署的全流程。它与 Google AI JavaScript SDK 无缝集成,使得开发者可以在云端高效地管理和扩展他们的 AI 应用。
3. TensorFlow.js
TensorFlow.js 是一个开源库,允许在浏览器和 Node.js 中运行机器学习模型。它与 Google AI JavaScript SDK 结合使用,可以进一步提升应用的性能和功能。
通过这些生态项目,开发者可以构建更加复杂和强大的 AI 应用,充分利用 Google 提供的先进技术和资源。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00