【亲测免费】 MongoDB Generative AI Showcase 使用教程
2026-01-30 04:16:05作者:姚月梅Lane
前言:为什么选择MongoDB GenAI Showcase?
还在为构建AI应用而头疼吗?面对海量的开源项目不知从何入手?MongoDB Generative AI Showcase为你提供了一个完整的AI应用开发宝库!这个项目汇集了从基础的RAG(检索增强生成)到复杂的AI智能体(AI Agents)的完整示例,全部基于MongoDB作为向量数据库和操作数据库。
读完本文你将获得:
- ✅ 免费MongoDB Atlas账户创建指南
- ✅ 本地RAG应用快速搭建教程
- ✅ 多模态AI应用实战案例
- ✅ 性能优化和最佳实践
- ✅ 企业级AI解决方案参考
一、环境准备:零成本起步
1.1 注册MongoDB Atlas免费账户
MongoDB Atlas提供免费的512MB存储集群,完全足够学习和开发使用:
- 访问 MongoDB Atlas注册页面
- 使用邮箱注册账户
- 选择免费套餐(M0)
- 选择就近的云服务商区域(建议选择AWS亚太区域)
1.2 创建数据库集群
flowchart TD
A[登录Atlas控制台] --> B[创建新项目]
B --> C[选择免费M0集群]
C --> D[选择云提供商和区域]
D --> E[配置集群名称]
E --> F[创建集群等待部署]
1.3 获取连接字符串
在集群部署完成后:
- 点击"Connect"按钮
- 选择"Drivers"连接方式
- 复制Python连接字符串
- 将
<password>替换为你的数据库密码
二、本地RAG应用实战
2.1 项目结构解析
以local-rag-pdf应用为例,这是一个完整的本地RAG解决方案:
local-rag-pdf/
├── app.py # Flask Web应用
├── rag_module.py # RAG核心逻辑
├── config.yaml # 配置文件
└── requirements.txt # 依赖包
2.2 核心代码分析
RAG模块核心功能:
class ChatPDF:
"""PDF文档问答系统"""
def __init__(self, config_file="config.yaml"):
# 初始化LLM模型、嵌入模型、MongoDB连接
self.model = ChatOllama(model="deepseek-r1:8b")
self.embeddings = OllamaEmbeddings(model="nomic-embed-text")
self.vector_store = MongoDBAtlasVectorSearch(
collection=self.collection,
embedding=self.embeddings,
index_name="vector_index"
)
def upload_and_index_pdf(self, pdf_file_path):
# PDF文档解析、分块、向量化存储
docs = PyPDFLoader(file_path=pdf_file_path).load()
chunks = self.text_splitter.split_documents(docs)
self.vector_store.add_documents(documents=chunks)
def query_with_context(self, query, conversation_history=None):
# 基于上下文的智能问答
retrieved_docs = self.retriever.invoke(query)
response = chain.invoke(formatted_input)
return response
2.3 配置详解
config.yaml配置文件:
llm_model: "deepseek-r1:8b" # 本地LLM模型
embedding_model: "nomic-embed-text" # 嵌入模型
mongo_connection_str: "mongodb://..." # MongoDB连接字符串
database_name: "knowledge_base" # 数据库名称
collection_name: "documents" # 集合名称
三、快速启动指南
3.1 安装依赖
# 克隆项目
git clone https://gitcode.com/GitHub_Trending/ge/GenAI-Showcase
# 进入项目目录
cd GenAI-Showcase/apps/local-rag-pdf
# 安装Python依赖
pip install -r requirements.txt
# 安装Ollama(本地LLM)
curl -fsSL https://ollama.ai/install.sh | sh
# 下载模型
ollama pull deepseek-r1:8b
ollama pull nomic-embed-text
3.2 配置MongoDB连接
修改config.yaml文件:
mongo_connection_str: "mongodb+srv://username:password@cluster.mongodb.net/?retryWrites=true&w=majority"
3.3 启动应用
python app.py
访问 http://localhost:5000 即可使用PDF问答功能。
四、功能特性详解
4.1 向量搜索能力
MongoDB Atlas Vector Search提供强大的向量检索功能:
| 特性 | 描述 | 优势 |
|---|---|---|
| 近似最近邻搜索 | 快速查找相似向量 | 毫秒级响应 |
| 混合搜索 | 结合向量和标量字段 | 精准过滤 |
| 动态索引 | 自动创建和管理索引 | 零运维成本 |
| 多模态支持 | 文本、图像、音频向量 | 统一存储 |
4.2 智能分块策略
text_splitter = RecursiveCharacterTextSplitter(
chunk_size=1024, # 块大小
chunk_overlap=100, # 重叠区域
separators=["\n\n", "\n", " ", ""] # 分隔符优先级
)
4.3 对话上下文管理
支持多轮对话上下文保持:
conversation_history = [
"用户: 什么是机器学习?",
"助手: 机器学习是人工智能的一个分支...",
"用户: 那深度学习呢?"
]
五、进阶应用场景
5.1 多模态RAG应用
项目中的multimodal_rag示例展示了如何处理图像和文本的多模态数据:
# 图像向量化
image_embeddings = clip_model.encode_images(images)
# 文本向量化
text_embeddings = clip_model.encode_text(texts)
# 统一存储到MongoDB
5.2 AI智能体开发
agents目录包含多种AI智能体示例:
| 智能体类型 | 应用场景 | 技术栈 |
|---|---|---|
| 烹饪助手 | 菜谱推荐和烹饪指导 | Haystack + MongoDB |
| HR招聘助手 | 简历分析和面试安排 | LangGraph + Claude |
| 电商客服 | 商品推荐和问题解答 | OpenAI + LlamaIndex |
5.3 企业级解决方案
partners目录包含企业级应用案例:
- 金融风控系统:交易合规监控和文档分析
- 供应链管理:合同管理和物流优化
- 医疗健康:病历分析和诊断辅助
六、性能优化建议
6.1 向量索引优化
// 创建优化的向量索引
db.collection.createIndex({
"embedding": "vector"
}, {
"name": "vector_index",
"type": "vector",
"dimensions": 768,
"similarity": "cosine"
})
6.2 查询性能调优
| 参数 | 推荐值 | 说明 |
|---|---|---|
| k | 5-10 | 检索文档数量 |
| score_threshold | 0.2-0.3 | 相似度阈值 |
| chunk_size | 512-1024 | 文本块大小 |
| chunk_overlap | 50-100 | 块重叠大小 |
6.3 内存管理策略
# 分批处理大型文档
def process_large_document_in_batches(document_path, batch_size=100):
for i in range(0, len(pages), batch_size):
batch = pages[i:i+batch_size]
process_batch(batch)
七、常见问题解答
7.1 连接问题排查
# 测试MongoDB连接
python -c "import pymongo; client = pymongo.MongoClient('你的连接字符串'); print(client.server_info())"
# 检查Ollama服务
ollama list
7.2 模型下载问题
如果模型下载缓慢,可以使用国内镜像:
# 使用国内镜像加速
OLLAMA_HOST=0.0.0.0 OLLAMA_MODELS=镜像地址 ollama pull deepseek-r1:8b
7.3 内存不足处理
对于内存较小的设备:
# 使用轻量级模型
llm_model: "deepseek-r1:1.8b"
embedding_model: "all-minilm-l6-v2"
八、总结与展望
MongoDB Generative AI Showcase是一个极其宝贵的开源项目,它为开发者提供了:
- 完整的AI应用模板:从简单的RAG到复杂的多智能体系统
- 生产级代码质量:所有示例都经过实战检验
- 持续更新维护:MongoDB团队定期更新和添加新功能
- 社区支持:活跃的开发者社区和详细文档
下一步学习建议:
- 从
local-rag-pdf开始,掌握基础RAG流程 - 尝试
multimodal_rag了解多模态处理 - 探索
agents目录中的智能体应用 - 参考
partners中的企业级解决方案
通过这个项目,你不仅能够快速搭建AI应用,更能深入理解现代AI系统的架构设计和技术选型。现在就开始你的AI开发之旅吧!
温馨提示:本文所有示例均基于免费资源,无需支付任何费用即可体验完整的AI应用开发流程。如果在使用过程中遇到任何问题,欢迎在项目Issue中提问,社区会及时提供帮助。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0197
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0126
MiMo-V2.5-Pro-FP4-DFlashMiMo-V2.5-Pro-FP4-DFlash 是驱动 MiMo-V2.5-Pro-UltraSpeed 的底层模型: FP4 量化骨干网络:对 MoE 专家采用 MXFP4 量化,同时保持模型其他部分的更高精度,在几乎无损质量的前提下,显著减小模型体积并降低内存带宽压力。 BF16 DFlash 草稿生成器:用于块扩散推测解码,每次前向传播可生成一整个块的 tokens,并让骨干网络一步完成验证。 两者协同作用,既降低了每参数的位宽,又减少了骨干网络前向传播的次数,而这两者正是万亿参数模型解码过程中的两大主要成本来源。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
AstrBot✨ 易上手的多平台 LLM 聊天机器人及开发框架 ✨ 平台支持 QQ、QQ频道、Telegram、微信、企微、飞书 | OpenAI、DeepSeek、Gemini、硅基流动、月之暗面、Ollama、OneAPI、Dify 等。附带 WebUI。Python06
handy-ollama动手学Ollama,CPU玩转大模型部署,在线阅读地址:https://datawhalechina.github.io/handy-ollama/Jupyter Notebook07
热门内容推荐
最新内容推荐
项目优选
收起
暂无描述
Dockerfile
766
5.01 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
863
1.96 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
689
1.35 K
Ascend Extension for PyTorch
Python
722
894
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
458
453
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.11 K
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.02 K
265
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
1.01 K
626
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
2.99 K
639
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
152
250