【亲测免费】 MongoDB Generative AI Showcase 使用教程
2026-01-30 04:16:05作者:姚月梅Lane
前言:为什么选择MongoDB GenAI Showcase?
还在为构建AI应用而头疼吗?面对海量的开源项目不知从何入手?MongoDB Generative AI Showcase为你提供了一个完整的AI应用开发宝库!这个项目汇集了从基础的RAG(检索增强生成)到复杂的AI智能体(AI Agents)的完整示例,全部基于MongoDB作为向量数据库和操作数据库。
读完本文你将获得:
- ✅ 免费MongoDB Atlas账户创建指南
- ✅ 本地RAG应用快速搭建教程
- ✅ 多模态AI应用实战案例
- ✅ 性能优化和最佳实践
- ✅ 企业级AI解决方案参考
一、环境准备:零成本起步
1.1 注册MongoDB Atlas免费账户
MongoDB Atlas提供免费的512MB存储集群,完全足够学习和开发使用:
- 访问 MongoDB Atlas注册页面
- 使用邮箱注册账户
- 选择免费套餐(M0)
- 选择就近的云服务商区域(建议选择AWS亚太区域)
1.2 创建数据库集群
flowchart TD
A[登录Atlas控制台] --> B[创建新项目]
B --> C[选择免费M0集群]
C --> D[选择云提供商和区域]
D --> E[配置集群名称]
E --> F[创建集群等待部署]
1.3 获取连接字符串
在集群部署完成后:
- 点击"Connect"按钮
- 选择"Drivers"连接方式
- 复制Python连接字符串
- 将
<password>替换为你的数据库密码
二、本地RAG应用实战
2.1 项目结构解析
以local-rag-pdf应用为例,这是一个完整的本地RAG解决方案:
local-rag-pdf/
├── app.py # Flask Web应用
├── rag_module.py # RAG核心逻辑
├── config.yaml # 配置文件
└── requirements.txt # 依赖包
2.2 核心代码分析
RAG模块核心功能:
class ChatPDF:
"""PDF文档问答系统"""
def __init__(self, config_file="config.yaml"):
# 初始化LLM模型、嵌入模型、MongoDB连接
self.model = ChatOllama(model="deepseek-r1:8b")
self.embeddings = OllamaEmbeddings(model="nomic-embed-text")
self.vector_store = MongoDBAtlasVectorSearch(
collection=self.collection,
embedding=self.embeddings,
index_name="vector_index"
)
def upload_and_index_pdf(self, pdf_file_path):
# PDF文档解析、分块、向量化存储
docs = PyPDFLoader(file_path=pdf_file_path).load()
chunks = self.text_splitter.split_documents(docs)
self.vector_store.add_documents(documents=chunks)
def query_with_context(self, query, conversation_history=None):
# 基于上下文的智能问答
retrieved_docs = self.retriever.invoke(query)
response = chain.invoke(formatted_input)
return response
2.3 配置详解
config.yaml配置文件:
llm_model: "deepseek-r1:8b" # 本地LLM模型
embedding_model: "nomic-embed-text" # 嵌入模型
mongo_connection_str: "mongodb://..." # MongoDB连接字符串
database_name: "knowledge_base" # 数据库名称
collection_name: "documents" # 集合名称
三、快速启动指南
3.1 安装依赖
# 克隆项目
git clone https://gitcode.com/GitHub_Trending/ge/GenAI-Showcase
# 进入项目目录
cd GenAI-Showcase/apps/local-rag-pdf
# 安装Python依赖
pip install -r requirements.txt
# 安装Ollama(本地LLM)
curl -fsSL https://ollama.ai/install.sh | sh
# 下载模型
ollama pull deepseek-r1:8b
ollama pull nomic-embed-text
3.2 配置MongoDB连接
修改config.yaml文件:
mongo_connection_str: "mongodb+srv://username:password@cluster.mongodb.net/?retryWrites=true&w=majority"
3.3 启动应用
python app.py
访问 http://localhost:5000 即可使用PDF问答功能。
四、功能特性详解
4.1 向量搜索能力
MongoDB Atlas Vector Search提供强大的向量检索功能:
| 特性 | 描述 | 优势 |
|---|---|---|
| 近似最近邻搜索 | 快速查找相似向量 | 毫秒级响应 |
| 混合搜索 | 结合向量和标量字段 | 精准过滤 |
| 动态索引 | 自动创建和管理索引 | 零运维成本 |
| 多模态支持 | 文本、图像、音频向量 | 统一存储 |
4.2 智能分块策略
text_splitter = RecursiveCharacterTextSplitter(
chunk_size=1024, # 块大小
chunk_overlap=100, # 重叠区域
separators=["\n\n", "\n", " ", ""] # 分隔符优先级
)
4.3 对话上下文管理
支持多轮对话上下文保持:
conversation_history = [
"用户: 什么是机器学习?",
"助手: 机器学习是人工智能的一个分支...",
"用户: 那深度学习呢?"
]
五、进阶应用场景
5.1 多模态RAG应用
项目中的multimodal_rag示例展示了如何处理图像和文本的多模态数据:
# 图像向量化
image_embeddings = clip_model.encode_images(images)
# 文本向量化
text_embeddings = clip_model.encode_text(texts)
# 统一存储到MongoDB
5.2 AI智能体开发
agents目录包含多种AI智能体示例:
| 智能体类型 | 应用场景 | 技术栈 |
|---|---|---|
| 烹饪助手 | 菜谱推荐和烹饪指导 | Haystack + MongoDB |
| HR招聘助手 | 简历分析和面试安排 | LangGraph + Claude |
| 电商客服 | 商品推荐和问题解答 | OpenAI + LlamaIndex |
5.3 企业级解决方案
partners目录包含企业级应用案例:
- 金融风控系统:交易合规监控和文档分析
- 供应链管理:合同管理和物流优化
- 医疗健康:病历分析和诊断辅助
六、性能优化建议
6.1 向量索引优化
// 创建优化的向量索引
db.collection.createIndex({
"embedding": "vector"
}, {
"name": "vector_index",
"type": "vector",
"dimensions": 768,
"similarity": "cosine"
})
6.2 查询性能调优
| 参数 | 推荐值 | 说明 |
|---|---|---|
| k | 5-10 | 检索文档数量 |
| score_threshold | 0.2-0.3 | 相似度阈值 |
| chunk_size | 512-1024 | 文本块大小 |
| chunk_overlap | 50-100 | 块重叠大小 |
6.3 内存管理策略
# 分批处理大型文档
def process_large_document_in_batches(document_path, batch_size=100):
for i in range(0, len(pages), batch_size):
batch = pages[i:i+batch_size]
process_batch(batch)
七、常见问题解答
7.1 连接问题排查
# 测试MongoDB连接
python -c "import pymongo; client = pymongo.MongoClient('你的连接字符串'); print(client.server_info())"
# 检查Ollama服务
ollama list
7.2 模型下载问题
如果模型下载缓慢,可以使用国内镜像:
# 使用国内镜像加速
OLLAMA_HOST=0.0.0.0 OLLAMA_MODELS=镜像地址 ollama pull deepseek-r1:8b
7.3 内存不足处理
对于内存较小的设备:
# 使用轻量级模型
llm_model: "deepseek-r1:1.8b"
embedding_model: "all-minilm-l6-v2"
八、总结与展望
MongoDB Generative AI Showcase是一个极其宝贵的开源项目,它为开发者提供了:
- 完整的AI应用模板:从简单的RAG到复杂的多智能体系统
- 生产级代码质量:所有示例都经过实战检验
- 持续更新维护:MongoDB团队定期更新和添加新功能
- 社区支持:活跃的开发者社区和详细文档
下一步学习建议:
- 从
local-rag-pdf开始,掌握基础RAG流程 - 尝试
multimodal_rag了解多模态处理 - 探索
agents目录中的智能体应用 - 参考
partners中的企业级解决方案
通过这个项目,你不仅能够快速搭建AI应用,更能深入理解现代AI系统的架构设计和技术选型。现在就开始你的AI开发之旅吧!
温馨提示:本文所有示例均基于免费资源,无需支付任何费用即可体验完整的AI应用开发流程。如果在使用过程中遇到任何问题,欢迎在项目Issue中提问,社区会及时提供帮助。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
new-apiAI模型聚合管理中转分发系统,一个应用管理您的所有AI模型,支持将多种大模型转为统一格式调用,支持OpenAI、Claude、Gemini等格式,可供个人或者企业内部管理与分发渠道使用。🍥 A Unified AI Model Management & Distribution System. Aggregate all your LLMs into one app and access them via an OpenAI-compatible API, with native support for Claude (Messages) and Gemini formats.JavaScript01
idea-claude-code-gui一个功能强大的 IntelliJ IDEA 插件,为开发者提供 Claude Code 和 OpenAI Codex 双 AI 工具的可视化操作界面,让 AI 辅助编程变得更加高效和直观。Java00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility.Kotlin06
ebook-to-mindmapepub、pdf 拆书 AI 总结TSX00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
515
3.7 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
874
546
Ascend Extension for PyTorch
Python
317
362
暂无简介
Dart
759
182
React Native鸿蒙化仓库
JavaScript
299
347
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
334
156
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.31 K
734
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
12
1
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
110
128