【亲测免费】 MongoDB Generative AI Showcase 使用教程

2026-01-30 04:16:05作者：姚月梅Lane

前言：为什么选择MongoDB GenAI Showcase？

还在为构建AI应用而头疼吗？面对海量的开源项目不知从何入手？MongoDB Generative AI Showcase为你提供了一个完整的AI应用开发宝库！这个项目汇集了从基础的RAG（检索增强生成）到复杂的AI智能体（AI Agents）的完整示例，全部基于MongoDB作为向量数据库和操作数据库。

读完本文你将获得：

✅ 免费MongoDB Atlas账户创建指南
✅ 本地RAG应用快速搭建教程
✅ 多模态AI应用实战案例
✅ 性能优化和最佳实践
✅ 企业级AI解决方案参考

一、环境准备：零成本起步

1.1 注册MongoDB Atlas免费账户

MongoDB Atlas提供免费的512MB存储集群，完全足够学习和开发使用：

访问 MongoDB Atlas注册页面
使用邮箱注册账户
选择免费套餐（M0）
选择就近的云服务商区域（建议选择AWS亚太区域）

1.2 创建数据库集群

flowchart TD
    A[登录Atlas控制台] --> B[创建新项目]
    B --> C[选择免费M0集群]
    C --> D[选择云提供商和区域]
    D --> E[配置集群名称]
    E --> F[创建集群等待部署]

1.3 获取连接字符串

在集群部署完成后：

点击"Connect"按钮
选择"Drivers"连接方式
复制Python连接字符串
将<password>替换为你的数据库密码

二、本地RAG应用实战

2.1 项目结构解析

以local-rag-pdf应用为例，这是一个完整的本地RAG解决方案：

local-rag-pdf/
├── app.py              # Flask Web应用
├── rag_module.py       # RAG核心逻辑
├── config.yaml         # 配置文件
└── requirements.txt    # 依赖包

2.2 核心代码分析

RAG模块核心功能：

class ChatPDF:
    """PDF文档问答系统"""
    
    def __init__(self, config_file="config.yaml"):
        # 初始化LLM模型、嵌入模型、MongoDB连接
        self.model = ChatOllama(model="deepseek-r1:8b")
        self.embeddings = OllamaEmbeddings(model="nomic-embed-text")
        self.vector_store = MongoDBAtlasVectorSearch(
            collection=self.collection,
            embedding=self.embeddings,
            index_name="vector_index"
        )
    
    def upload_and_index_pdf(self, pdf_file_path):
        # PDF文档解析、分块、向量化存储
        docs = PyPDFLoader(file_path=pdf_file_path).load()
        chunks = self.text_splitter.split_documents(docs)
        self.vector_store.add_documents(documents=chunks)
    
    def query_with_context(self, query, conversation_history=None):
        # 基于上下文的智能问答
        retrieved_docs = self.retriever.invoke(query)
        response = chain.invoke(formatted_input)
        return response

2.3 配置详解

config.yaml配置文件：

llm_model: "deepseek-r1:8b"                # 本地LLM模型
embedding_model: "nomic-embed-text"        # 嵌入模型
mongo_connection_str: "mongodb://..."      # MongoDB连接字符串
database_name: "knowledge_base"            # 数据库名称
collection_name: "documents"               # 集合名称

三、快速启动指南

3.1 安装依赖

# 克隆项目
git clone https://gitcode.com/GitHub_Trending/ge/GenAI-Showcase

# 进入项目目录
cd GenAI-Showcase/apps/local-rag-pdf

# 安装Python依赖
pip install -r requirements.txt

# 安装Ollama（本地LLM）
curl -fsSL https://ollama.ai/install.sh | sh

# 下载模型
ollama pull deepseek-r1:8b
ollama pull nomic-embed-text

3.2 配置MongoDB连接

修改config.yaml文件：

mongo_connection_str: "mongodb+srv://username:password@cluster.mongodb.net/?retryWrites=true&w=majority"

3.3 启动应用

python app.py

访问 http://localhost:5000 即可使用PDF问答功能。

四、功能特性详解

4.1 向量搜索能力

MongoDB Atlas Vector Search提供强大的向量检索功能：

特性	描述	优势
近似最近邻搜索	快速查找相似向量	毫秒级响应
混合搜索	结合向量和标量字段	精准过滤
动态索引	自动创建和管理索引	零运维成本
多模态支持	文本、图像、音频向量	统一存储

4.2 智能分块策略

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1024,      # 块大小
    chunk_overlap=100,    # 重叠区域
    separators=["\n\n", "\n", " ", ""]  # 分隔符优先级
)

4.3 对话上下文管理

支持多轮对话上下文保持：

conversation_history = [
    "用户: 什么是机器学习?",
    "助手: 机器学习是人工智能的一个分支...",
    "用户: 那深度学习呢?"
]

五、进阶应用场景

5.1 多模态RAG应用

项目中的multimodal_rag示例展示了如何处理图像和文本的多模态数据：

# 图像向量化
image_embeddings = clip_model.encode_images(images)
# 文本向量化  
text_embeddings = clip_model.encode_text(texts)
# 统一存储到MongoDB

5.2 AI智能体开发

agents目录包含多种AI智能体示例：

智能体类型	应用场景	技术栈
烹饪助手	菜谱推荐和烹饪指导	Haystack + MongoDB
HR招聘助手	简历分析和面试安排	LangGraph + Claude
电商客服	商品推荐和问题解答	OpenAI + LlamaIndex

5.3 企业级解决方案

partners目录包含企业级应用案例：

金融风控系统：交易合规监控和文档分析
供应链管理：合同管理和物流优化
医疗健康：病历分析和诊断辅助

六、性能优化建议

6.1 向量索引优化

// 创建优化的向量索引
db.collection.createIndex({
  "embedding": "vector"
}, {
  "name": "vector_index",
  "type": "vector",
  "dimensions": 768,
  "similarity": "cosine"
})

6.2 查询性能调优

参数	推荐值	说明
k	5-10	检索文档数量
score_threshold	0.2-0.3	相似度阈值
chunk_size	512-1024	文本块大小
chunk_overlap	50-100	块重叠大小

6.3 内存管理策略

# 分批处理大型文档
def process_large_document_in_batches(document_path, batch_size=100):
    for i in range(0, len(pages), batch_size):
        batch = pages[i:i+batch_size]
        process_batch(batch)

七、常见问题解答

7.1 连接问题排查

# 测试MongoDB连接
python -c "import pymongo; client = pymongo.MongoClient('你的连接字符串'); print(client.server_info())"

# 检查Ollama服务
ollama list

7.2 模型下载问题

如果模型下载缓慢，可以使用国内镜像：

# 使用国内镜像加速
OLLAMA_HOST=0.0.0.0 OLLAMA_MODELS=镜像地址 ollama pull deepseek-r1:8b

7.3 内存不足处理

对于内存较小的设备：

# 使用轻量级模型
llm_model: "deepseek-r1:1.8b"
embedding_model: "all-minilm-l6-v2"

八、总结与展望

MongoDB Generative AI Showcase是一个极其宝贵的开源项目，它为开发者提供了：

完整的AI应用模板：从简单的RAG到复杂的多智能体系统
生产级代码质量：所有示例都经过实战检验
持续更新维护：MongoDB团队定期更新和添加新功能
社区支持：活跃的开发者社区和详细文档

下一步学习建议：

从local-rag-pdf开始，掌握基础RAG流程
尝试multimodal_rag了解多模态处理
探索agents目录中的智能体应用
参考partners中的企业级解决方案

通过这个项目，你不仅能够快速搭建AI应用，更能深入理解现代AI系统的架构设计和技术选型。现在就开始你的AI开发之旅吧！

温馨提示：本文所有示例均基于免费资源，无需支付任何费用即可体验完整的AI应用开发流程。如果在使用过程中遇到任何问题，欢迎在项目Issue中提问，社区会及时提供帮助。

GenAI-Showcase

GenAI Cookbook

项目地址：https://gitcode.com/GitHub_Trending/ge/GenAI-Showcase

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271