零基础玩转Rasa知识图谱：30分钟搭建智能问答机器人

2026-02-04 05:13:40作者：段琳惟

💬 Open source machine learning framework to automate text- and voice-based conversations: NLU, dialogue management, connect to Slack, Facebook, and more - Create chatbots and voice assistants

项目地址：https://gitcode.com/GitHub_Trending/ra/rasa

你还在为客户咨询重复问题焦头烂额？客服团队深陷FAQ海洋无法自拔？本文将带你用Rasa知识图谱技术，零基础构建一个能理解复杂问题的智能问答系统。读完本文，你将掌握从数据建模到对话测试的全流程，让机器人像专家一样精准回答业务问题。

为什么需要知识图谱问答系统？

传统FAQ机器人只能机械匹配关键词，用户提问稍作变化就无法应答。而基于知识图谱（Knowledge Graph）的问答系统，能够理解实体间的关系，像人类一样推理答案。例如当用户问"柏林有哪些带游泳池的三星级酒店？"，系统能同时匹配"柏林"、"游泳池"、"三星级"三个条件，返回精准结果。

Rasa作为开源对话AI框架，提供了完整的知识图谱集成方案。通过examples/knowledgebasebot示例项目，我们可以快速搭建生产级问答系统，无需复杂的后端开发。

快速上手：知识图谱机器人实战

环境准备与项目结构

首先确保已安装Rasa环境，然后克隆项目仓库：

git clone https://gitcode.com/GitHub_Trending/ra/rasa
cd rasa/examples/knowledgebasebot

该示例项目结构清晰，核心文件包括：

知识库数据：knowledge_base_data.json
模型配置：config.yml
对话定义：domain.yml
自定义动作：actions/actions.py

知识库数据建模

打开knowledge_base_data.json，可以看到数据采用JSON格式组织，包含"restaurant"和"hotel"两个实体类型。每个实体有多个属性，例如酒店实体包含价格范围、早餐服务、城市等信息：

{
  "hotel": [
    {
      "id": 0,
      "name": "Hilton",
      "price-range": "expensive",
      "breakfast-included": true,
      "city": "Berlin",
      "free-wifi": true,
      "star-rating": 5,
      "swimming-pool": true
    }
  ]
}

这种结构化数据便于Rasa进行多条件查询。你可以根据业务需求，添加更多实体类型和属性，例如产品、服务、员工等。

对话流程配置

NLU模型配置

config.yml定义了自然语言理解（NLU）管道，使用DIETClassifier进行意图识别和实体提取：

pipeline:
  - name: "WhitespaceTokenizer"
  - name: "RegexFeaturizer"
  - name: "LexicalSyntacticFeaturizer"
  - name: "CountVectorsFeaturizer"
  - name: "DIETClassifier"
    epochs: 100

DIET模型能同时处理意图分类和实体识别，非常适合知识图谱问答场景。

领域定义

domain.yml文件声明了对话所需的意图、实体、槽位和响应：

intents:
  - greet
  - goodbye
  - query_knowledge_base  # 核心意图：查询知识库
  - bot_challenge

entities:
  - object_type  # 实体类型（酒店/餐厅）
  - mention      # 实体名称
  - attribute    # 属性名称
  - city         # 城市

其中query_knowledge_base意图是知识查询的入口，系统会提取object_type、mention等实体，作为查询参数。

训练与测试模型

训练模型

执行以下命令训练对话模型：

rasa train

训练完成后，模型会保存到models/目录下。

启动动作服务器

知识图谱查询逻辑通过自定义动作实现，需要单独启动动作服务器：

rasa run actions

测试对话

打开新终端，启动Rasa Shell进行对话测试：

rasa shell

尝试以下对话：

User: 柏林有哪些带游泳池的酒店？
Bot: 柏林有以下带游泳池的酒店：
- Hilton (五星级，含早餐，提供免费WiFi)
- Berlin Hotel (三星级，含早餐，提供免费WiFi)

系统能准确理解用户问题中的实体（柏林、酒店）和属性（游泳池），从知识库中筛选出符合条件的结果。

核心技术解析

知识查询工作流程

Rasa知识图谱问答的工作流程如下：

graph TD
    A[用户提问] --> B[NLU处理]
    B --> C[提取实体和属性]
    C --> D[调用知识查询动作]
    D --> E[查询知识库]
    E --> F[生成自然语言回答]
    F --> G[返回结果给用户]

其中自定义动作action_query_knowledge_base是核心，位于actions/actions.py文件中。该动作使用Rasa SDK提供的KnowledgeBaseAction类，实现了实体识别、属性提取和结果过滤逻辑。

意图与实体识别

系统通过query_knowledge_base意图处理所有知识查询。在NLU训练数据data/nlu.yml中，定义了各种查询模式：

- intent: query_knowledge_base
  examples: |
    - 哪家酒店有游泳池
    - 柏林的酒店哪个有早餐
    - 餐厅的价格范围是什么

通过标注实体，Rasa能准确识别查询对象、条件和属性，为后续知识查询打下基础。

自定义与扩展

添加新实体类型

要添加"景点"实体类型，只需三步：

在knowledge_base_data.json中添加景点数据
在domain.yml的entities部分添加"attraction"
在NLU训练数据中添加相关例句

高级查询功能

目前示例支持基础属性查询，你可以扩展actions/actions.py实现更复杂的查询，例如：

范围查询（价格低于XXX的酒店）
排序功能（按评分排序餐厅）
模糊匹配（类似"希尔顿"的酒店）

前端集成

训练好的模型可以通过Rasa REST API部署，集成到网站或App中。修改endpoints.yml配置服务地址，然后启动API服务：

rasa run --enable-api --cors "*"

部署与优化建议

性能优化

对于大规模知识库，考虑使用Redis缓存查询结果

调整config.yml中的DIETClassifier参数，平衡精度和性能：

- name: "DIETClassifier"
  epochs: 50  # 减少训练轮次加快推理
  batch_size: 32

监控与迭代

使用Rasa X进行对话标注和模型改进
定期分析用户问题日志，补充未覆盖的查询模式
通过A/B测试比较不同知识库结构的效果

总结与展望

通过Rasa知识图谱功能，我们无需复杂的后端开发，就能快速构建智能问答系统。本文介绍的knowledgebasebot示例，为客服、销售、技术支持等场景提供了实用解决方案。

下一步你可以尝试：

集成企业内部知识库
添加多轮对话能力，处理复杂查询
结合Rasa NLG实现更自然的回答生成

希望本文对你构建智能问答系统有所帮助！如果觉得有用，别忘了点赞收藏，关注我们获取更多Rasa实战教程。如有任何问题，欢迎在社区论坛交流。

扩展资源

官方文档：docs/
更多示例：examples/
开发指南：CONTRIBUTING.md
模型训练：rasa/model_training.py

rasa

💬 Open source machine learning framework to automate text- and voice-based conversations: NLU, dialogue management, connect to Slack, Facebook, and more - Create chatbots and voice assistants

项目地址：https://gitcode.com/GitHub_Trending/ra/rasa

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677

零基础玩转Rasa知识图谱：30分钟搭建智能问答机器人

为什么需要知识图谱问答系统？

快速上手：知识图谱机器人实战

环境准备与项目结构

知识库数据建模

对话流程配置

NLU模型配置

领域定义

训练与测试模型

训练模型

启动动作服务器

测试对话

核心技术解析

知识查询工作流程

意图与实体识别

自定义与扩展

添加新实体类型

高级查询功能

前端集成

部署与优化建议

性能优化

监控与迭代

总结与展望

扩展资源

热门内容推荐

最新内容推荐

项目优选

零基础玩转Rasa知识图谱：30分钟搭建智能问答机器人

为什么需要知识图谱问答系统？

快速上手：知识图谱机器人实战

环境准备与项目结构

知识库数据建模

对话流程配置

NLU模型配置

领域定义

训练与测试模型

训练模型

启动动作服务器

测试对话

核心技术解析

知识查询工作流程

意图与实体识别

自定义与扩展

添加新实体类型

高级查询功能

前端集成

部署与优化建议

性能优化

监控与迭代

总结与展望

扩展资源

相关内容推荐

热门内容推荐

最新内容推荐

项目优选