首页
/ Rasa PTBR Boilerplate 项目启动与配置教程

Rasa PTBR Boilerplate 项目启动与配置教程

2025-04-24 02:05:20作者:江焘钦

1. 项目目录结构及介绍

Rasa PTBR Boilerplate 项目的目录结构如下:

rasa-ptbr-boilerplate/
├── actions/
│   ├── __init__.py
│   └── actions.py
├── data/
│   ├── nlu.yml
│   ├── stories.yml
│   └── domain.yml
├── config.yml
├── models/
│   └── training_data.yml
├── requirements.txt
└── run.py

以下是各个目录和文件的简要介绍:

  • actions/: 包含自定义动作的 Python 脚本。
  • data/: 存储项目所用的训练数据。
    • nlu.yml: 自然语言理解训练数据,定义了实体和意图。
    • stories.yml: 故事文件,定义了对话流程。
    • domain.yml: 定义了项目的域,包括实体、意图、动作等。
  • config.yml: 项目的配置文件。
  • models/: 存储训练好的模型。
    • training_data.yml: 模型的训练数据。
  • requirements.txt: 项目依赖的 Python 包。
  • run.py: 项目的启动脚本。

2. 项目的启动文件介绍

项目的启动文件是 run.py。该脚本负责初始化和运行 Rasa 应用程序。以下是 run.py 的主要功能:

from rasa.core import run

if __name__ == "__main__":
    run()

在执行 run.py 时,Rasa 会自动读取 config.yml 文件中的配置信息,并启动对话系统。

3. 项目的配置文件介绍

项目的配置文件是 config.yml。该文件定义了 Rasa 应用程序的配置参数,包括模型、管道、策略等。

以下是一个简化的 config.yml 示例:

version: "2.0"

pipelines:
  - name: "SpaCy NLP pipeline"
    elements: [
      - name: "SpacyNLP"
      - name: "CRF Entity Extractor"
      - name: "RegexFeaturizer"
      - name: "LexicalSyntacticFeaturizer"
      - name: "CountBasedFeaturizer"
      - name: "TwoStageIntentClassifier"
    ]

policies:
  - name: "MemoizationPolicy"
  - name: "TEDPolicy"
  - name: "RulePolicy"

actions:
  - action_foo
  - action_bar

trainining_data:
  common_examples:
    - intent: greet
      examples: |
        - 你好
        - 嗨
        - 嘿

在此配置文件中,定义了以下内容:

  • pipelines: 定义了 NLP 管道的组成,包括各种处理器和特征提取器。
  • policies: 定义了使用的对话策略。
  • actions: 列出了项目中定义的自定义动作。
  • trainining_data: 包含了一些示例对话数据,用于训练模型。

确保在修改 config.yml 文件后,重新启动 Rasa 应用程序以使配置生效。

登录后查看全文
热门项目推荐