首页
/ 中文医疗实体识别项目教程

中文医疗实体识别项目教程

2024-08-18 17:58:32作者:蔡丛锟

1. 项目的目录结构及介绍

Chinese-Medical-Entity-Recognition/
├── data/
│   ├── raw/
│   ├── processed/
│   └── README.md
├── models/
│   ├── __init__.py
│   ├── model.py
│   └── utils.py
├── configs/
│   ├── config.yaml
│   └── README.md
├── scripts/
│   ├── train.py
│   ├── evaluate.py
│   └── predict.py
├── README.md
└── requirements.txt

目录结构介绍

  • data/: 存放数据文件,包括原始数据和处理后的数据。
    • raw/: 原始数据文件。
    • processed/: 处理后的数据文件。
  • models/: 存放模型相关的代码。
    • model.py: 定义模型的主要代码。
    • utils.py: 模型相关的工具函数。
  • configs/: 存放配置文件。
    • config.yaml: 主要的配置文件。
  • scripts/: 存放脚本文件,包括训练、评估和预测脚本。
    • train.py: 训练模型的脚本。
    • evaluate.py: 评估模型的脚本。
    • predict.py: 预测的脚本。
  • README.md: 项目说明文档。
  • requirements.txt: 项目依赖的Python包列表。

2. 项目的启动文件介绍

训练模型

python scripts/train.py --config configs/config.yaml

评估模型

python scripts/evaluate.py --config configs/config.yaml

预测

python scripts/predict.py --config configs/config.yaml

3. 项目的配置文件介绍

configs/config.yaml

# 数据路径
data_path: "data/processed/"

# 模型参数
model_params:
  hidden_size: 256
  num_layers: 2
  dropout: 0.5

# 训练参数
train_params:
  batch_size: 32
  epochs: 10
  learning_rate: 0.001

# 评估参数
eval_params:
  batch_size: 32

# 预测参数
predict_params:
  batch_size: 32

配置文件介绍

  • data_path: 指定处理后的数据文件路径。
  • model_params: 模型参数,包括隐藏层大小、层数和dropout率。
  • train_params: 训练参数,包括批次大小、训练轮数和学习率。
  • eval_params: 评估参数,包括批次大小。
  • predict_params: 预测参数,包括批次大小。
登录后查看全文
热门项目推荐