【亲测免费】 CMeKG_tools 安装与配置完全指南

2026-01-20 02:50:21作者：庞眉杨Will

项目地址：https://gitcode.com/gh_mirrors/cm/CMeKG_tools

项目基础介绍

CMeKG_tools 是一个强大的开源项目，专注于中文医学知识图谱（Chinese Medical Knowledge Graph, CMeKG）的构建。它利用自然语言处理(NLP)与文本挖掘技术，通过对大规模医学文本数据的分析，采用人机协作模式，提供了三大核心功能组件：医学文本分词、医学实体识别以及医学关系抽取。项目基于Python语言，非常适合医学信息处理、NLP研究人员及开发者。

关键技术和框架

Python: 作为主编程语言，支持丰富的NLP库。
BERT: 强大的预训练模型用于关系抽取，属于transformers库的一部分。
PyTorch: 深度学习框架，用于模型的训练和调优。
Numpy: 数学运算库，常用于数据预处理。
Torch: 与PyTorch紧密相关，提供更多的深度学习工具。
tqdm: 提供进度条，提升用户体验。
random, json, re: 标准库，用于数据处理和配置管理。

准备工作与安装步骤

第一步：环境准备

安装Python: 确保您的计算机已安装Python 3.6或更高版本。
```
python --version
```
如未安装或版本不符，请访问Python官方网站下载安装。

安装虚拟环境: （推荐）为了项目隔离，建议使用虚拟环境。

pip install virtualenv
virtualenv cmekg_env
source cmekg_env/bin/activate  # 对于Windows，使用命令 `cmekg_env\Scripts\activate`

第二步：克隆项目

在本地创建一个工作目录，并通过Git克隆仓库。

git clone https://github.com/king-yyf/CMeKG_tools.git
cd CMeKG_tools

第三步：安装依赖

使用pip安装项目所需的依赖。
```
pip install -r requirements.txt
```

第四步：下载模型

注意：项目中的模型并未直接包含在仓库内，你需要手动下载。模型位于百度网盘，链接和密码可在README.md文件中找到。分别下载关系抽取(RE)、医学实体识别(NER)和分词(CWS)的模型，并按说明放置在相应目录下。
```
- RE模型: 链接: https://pan.baidu.com/s/1cIse6JO2H78heXu7DNewmg 密码: 4s6k
- NER模型: 链接: https://pan.baidu.com/s/16TPSMtHean3u9dJSXF9mTw 密码: shwh
- 分词模型: 链接: https://pan.baidu.com/s/1bU3QoaGs2IxI34WBx7ibMQ 密码: yhek
```