ChatIE项目部署实战指南：从零开始搭建智能信息抽取系统

2026-04-30 10:37:50作者：翟萌耘Ralph

The online version is temporarily unavailable because we cannot afford the key. You can clone and run it locally. Note: we set defaul openai key. If keys exceed plan and are invalid, please tell us. The response speed depends on openai. ( sometimes, the official is too crowded and slow)

项目地址：https://gitcode.com/gh_mirrors/ch/ChatIE

一、环境准备：部署前的必要配置

1.1 开发环境要求

🔧 基础环境：Python 3.8+、Node.js 14+、npm 6+
📁 硬件建议：至少4GB内存（推荐8GB以上）
⌛ 预计10分钟

1.2 项目获取

通过Git克隆仓库到本地：

git clone https://gitcode.com/gh_mirrors/ch/ChatIE
cd ChatIE

1.3 目录结构解析

核心目录	功能说明	关键文件
tools/back-end	后端服务模块	run.py（启动脚本）、access.py（权限控制）
tools/front-end	前端React应用	src/App.js（主组件）、package.json（依赖配置）
docs/examples	功能示例截图	RE-3.png（关系抽取示例）、result.jpeg（模型性能表）
docs/prompts	提示词模板	ner.prompt（命名实体识别模板）

二、核心功能解析：ChatIE能做什么

ChatIE是一款基于自然语言处理的智能信息抽取系统，主要提供三大核心能力：

2.1 命名实体识别（NER）

自动识别文本中的关键实体（如人物、时间、地点等）。例如从影视简介中提取导演、主演等信息。

2.2 关系抽取（RE）

识别实体间的语义关系。以下是系统处理示例：

图1：关系抽取任务界面，展示从文本中提取"上映时间"、"导演"等关系对的过程

2.3 事件抽取（EE）

提取文本中的事件要素（如时间、地点、参与者等）。系统框架如下：

图2：ChatIE系统架构，展示NER/RE/EE三大模块的协同工作流程

三、快速启动：5分钟部署流程

3.1 后端服务启动

⌛ 预计3分钟

cd tools/back-end
python run.py

📌 配置小贴士：首次启动会加载默认模型参数，如遇API密钥错误，请检查tokens.txt文件

3.2 前端应用启动

⌛ 预计2分钟

cd tools/front-end
npm install  # 安装依赖
npm run start  # 启动开发服务器

启动成功后访问 http://localhost:3000 即可打开前端界面

四、配置详解：定制你的ChatIE系统

4.1 后端配置优化

核心配置文件：tools/back-end/access.py
主要参数说明：

API_TIMEOUT：API请求超时时间（默认30秒）
MAX_TOKENS：单次请求最大令牌数（默认1000）

📝 配置小贴士：修改tokens.txt文件可添加自定义API密钥，支持多密钥轮询使用

4.2 前端参数调整

在tools/front-end/src/Utils/ApiUtil.js中配置：

BASE_URL：后端服务地址（默认http://localhost:5000）
REQUEST_INTERVAL：请求间隔时间（默认1000ms）

五、性能评估：ChatIE的表现如何

系统在多语言数据集上的F1分数表现如下：

图3：ChatIE与其他模型在六个数据集上的F1分数对比

关键指标说明：

RE（关系抽取）：最高70.9分
NER（命名实体识别）：最高58.4分
EE（事件抽取）：最高72.0分

六、常见问题解决

6.1 后端启动失败

检查Python依赖是否安装：pip install -r requirements.txt
确认端口是否被占用：lsof -i:5000

6.2 前端界面空白

清除npm缓存：npm cache clean --force
检查后端服务是否正常运行

6.3 抽取结果不理想

尝试调整docs/prompts下的提示词模板
增加输入文本的上下文信息

通过以上步骤，你已完成ChatIE项目的本地化部署。如需进一步扩展功能，可参考docs/src/readme.md中的开发指南进行二次开发。

The online version is temporarily unavailable because we cannot afford the key. You can clone and run it locally. Note: we set defaul openai key. If keys exceed plan and are invalid, please tell us. The response speed depends on openai. ( sometimes, the official is too crowded and slow)

项目地址：https://gitcode.com/gh_mirrors/ch/ChatIE

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优