Roleplay-with-XiYou 的项目扩展与二次开发

2025-05-20 07:52:58作者：翟江哲Frasier

项目的基础介绍

Roleplay-with-XiYou 是一个基于《西游记》原文、白话文、ChatGPT生成数据制作的，以InternLM2微调的角色扮演多LLM聊天室。该项目提供了一个有趣的环境，用户可以与扮演成唐僧、孙悟空、猪八戒和沙悟净等角色的LLM进行互动。此外，项目还包括了模型的训练、微调、部署以及聊天室功能等。

项目的核心功能

项目的核心功能包括：

角色扮演：用户可以与扮演成唐僧、孙悟空、猪八戒和沙悟净等角色的LLM进行互动。
数据获取与处理：项目提供了多种方式获取《西游记》相关数据，包括基础问题重复询问、原文短对话提取和原文长对话提取等。
模型训练与微调：项目使用了XTuner进行模型的微调和训练。
模型部署：项目提供了使用LMDeploy进行模型部署的方式，方便用户将模型部署到自己的环境中。

项目使用了哪些框架或库？

项目使用了以下框架和库：

InternLM2：用于生成角色扮演的文本。
XTuner：用于模型的微调和训练。
LMDeploy：用于模型的部署。

项目的代码目录及介绍

项目的代码目录如下：

Roleplay-with-XiYou/
├── XiYou-Chatroom-frontend
├── deploy
├── figure
├── tools/
│   ├── get_data
│   │   ├── Q2A
│   │   │   └── q2a_api.py
│   │   └── extract-dialogue
│   │       ├── OpenAI_LLM.py
│   │       ├── main.py
│   │       └── process_data.py
├── train
└── ...

XiYou-Chatroom-frontend: 聊天室前端代码。
deploy: 模型部署相关代码。
figure: 项目中的图片等资源。
tools/get_data/Q2A/q2a_api.py: 基础问题重复询问脚本。
tools/get_data/extract-dialogue/OpenAI_LLM.py: 原文短对话提取脚本。
tools/get_data/extract-dialogue/main.py: 原文短对话提取脚本。
tools/get_data/extract-dialogue/process_data.py: 对话内容转换为xtuner可用格式的脚本。
train: 模型训练相关代码。
...: 其他代码和资源。