text-generation-webui本地部署指南：零基础用户的AI文本生成工具安装解决方案

2026-04-13 09:40:02作者：田桥桑Industrious

text-generation-webui是一款开源的AI文本生成工具，通过本指南提供的一键安装脚本，即使没有技术背景的用户也能实现零门槛的本地部署。本文将详细介绍从环境准备到模型优化的全流程，帮助用户快速搭建专属的AI文本生成环境，掌握模型部署的核心技巧。

准备篇：环境预检与系统要求

硬件配置要求

部署text-generation-webui前，请确保您的计算机满足以下基本要求：

处理器：至少双核CPU，推荐四核及以上
内存：最低8GB RAM，推荐16GB及以上
存储：至少10GB可用空间，建议使用SSD以提高模型加载速度
网络：稳定的互联网连接，用于下载依赖包和模型文件
显卡：NVIDIA显卡（支持CUDA加速）可显著提升性能，AMD显卡需额外配置

[!NOTE] 老旧电脑用户可选择较小的7B参数模型，并关闭图形界面以减少资源占用。

系统兼容性检查

本一键安装方案支持以下操作系统：

Windows系统：Windows 10及以上版本
Linux系统：基于Ubuntu 20.04或更高版本的发行版
macOS系统：macOS 10.15及以上版本
WSL环境：Windows Subsystem for Linux（适用于Windows 10/11专业版或企业版）

权限与依赖准备

不同系统需要提前准备的权限和基础依赖：

Windows：管理员权限，无需提前安装额外依赖
Linux：sudo权限，需预先安装git
macOS：管理员权限，需安装Xcode命令行工具
WSL：已启用WSL功能，并安装相应的Linux发行版

部署篇：多平台安装步骤详解

Windows系统安装流程

打开命令提示符（CMD），执行以下命令克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/on/one-click-installers
cd one-click-installers

执行原理：通过git工具将项目代码下载到本地，并进入项目目录。

预期结果：命令执行完成后，当前目录将显示项目文件列表。

在文件资源管理器中找到下载的文件夹，双击运行start_windows.bat文件。

执行原理：批处理脚本将自动安装Miniconda环境，配置Python依赖，并启动text-generation-webui。

[!NOTE] 如果出现权限问题，请右键点击脚本选择"以管理员身份运行"。部分安全软件可能会拦截脚本执行，需要暂时关闭或添加信任。

等待脚本自动完成环境配置和依赖安装。

预期结果：脚本执行完成后，将自动打开浏览器显示web界面，或在命令行中显示访问地址。

Linux系统安装流程

打开终端，安装git工具（如已安装可跳过）：

sudo apt update && sudo apt install git -y

执行原理：更新系统软件源并安装git版本控制工具。

git clone https://gitcode.com/gh_mirrors/on/one-click-installers
cd one-click-installers

为脚本添加执行权限并运行：

chmod +x start_linux.sh
./start_linux.sh

执行原理：赋予shell脚本执行权限并运行，脚本将自动处理环境配置和依赖安装。

[!NOTE] AMD显卡用户可能需要额外安装依赖：
sudo apt-get install libstdc++-12-dev

macOS系统安装流程

打开终端，安装Xcode命令行工具：

xcode-select --install

执行原理：安装Apple开发工具套件，提供编译和构建所需的基础组件。

git clone https://gitcode.com/gh_mirrors/on/one-click-installers
cd one-click-installers

为脚本添加执行权限并运行：

chmod +x start_macos.sh
./start_macos.sh

WSL环境安装流程

确保已在Windows系统中启用WSL功能。
打开文件资源管理器，找到下载的项目文件夹，双击运行start_wsl.bat文件。

执行原理：批处理脚本将在WSL环境中自动配置并启动text-generation-webui。

等待脚本自动完成安装过程。

优化篇：性能调优与资源管理

启动参数配置

通过编辑CMD_FLAGS.txt文件可以添加自定义启动参数，优化运行效果：

--api
--listen
--auto-devices
--load-in-8bit

常用参数说明：

--api：启用API接口，允许外部程序调用
--listen：允许局域网内其他设备访问
--auto-devices：自动分配GPU/CPU内存
--load-in-8bit：使用8位量化减少内存占用

执行原理：这些参数会传递给webui启动命令，控制程序的运行方式和资源分配。

模型选择与管理

首次启动成功后，建议按照以下步骤选择和加载模型：

打开Web界面，进入"Model"选项卡
在模型列表中选择合适的语言模型
点击下载按钮，等待下载完成
下载完成后点击"Load"按钮加载模型

[!NOTE] 低配置电脑建议先尝试较小的模型如"7B"系列，体验效果后再考虑更大的模型。

内存优化技巧

针对不同硬件配置，可采用以下内存优化策略：

使用量化模型：选择4位或8位量化版本，可减少50%左右的内存占用
调整批处理大小：在设置中降低批处理参数，减少单次生成的内存使用
启用自动内存管理：添加--auto-devices参数，让系统自动分配内存资源
关闭不必要功能：如不使用语音功能可在设置中禁用相关模块

存储优化建议

有效管理存储空间的方法：

将模型文件存储在外部存储设备，通过符号链接关联到程序目录
定期清理不再使用的模型文件，释放磁盘空间
使用命令行参数指定模型存储路径，避免占用系统盘空间

进阶篇：系统维护与高级应用

版本更新方法

保持工具最新版本的步骤：

Windows系统：运行update_windows.bat文件
Linux系统：在终端执行./update_linux.sh
macOS系统：在终端执行./update_macos.sh
WSL环境：运行update_wsl.bat文件

执行原理：更新脚本会拉取最新的代码并更新依赖，确保用户获得最新功能和安全修复。

常见问题诊断

安装和使用过程中可能遇到的问题及解决方法：

权限问题
- 症状：脚本执行失败，提示权限不足
- 解决：使用管理员/root权限重新运行脚本
网络问题
- 症状：下载依赖或模型时失败
- 解决：检查网络连接，确认防火墙设置，必要时使用网络代理
依赖冲突
- 症状：程序启动时报错，提示模块版本不兼容
- 解决：不要在已有Python环境中运行，让脚本创建独立的Miniconda环境
存储空间不足
- 症状：安装过程中断，提示磁盘空间不足
- 解决：清理磁盘确保至少10GB可用空间，可选择安装到其他分区

性能调优高级技巧

根据硬件配置调整参数，平衡速度与质量：

调整生成文本长度：修改"max_new_tokens"参数控制输出文本长度
控制输出随机性：调整"temperature"参数（0.1-1.0），值越低输出越确定
使用指令模板：选择合适的"instruction template"优化特定任务的输出格式
启用模型缓存：添加--cache参数，加快模型加载速度

学习路径建议

从入门到精通的成长之路：

基础阶段：完成安装并成功运行默认模型，熟悉web界面基本操作
进阶阶段：尝试不同模型，调整参数优化输出质量，学习模型特性
高级阶段：使用API接口开发自定义应用，实现与其他系统的集成
专家阶段：探索模型微调与自定义训练，针对特定任务优化模型性能

通过本指南，您已经掌握了text-generation-webui的安装与基础配置方法。随着使用深入，您将发现更多强大功能，开启AI文本创作的无限可能。无论是内容创作、开发测试还是学术研究，这款工具都能为您提供高效便捷的文本生成体验。

one-click-installers

Simplified installers for oobabooga/text-generation-webui.

项目地址：https://gitcode.com/gh_mirrors/on/one-click-installers

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

413

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java