你的RTX 4090终于有用了！保姆级教程，5分钟在本地跑起DeepSeek-R1，效果惊人

2026-02-04 04:46:32作者：农烁颖Land

探索新一代推理模型，DeepSeek-R1系列以大规模强化学习为基础，实现自主推理，表现卓越，推理行为强大且独特。开源共享，助力研究社区深入探索LLM推理能力，推动行业发展。【此简介由AI生成】

项目地址：https://gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-R1

写在前面：硬件门槛

在开始之前，我们需要明确运行DeepSeek-R1所需的硬件配置。经过仔细查阅官方文档和相关信息，我们发现DeepSeek-R1系列模型对显存的要求较高。以下是具体的硬件要求：

GPU显存：官方推荐至少24GB显存，以确保模型能够顺利加载和运行。例如，NVIDIA RTX 4090（24GB显存）或NVIDIA A100（40GB/80GB显存）是理想的选择。
CPU：建议使用多核高性能CPU，如Intel i7或AMD Ryzen 7及以上。
内存：至少32GB RAM，以确保数据处理和模型加载的流畅性。

如果你的硬件配置不符合上述要求，可能会遇到显存不足或性能瓶颈的问题。请确保你的设备满足最低要求后再继续。

环境准备清单

在安装DeepSeek-R1之前，请确保你的系统环境满足以下要求：

操作系统：支持Linux（推荐Ubuntu 20.04或更高版本）和Windows（需通过WSL 2运行）。
Python版本：Python 3.8或更高版本。
PyTorch：安装PyTorch 1.12或更高版本，并确保支持CUDA 11.7及以上。
CUDA Toolkit：安装与你的GPU驱动兼容的CUDA版本（如CUDA 11.7或12.0）。
其他依赖：包括transformers、accelerate等库。

你可以通过以下命令安装必要的依赖：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
pip install transformers accelerate

模型资源获取

DeepSeek-R1的模型可以通过以下方式下载：

官方推荐方式：使用huggingface-cli工具下载模型：

huggingface-cli download deepseek-ai/DeepSeek-R1 --local-dir ./DeepSeek-R1

手动下载：访问官方提供的模型页面，手动下载模型文件并解压到本地目录。

逐行解析“Hello World”代码

以下是官方提供的快速上手代码，我们将逐行解析其作用：

from transformers import AutoModelForCausalLM, AutoTokenizer

# 加载模型和分词器
model_name = "deepseek-ai/DeepSeek-R1"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 输入文本
input_text = "DeepSeek-R1是一款强大的推理模型，它的特点是"

# 生成文本
input_ids = tokenizer.encode(input_text, return_tensors="pt")
output = model.generate(input_ids, max_length=100, num_return_sequences=1)
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

print(generated_text)

代码解析：

导入库：AutoModelForCausalLM和AutoTokenizer是Hugging Face提供的工具，用于加载模型和分词器。
加载模型和分词器：通过from_pretrained方法加载预训练的DeepSeek-R1模型和对应的分词器。
输入文本：定义一段输入文本，作为模型的提示。
生成文本：使用model.generate方法生成文本，max_length参数控制生成文本的最大长度。
输出结果：将生成的文本解码并打印。

运行与结果展示

运行上述代码后，你将会看到类似以下的输出：

DeepSeek-R1是一款强大的推理模型，它的特点是能够通过大规模强化学习（RL）直接训练基础模型，而无需依赖监督微调（SFT）作为初步步骤。这种独特的方法使得模型能够探索复杂的思维链（CoT）来解决问题。

这表明模型已经成功运行，并生成了符合预期的文本。

常见问题（FAQ）与解决方案

问题1：显存不足（OOM）

现象：运行时报错CUDA out of memory。 解决方案：

降低max_length参数的值。
使用更小的模型版本（如DeepSeek-R1-Distill系列）。

问题2：依赖冲突

现象：安装依赖时提示版本冲突。 解决方案：

创建一个新的虚拟环境并重新安装依赖。
使用pip install --upgrade升级冲突的库。

问题3：下载失败

现象：模型下载过程中断或失败。 解决方案：

检查网络连接，尝试使用代理或手动下载模型文件。

希望这篇教程能帮助你顺利运行DeepSeek-R1！如果有任何问题，欢迎在评论区交流。

探索新一代推理模型，DeepSeek-R1系列以大规模强化学习为基础，实现自主推理，表现卓越，推理行为强大且独特。开源共享，助力研究社区深入探索LLM推理能力，推动行业发展。【此简介由AI生成】

项目地址：https://gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-R1

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。