AMD GPU上的Ollama本地大模型部署指南

2025-07-05 20:08:54作者：伍希望

Get up and running with Llama 3, Mistral, Gemma, and other large language models.by adding more amd gpu support.

项目地址：https://gitcode.com/gh_mirrors/ol/ollama-for-amd

Ollama是一个开源的本地大语言模型运行框架，能够让用户在个人电脑上高效运行各类AI模型。本文将详细介绍如何在配备AMD显卡的Windows系统上部署最新版本的Ollama框架。

项目概述

Ollama项目为AMD GPU用户提供了优化的本地大模型运行环境。通过集成ROCm计算平台，该项目使得AMD显卡也能高效运行各类AI模型，包括但不限于LLaMA、GPT等主流大语言模型。最新发布的v0.6.3版本基于ROCm 6.2.4计算平台构建，相比之前版本在性能和兼容性上都有显著提升。

系统要求与准备工作

在开始安装前，请确认您的系统满足以下要求：

硬件要求：
- AMD显卡需支持以下架构之一：gfx906、gfx1010、gfx1011、gfx1012、gfx1030系列、gfx1100系列或gfx1150（实验性支持）
- 建议显存不低于8GB以获得较好体验
软件环境：
- Windows 10/11 64位操作系统
- 建议安装最新版AMD显卡驱动

安装步骤详解

方法一：使用安装程序（推荐）

下载OllamaSetup.exe安装包
运行安装程序，按照向导完成安装
安装完成后，进入安装目录（通常位于用户目录下的AppData/Local/Programs/Ollama）

方法二：手动安装（适合高级用户）

下载ollama-windows-amd64.7z压缩包
解压到目标目录
通过命令行进入解压目录

ROCm库配置关键步骤

无论采用哪种安装方式，配置正确的ROCm库都是确保Ollama正常运行的关键：

定位ROCm库目录：
- 安装程序方式：查找ollama/lib/ollama/rocm目录
- 手动安装方式：查找解压目录下的对应位置
更新ROCm库：
- 删除现有的rocblas/library文件夹
- 下载并替换为对应版本的ROCm库文件
- 确保库文件版本与您的GPU架构匹配

启动与使用

完成上述步骤后，可以通过以下方式启动Ollama：

命令行方式：
- 直接运行ollama命令
- 使用ollama run命令加载特定模型
- 通过./ollama serve启动服务
图形界面（如有）：
- 部分版本可能提供图形界面入口

常见问题排查

若遇到"amdgpu is not supported"等错误提示，请检查：

ROCm库是否正确替换
GPU架构是否在支持列表中
安装步骤是否完整执行

性能优化建议

根据模型大小调整批处理参数
监控显存使用情况，适当调整模型参数
保持驱动和框架版本更新

结语

通过本文介绍的步骤，AMD GPU用户现在可以充分利用硬件性能在本地运行各类大语言模型。随着ROCm生态的不断完善，AMD平台的大模型计算能力将持续提升，为用户带来更流畅的AI体验。建议定期关注项目更新，以获取最新功能和性能优化。

Get up and running with Llama 3, Mistral, Gemma, and other large language models.by adding more amd gpu support.

项目地址：https://gitcode.com/gh_mirrors/ol/ollama-for-amd

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统