AMD GPU上的Ollama本地大模型部署指南

2025-07-05 12:44:42作者：裘晴惠Vivianne

Ollama是一个开源的本地大语言模型运行框架，它允许开发者在个人电脑上轻松部署和运行各种AI模型。对于使用AMD显卡的用户来说，通过ROCm（Radeon Open Compute）平台的支持，可以充分利用AMD GPU的并行计算能力来加速大语言模型的推理过程。

版本选择与硬件适配

本次发布的Ollama提供了三个主要版本，分别对应不同的ROCm版本：

ROCm 5.7版本：适用于gfx803、gfx900:xnack-、gfx902和gfx1103（测试）架构的GPU
ROCm 6.1.2版本：支持更广泛的GPU架构，包括gfx906:xnack-、gfx1010:xnack-、gfx1011、gfx1012:xnack-、gfx1030系列、gfx1100系列等
ROCm 6.2版本：最新支持版本

用户需要根据自己GPU的具体架构选择合适的版本。常见的AMD GPU架构包括：

如果遇到"amdgpu is not supported"错误，通常是由于：

解决方法：

通过正确配置，AMD GPU用户可以在本地高效运行各种大语言模型，享受低延迟的AI交互体验。不同版本的性能表现可能有所差异，建议用户根据自身硬件条件进行测试比较。

登录后查看全文