Jetson-Containers项目Ollama容器GPU加速问题深度解析

2025-06-27 01:55:06作者：卓艾滢Kingsley

问题背景

在NVIDIA Jetson AGX Orin等边缘计算设备上，用户通过jetson-containers项目部署Ollama大语言模型服务时，遇到了两个典型问题：一是容器启动时日志目录缺失导致服务异常，二是模型推理过程中GPU加速失效转而使用CPU计算。本文将深入分析问题成因并提供完整的解决方案。

问题现象分析

日志目录缺失问题

当用户执行标准部署流程：

克隆jetson-containers仓库
运行安装脚本
启动Ollama容器

容器启动时会报错"cannot open '/data/logs/ollama.log'"，导致Ollama服务无法正常运行。这是由于容器默认配置的日志目录在宿主机上不存在。

GPU加速失效问题

更严重的是，即使服务能够运行，模型推理时GPU利用率极低，主要计算负载都转移到了CPU上。通过jtop工具观察可见，GPU几乎处于空闲状态，而CPU负载很高，这与Jetson设备的硬件设计初衷相违背。

根本原因

经过技术团队深入排查，发现问题的根源在于：

容器环境配置问题：Ollama服务在容器内部无法正确检测和调用CUDA环境
Docker运行时配置：部分系统的nvidia-container-toolkit未正确配置
版本兼容性问题：Ollama项目近期的构建系统变更导致与Jetson环境的兼容性问题

完整解决方案

临时解决方案

对于急于使用的用户，可采用以下临时方案：

mkdir -p ~/data/logs

修改容器启动命令：

jetson-containers run -d --name ollama $(autotag ollama) bash -c "ollama serve"

永久解决方案

技术团队已推出官方修复方案，推荐用户按以下步骤操作：

更新项目代码：

git pull origin master

重建容器镜像（支持CUDA 12.6或12.8）：

CUDA_VERSION=12.6 jetson-containers build ollama
# 或
CUDA_VERSION=12.8 jetson-containers build ollama

验证Docker配置：确保/etc/docker/daemon.json中包含：

{
    "runtimes": {
        "nvidia": {
            "path": "nvidia-container-runtime",
            "runtimeArgs": []
        }
    },
    "default-runtime": "nvidia"
}