BigDL项目：Ollama在iGPU与A770双显卡环境下的崩溃问题分析与解决

2025-05-29 12:32:40作者：彭桢灵Jeremy

问题背景

在使用BigDL项目的Ollama服务时，用户遇到了一个典型的硬件兼容性问题。该用户配置了一台搭载Ultra 185H处理器（内置Arc GPU）和独立Arc A770显卡的PC，拥有96GB内存。在尝试启动Ollama服务时，系统出现了崩溃现象。

错误分析

从错误日志中可以观察到几个关键点：

崩溃发生在系统信息打印阶段（llama_print_system_info）
错误代码0xe06d7363是Windows系统常见的异常代码
调用栈显示问题出现在GPU相关的底层交互环节

根本原因

经过技术分析，这个问题主要由以下因素导致：

驱动版本不兼容：系统安装的GPU驱动程序版本过旧，无法正确处理双显卡环境下的资源分配
硬件资源冲突：内置Arc GPU与独立Arc A770显卡之间存在资源分配冲突
系统环境问题：原始操作系统环境可能存在配置问题

解决方案

针对这个问题，有以下几种解决方法：

方法一：更新GPU驱动

访问Intel官方网站下载最新版GPU驱动
完全卸载旧版驱动后安装新版
重启系统使更改生效

方法二：系统重装（用户最终采用的方案）

安装Ubuntu 24.10或更新版本
确保系统自动安装最新驱动
重新配置Ollama环境

方法三：指定运行设备

通过环境变量指定Ollama使用的GPU设备
可以尝试禁用其中一块显卡

技术建议

对于类似的多GPU环境，建议：

保持驱动更新：定期检查并更新显卡驱动
系统兼容性：优先选择经过验证的Linux发行版
环境隔离：考虑使用容器技术隔离不同GPU的工作负载
日志分析：出现问题时保存完整日志以便诊断

结论

多GPU环境下的兼容性问题在现代AI计算中较为常见。通过更新驱动或升级系统通常可以解决大部分兼容性问题。BigDL项目的Ollama服务对硬件环境有一定要求，用户在部署时应特别注意驱动版本和系统环境的兼容性。

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

AtomGit CLI （ag cli），AtomGit 命令行工具，参考 GitHub CLI (gh) 开发。目前 atomgit-cli 项目已在 AtomCode 的 Coding Plan 项目列表中

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook