ComfyUI_LLM_Party项目中GOT-OCR2模块的CUDA设备兼容性问题解析

2025-07-10 07:29:44作者：龚格成

Dify in comfyui. Compatible with Omost. Adapted to all models with an interface similar to OpenAI’s, such as: Tongyi Qianwen/qwen, Zhipu Qingyan/GLM, Deepseek, Kimi/Moonshot.（comfyui中的Dify，已兼容Omost，适配了所有具有类似openai接口的模型，例如：通义千问/qwen、智谱清言/GLM、deepseek、kimi/moonshot。）

项目地址：https://gitcode.com/gh_mirrors/co/comfyui_LLM_party

在ComfyUI_LLM_Party项目中使用GOT-OCR2模块进行OCR处理时，开发者可能会遇到两个典型的CUDA设备兼容性问题。这些问题主要与深度学习模型在不同硬件环境下的运行配置有关。

问题一：bfloat16数据类型不支持

当运行GOT-OCR2模块时，系统会抛出"Current CUDA Device does not support bfloat16"的错误。这是由于模型默认尝试使用bfloat16(brain floating point 16)数据类型进行运算，但当前CUDA设备不支持这种数据类型。

bfloat16是一种特殊的16位浮点格式，相比传统的float16，它保留了与float32相同的指数位，能够提供更好的数值稳定性，同时减少内存占用。然而，这种数据类型需要特定的硬件支持，主要出现在较新的NVIDIA GPU(如Ampere架构及以上)中。

问题二：设备字符串解析错误

另一个常见错误是"Expected one of cpu, cuda..."，这表明在指定计算设备时使用了无效的设备字符串"auto"。PyTorch期望明确的设备类型标识符，如"cuda"或"cpu"，而不是自动选择的关键字。

解决方案

项目维护者已经修复了这些问题，现在GOT-OCR2模块可以灵活地选择不同的数据类型(dtype)运行。对于不支持bfloat16的设备，开发者可以：

将数据类型切换为float16，这是大多数CUDA设备都支持的高效计算格式
明确指定计算设备为"cuda"或"cpu"，而不是使用"auto"关键字

技术建议

在实际部署中，开发者应当：

检查CUDA设备的计算能力，确认支持的浮点精度类型
根据任务需求在精度和性能之间做出权衡：float16通常能提供更好的性能，而bfloat16在训练稳定性上更有优势
对于不支持bfloat16的设备，考虑使用混合精度训练技术，结合float16和float32的优势

这些改进使得GOT-OCR2模块能够在更广泛的硬件环境中稳定运行，为ComfyUI_LLM_Party项目的用户提供了更好的兼容性体验。

comfyui_LLM_party

项目地址：https://gitcode.com/gh_mirrors/co/comfyui_LLM_party

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统