【亲测免费】 ComfyUI YoloWorld-EfficientSAM 技术文档

2026-01-25 04:03:18作者：贡沫苏Truman

ComfyUI-YoloWorld-EfficientSAM

Unofficial implementation of YOLO-World + EfficientSAM for ComfyUI

项目地址：https://gitcode.com/gh_mirrors/co/ComfyUI-YoloWorld-EfficientSAM

安装指南

使用 ComfyUI Manager 安装（即将推出）

正式支持通过ComfyUI Manager进行一键安装的方式还在开发中，请稍候。

手动安装步骤

克隆项目: 在ComfyUI的custom_nodes目录下执行以下命令:

cd custom_nodes
git clone https://github.com/ZHO-ZHO-ZHO/ComfyUI-YoloWorld-EfficientSAM.git

安装依赖: 切换到项目目录并安装Python依赖:

cd ComfyUI-YoloWorld-EfficientSAM
pip install -r requirements.txt

下载模型: 访问Hugging Face下载efficient_sam_s_cpu.jit和efficient_sam_s_gpu.jit, 确保将它们放置在custom_nodes/ComfyUI-YoloWorld-EfficientSAM目录内。
重启ComfyUI: 完成上述步骤后，重启您的ComfyUI以确保节点正确加载。

项目使用说明

V2.0核心特性

图像与视频处理: 全新版本支持对图像和视频应用目标检测和分割。
蒙版操作: 引入蒙版分离和提取功能，可以单独输出特定蒙版。
定制配置: 用户可以根据需要调整如置信度阈值、IoU阈值等参数。

使用流程

导入工作流: 从V2.0的工作流文件中选择适合您需求的JSON文件导入ComfyUI。
配置节点: 根据项目需求，调整节点如YOLO-World ESAM中的各类参数，例如confidence_threshold, iou_threshold等。
输入数据: 提供测试图片或视频作为输入，并设置相应的检测类别。
执行检测: 点击运行，查看目标检测和分割结果。

项目API使用文档

YOLO-World Model Loader
- 作用: 自动加载三种预训练模型之一(yolo_world/l, m, s)。
ESAM Model Loader
- 支持: 可选择CUDA加速或CPU模式运行。
YOLO-World ESAM
- 参数:
  - yolo_world_model: 选择YOLO-World模型。
  - esam_model: 加载EfficientSAM模型。
  - categories: 设定检测目标类别。
  - confidence_threshold, iou_threshold: 控制检测精度。
  - with_segmentation: 开启/关闭分割功能。
  - 更多详细参数见节点说明，支持高度自定义输出。
Yoloworld ESAM Detector Provider
- 新增特性: 提供额外集成选项，特别适配Impact-Pack。

项目安装方式（重复信息，参照安装指南）

已包含在上方的安装指南中，手动安装和未来计划通过ComfyUI Manager的安装方法皆有涉及。

通过遵循以上步骤，您可以成功部署并开始利用ComfyUI YoloWorld-EfficientSAM进行高效的目标检测和实例分割任务。记得，根据实际需求调整参数以优化您的应用体验。如有疑问，可通过提供的联系方式与开发者取得沟通。

ComfyUI-YoloWorld-EfficientSAM

Unofficial implementation of YOLO-World + EfficientSAM for ComfyUI

项目地址：https://gitcode.com/gh_mirrors/co/ComfyUI-YoloWorld-EfficientSAM

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

deepin linux kernel

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook