如何用 ComfyUI Segment Anything 实现精准图像分割？完整指南

2026-01-25 04:27:27作者：滕妙奇

ComfyUI Segment Anything 是一款基于 GroundingDino 和 SAM 技术的图像分割工具，它能通过语义字符串精准分割图像中的任何元素，是 sd-webui-segment-anything 的 ComfyUI 版本。本文将为你详细介绍这款强大工具的核心功能、安装步骤和实际应用方法，帮助你轻松掌握图像分割技巧。

🚀 核心功能：让图像分割更智能

ComfyUI Segment Anything 结合了 GroundingDino 和 SAM（Segment Anything Model）两大先进技术，实现了语义驱动的图像分割。只需输入简单的文本提示，如“face”、“tree”或“car”，工具就能自动识别并分割出图像中对应的元素。这种基于自然语言的交互方式，大大降低了图像分割的操作门槛，即使是新手也能快速上手。

图：ComfyUI Segment Anything 工作流程示例，展示了从加载图像、输入文本提示到生成分割结果的完整过程。

📦 一键安装：简单几步即可使用

安装 ComfyUI Segment Anything 非常简单，只需按照以下步骤操作：

克隆仓库：

git clone https://gitcode.com/gh_mirrors/co/comfyui_segment_anything

cd comfyui_segment_anything

运行安装脚本：

python install.py

安装脚本会自动下载所需的模型文件和依赖库，你只需耐心等待安装完成即可。

💡 快速上手：3 分钟完成首次图像分割

使用 ComfyUI Segment Anything 进行图像分割的基本步骤如下：

加载图像：通过 Load Image 节点选择需要分割的图像文件。
加载模型：分别加载 GroundingDino 模型（GroundingDinoModelLoader）和 SAM 模型（SAMModelLoader）。
设置参数：在 GroundingDinoSAMSAMSegment 节点中输入文本提示（如“face”）和阈值（建议设置为 0.3）。
执行分割：连接节点并运行工作流，即可生成分割结果。
预览结果：通过 Preview Image 节点查看原始图像和分割后的掩码。

🛠️ 高级技巧：提升分割效果的实用方法

调整阈值：阈值越高，分割结果越精确但可能遗漏部分区域；阈值越低，分割范围越广但可能包含无关区域。建议根据实际需求调整，通常 0.2-0.4 之间效果较好。
使用复杂提示：可以输入多个关键词，如“red shirt, blue pants”，实现多目标同时分割。
结合其他节点：通过 invertMask 节点可以反转掩码，Convert Mask to Image 节点可以将掩码转换为图像格式，方便后续处理。

📚 项目结构：了解工具背后的技术

ComfyUI Segment Anything 的核心代码和模型文件组织如下：

模型相关：local_groundingdino/ 目录包含 GroundingDino 模型的实现，sam_hq/ 目录包含 SAM 模型的实现。
节点定义：node.py 文件定义了 ComfyUI 中的各种节点，如模型加载、图像分割等。
安装脚本：install.py 负责下载模型和安装依赖。
依赖列表：requirements.txt 列出了项目所需的 Python 库。