如何用ComfyUI Segment Anything实现精准图像分割？超简单教程来啦 🚀

2026-02-05 04:32:34作者：廉彬冶Miranda

ComfyUI Segment Anything是一款基于ComfyUI的开源图像分割工具，它能让你通过语义字符串轻松分割图像中的任何元素。作为sd-webui-segment-anything的ComfyUI版本，它继承了原项目的强大功能，同时提供更友好的操作体验，即使是新手也能快速上手！

📌 核心功能：用文字“指挥”AI分割图像

想象一下，只需输入简单的文字描述（比如“红色汽车”“蓝色天空”），AI就能自动识别并分割出图像中对应的元素——这就是ComfyUI Segment Anything的神奇之处！它基于GroundingDINO和SAM两大模型构建，实现了从文本指令到精准图像分割的全流程自动化。

图：使用ComfyUI Segment Anything分割图像的示例效果，展示AI如何根据语义指令精准提取图像元素

✨ 为什么选择它？三大亮点揭秘

零代码门槛：无需编写复杂代码，通过ComfyUI界面即可完成操作
输出一致性：与sd-webui-segment-anything保持相同输入输出结果，迁移成本极低
模型自动下载：首次使用时自动配置所需模型，省去手动部署烦恼

🚀 三步快速上手：从安装到分割

1️⃣ 一键安装依赖

在项目根目录执行以下命令，自动安装所有必要依赖：

pip3 install -r requirements.txt

2️⃣ 模型自动配置

首次运行时，系统会自动下载所需模型（也可手动下载）：

语言理解核心：local_groundingdino/models/GroundingDINO/bertwarper.py 中集成的bert-base-uncased模型
目标定位引擎：GroundingDINO系列模型（支持SwinT_OGC和SwinB两种版本）
分割执行模块：sam_hq/modeling/mask_decoder_hq.py 实现的SAM-HQ高分辨率分割模型

⚠️ 提示：若下载速度慢，可设置HTTP_PROXY环境变量使用代理加速

3️⃣ 启动ComfyUI开始分割

将项目添加到ComfyUI的自定义节点目录，重启ComfyUI后即可在界面中找到Segment Anything相关节点，拖拽连接即可开始你的图像分割之旅！

🧩 技术原理浅析：两大模型如何协作？

GroundingDINO定位目标：通过local_groundingdino/models/GroundingDINO/groundingdino.py 实现文本与图像的跨模态理解，精准定位文字描述对应的区域
SAM-HQ精细分割：利用sam_hq/predictor.py 中的高效算法，对定位区域进行像素级分割，生成高质量掩码