EmbedSeg项目2D图像分割训练教程

2025-07-08 05:55:53作者：凤尚柏Louis

前言

EmbedSeg是一个基于嵌入的实例分割框架，本教程将详细介绍如何使用EmbedSeg对2D图像进行实例分割模型的训练。我们将以usiigaci-2017数据集为例，逐步讲解训练流程中的各个关键环节。

环境准备

首先需要导入必要的Python库：

import numpy as np
import os
from EmbedSeg.train import begin_training
from EmbedSeg.utils.create_dicts import create_dataset_dict, create_model_dict, create_loss_dict, create_configs
import torch
from matplotlib.colors import ListedColormap
import json

数据集配置

数据路径设置

指定训练和验证数据的路径以及中心点嵌入类型：

data_dir = 'crops'  # 数据目录
project_name = 'usiigaci-2017'  # 项目名称
center = 'medoid'  # 中心点类型：'medoid', 'approximate-medoid', 'centroid'

中心点类型的选择会影响模型学习实例表示的方式：

medoid: 使用实例的几何中心
approximate-medoid: 近似几何中心
centroid: 质心

数据属性加载

从data_properties.json文件中读取数据集属性：

if os.path.isfile('data_properties.json'):
    with open('data_properties.json') as json_file:
        data = json.load(json_file)
        one_hot, data_type, foreground_weight, n_y, n_x = data['one_hot'], data['data_type'], int(data['foreground_weight']), int(data['n_y']), int(data['n_x'])

训练数据集配置

参数设置

train_size = len(os.listdir(os.path.join(data_dir, project_name, 'train', 'images')))
train_batch_size = 16

train_size: 一个epoch中网络看到的图像-掩码对数量，通常设置为训练图像裁剪块的总数
train_batch_size: 训练批次大小

创建训练数据集字典

train_dataset_dict = create_dataset_dict(
    data_dir=data_dir,
    project_name=project_name,
    center=center,
    size=train_size,
    batch_size=train_batch_size,
    one_hot=one_hot,
    type='train'
)

验证数据集配置

参数设置

val_size = len(os.listdir(os.path.join(data_dir, project_name, 'val', 'images')))
val_batch_size = 16

建议将val_size设置为验证图像裁剪块的总数。

创建验证数据集字典

val_dataset_dict = create_dataset_dict(
    data_dir=data_dir,
    project_name=project_name,
    center=center,
    size=val_size,
    batch_size=val_batch_size,
    one_hot=one_hot,
    type='val'
)

模型配置

输入通道设置

input_channels = 1  # 输入图像的通道数

创建模型字典

model_dict = create_model_dict(input_channels=input_channels)

损失函数配置

创建损失函数字典：

loss_dict = create_loss_dict(foreground_weight=foreground_weight)

损失函数权重说明：

w_inst: 实例损失权重
w_var: 方差损失权重
w_seed: 种子损失权重

训练配置

训练参数设置

n_epochs = 200  # 训练轮数
save_dir = os.path.join('experiment', project_name+'-'+'demo')  # 保存目录
resume_path = None  # 恢复训练路径，如'./experiment/usiigaci-2017-demo/checkpoint.pth'

创建配置字典

configs = create_configs(
    n_epochs=n_epochs,
    one_hot=one_hot,
    resume_path=resume_path,
    save_dir=save_dir,
    n_y=n_y,
    n_x=n_x
)

可视化设置

选择颜色映射用于可视化：

new_cmap = np.load('../../../cmaps/cmap_60.npy')
new_cmap = ListedColormap(new_cmap)  # 也可以使用'magma'等其他颜色映射

开始训练

执行训练：

begin_training(train_dataset_dict, val_dataset_dict, model_dict, loss_dict, configs, color_map=new_cmap)

常见问题排查

缺少中心图像：确保train和val目录中都包含中心图像
中心类型不匹配：确保在数据准备阶段生成的中心图像类型与训练时选择的center参数一致
恢复训练问题：检查resume_path路径是否正确，并确保save_dir指向正确的目录

通过本教程，您应该能够成功配置并启动EmbedSeg的2D实例分割训练流程。根据您的具体数据集和需求，可以调整上述参数以获得最佳性能。

登录后查看全文

EmbedSeg项目2D图像分割训练教程

前言

环境准备

数据集配置

数据路径设置

数据属性加载

训练数据集配置

参数设置

创建训练数据集字典

验证数据集配置

参数设置

创建验证数据集字典

模型配置

输入通道设置

创建模型字典

损失函数配置

训练配置

训练参数设置

创建配置字典

可视化设置

开始训练

常见问题排查

热门内容推荐

最新内容推荐

项目优选

EmbedSeg项目2D图像分割训练教程

前言

环境准备

数据集配置

数据路径设置

数据属性加载

训练数据集配置

参数设置

创建训练数据集字典

验证数据集配置

参数设置

创建验证数据集字典

模型配置

输入通道设置

创建模型字典

损失函数配置

训练配置

训练参数设置

创建配置字典

可视化设置

开始训练

常见问题排查

相关内容推荐

热门内容推荐

最新内容推荐

项目优选