Geatpy项目中NSGA-II算法Pareto解集重复问题解析

2025-07-04 17:42:52作者：龚格成

在进化计算领域，多目标优化算法NSGA-II因其优秀的性能而被广泛应用。然而，在使用Geatpy这一优秀的进化算法框架时，开发者可能会遇到一个看似矛盾的现象：NSGA-II算法最终得出的Pareto解集中存在部分解重复，而画出的Pareto前沿图却显示一切正常，没有重复点。

问题现象分析

当使用Geatpy的NSGA-II算法进行多目标优化时，用户可能会观察到以下现象：

算法运行结束后，输出的Pareto解集中包含完全相同的个体
将这些解集绘制成Pareto前沿图时，图表显示正常，没有重叠的点
这种现象在Geatpy 2.7版本中仍然存在

问题根源探究

经过深入分析，这个问题主要源于以下几个方面：

浮点数精度处理：在实际计算中，虽然两个解在数值上非常接近，但由于浮点数精度限制，它们可能被判定为不同解
解集去重逻辑：在绘制Pareto前沿时，图表工具会自动处理视觉上的重叠点，而原始解集可能保留了数值上微小差异的解
算法实现细节：NSGA-II的选择机制可能导致种群中出现相似度极高的个体，特别是在收敛后期

解决方案与建议

针对这个问题，Geatpy开发团队已经在后续版本中进行了修复。对于用户来说，可以采取以下措施：

更新代码库：直接从GitHub仓库拉取最新代码进行手动覆盖，因为镜像下载的PyPI库可能未包含最新修复
后处理去重：在获取Pareto解集后，可以添加自定义的去重步骤，基于适当的阈值判断解是否相同
调整算法参数：适当增大变异算子的强度，增加种群多样性，减少相似解的产生

技术实现建议

对于需要自行处理这个问题的开发者，可以考虑以下技术实现：

# 示例：自定义Pareto解集去重函数
def remove_duplicate_solutions(solutions, objectives, epsilon=1e-6):
    """
    去除重复的Pareto解
    :param solutions: 决策变量矩阵
    :param objectives: 目标函数值矩阵
    :param epsilon: 判断重复的阈值
    :return: 去重后的解集和目标值
    """
    unique_mask = np.ones(len(solutions), dtype=bool)
    for i in range(len(solutions)):
        if unique_mask[i]:
            # 计算当前解与其他解的差异
            diff = np.abs(objectives - objectives[i])
            # 找出差异小于阈值的解(包括自己)
            duplicates = np.all(diff < epsilon, axis=1)
            # 保留第一个，标记其余为重复
            duplicate_indices = np.where(duplicates)[0]
            unique_mask[duplicate_indices[1:]] = False
    return solutions[unique_mask], objectives[unique_mask]