SecretFlow分布式部署中的端口配置问题解析

2025-07-01 02:25:01作者：胡唯隽

背景介绍

SecretFlow作为一款隐私计算框架，其分布式部署能力对于实际生产环境至关重要。在使用Docker容器化部署SecretFlow时，合理的端口配置是确保各参与方正常通信的基础。本文将深入分析一个典型的端口配置问题案例，帮助开发者理解SecretFlow集群部署中的关键配置项。

问题现象

在采用Docker部署SecretFlow集群时，开发者遇到了sf.init()初始化阶段的连接异常。具体表现为：

两个参与方(alice和bob)的容器中持续输出ping尝试日志
频繁出现DEADLINE_EXCEEDED错误
通信无法正常建立，最终导致初始化失败

配置分析

从问题描述中可以看到，开发者设置了三个不同的端口：

Ray端口(8085)：用于Ray集群通信
Proxy端口(8086)：用于RayFed代理通信
SPU端口(8087)：用于SPU设备间通信

然而，问题出在cluster_config的listen_addr配置上。开发者错误地将SPU端口(8087)用于RayFed代理的监听地址，这导致了通信链路无法建立。

正确配置方案

SecretFlow的集群配置实际上包含两个独立的部分：

1. RayFed代理通信配置

这部分负责SecretFlow基础框架的通信，配置要点包括：

address：其他参与方访问本方的地址
listen_addr：本方监听的地址和端口（应与address端口一致）

cluster_config = {
    'parties': {
        'alice': {
            'address': '192.168.1.128:8086',
            'listen_addr': '0.0.0.0:8086'  # 必须与address端口一致
        },
        'bob': {
            'address': '192.168.1.100:8086',
            'listen_addr': '0.0.0.0:8086'  # 必须与address端口一致
        },
    },
    'self_party': 'alice'  # 本方身份标识
}

2. SPU设备通信配置

这部分负责安全计算单元的通信，是独立的配置项：

cluster_def = {
    'nodes': [
        {
            'party': 'alice',
            'address': '192.168.1.128:8087',
            'listen_addr': '0.0.0.0:8087'
        },
        {
            'party': 'bob',
            'address': '192.168.1.100:8087',
            'listen_addr': '0.0.0.0:8087'
        },
    ],
    'runtime_config': {
        'protocol': spu.spu_pb2.SEMI2K,
        'field': spu.spu_pb2.FM128,
        'sigmoid_mode': spu.spu_pb2.RuntimeConfig.SIGMOID_REAL,
    }
}