FATE项目中PSI求交协议的通信量测量与分析

2025-06-05 13:47:36作者：温艾琴Wonderful

项目地址：https://gitcode.com/gh_mirrors/fat/FATE

概述

隐私集合求交(Private Set Intersection, PSI)是联邦学习框架FATE中的核心功能之一，它允许参与方在不泄露各自原始数据的情况下计算数据集的交集。在实际应用中，了解不同PSI协议的通信量对于系统性能优化和资源规划具有重要意义。本文将详细介绍在FATE 1.7.2版本中如何测量RSA和DH两种PSI协议的通信量，并分析测量结果。

测量方法

在FATE集群部署模式下，我们可以使用Linux系统的iptables工具来精确测量PSI协议的通信量。具体步骤如下：

设置iptables规则：通过添加特定的日志规则来捕获目标端口(默认9370)的通信流量
执行PSI任务：运行不同规模的求交任务(如2^12到2^18大小的数据集)
分析日志数据：使用grep和awk工具从系统日志中提取并汇总通信量数据

对于DH和RSA两种PSI协议，需要分别设置不同的日志前缀以便区分测量结果。每次测量前应清除之前的过滤规则，确保测量数据的准确性。

测量结果

通过上述方法，我们获得了不同规模数据集下两种PSI协议的通信量数据(单位：MB)：

协议类型	2^12	2^14	2^16	2^18
DH-PSI	2.36	9.36	37.27	149.38
RSA-PSI	2.47	9.81	39.15	156.50

结果分析

从测量数据可以看出：

通信量与数据规模的关系：两种协议的通信量都随着数据集规模的增大而线性增长，这与理论预期一致
协议比较：在相同数据集规模下，RSA-PSI的通信量略高于DH-PSI，但差异不大
实际应用考量：虽然RSA-PSI通信量稍大，但在某些安全假设下可能提供更好的隐私保护

技术要点

测量注意事项：
- 必须使用集群模式部署，standalone模式无法测量真实通信量
- 每次测量前应清除之前的iptables规则
- 确保日志前缀唯一，避免数据混淆
协议选择建议：
- 对于通信资源受限的环境，可优先考虑DH-PSI
- 对安全性要求更高的场景，可考虑RSA-PSI
- 实际选择应综合考虑通信量、计算开销和安全需求