SecretFlow 组件版本不匹配问题解析与解决方案

2025-07-01 03:14:16作者：卓艾滢Kingsley

问题背景

在使用 SecretFlow 进行隐私保护计算任务时，用户在执行 PSI（隐私集合求交）操作时遇到了组件版本不匹配的错误。错误信息显示系统无法找到 data_prep 域下的 psi 组件版本 0.0.5。

错误分析

核心错误信息

系统抛出的关键错误信息为：

RuntimeError: component is not found, data_prep, psi, 0.0.5

这表明 SecretFlow 运行时环境中不存在指定版本的 PSI 组件。在 SecretFlow 的组件系统中，每个功能组件都有明确的版本控制，当请求的版本不存在时，系统会抛出此类错误。

环境配置

用户环境配置如下：

SecretFlow 版本：1.10.0b1
Kuscia 版本：0.12.0b0
操作系统：CentOS 7
Python 版本：3.10

解决方案

版本适配调整

经过分析，SecretFlow 1.10.0b1 版本中 PSI 组件的最新可用版本为 0.0.8，而非用户请求的 0.0.5。因此需要修改任务配置中的版本号：

"sf_node_eval_param": {
    "domain": "data_prep",
    "name": "psi",
    "version": "0.0.8",
    "attr_paths": ["input/input_table_1/key", "input/input_table_2/key", "protocol", "sort_result", "allow_empty_result", "allow_duplicate_keys", "allow_duplicate_keys/no/skip_duplicates_check", "allow_duplicate_keys/no/receiver_parties", "ecdh_curve"],
    "attrs": [{
            "is_na": false,
            "ss": ["UserID"]
          }, {
            "is_na": false,
            "ss": ["UserID"]
          }, {
            "is_na": false,
            "s": "PROTOCOL_RR22"
          }, {
            "b": true,
            "is_na": false
          }, {
            "is_na": true
          }, {
            "is_na": false,
            "s": "no"
          }, {
            "is_na": true
          }, {
            "is_na": false,
            "ss": ["h800-p2p"]
          }, {
            "is_na": false,
            "s": "CURVE_FOURQ"
          }]
}

数据类型问题

在调整版本后，用户遇到了数据类型相关的错误：

NotSupportedError: Not supported feature type string

这是因为在定义 DomainData 时，数据列的属性类型应该使用 str 而非 string。SecretFlow 对数据类型有严格的要求，必须使用系统定义的标准类型标识。

数据一致性要求

进一步调试发现，参与 PSI 计算的两方数据需要满足以下一致性要求：

关键列的数据类型必须完全一致
数据列的属性定义需要在创建 DomainData 和授权时保持同步
数据中不能包含不支持的格式或空值

最佳实践建议

版本兼容性检查：在使用 SecretFlow 组件时，应先确认当前环境支持的组件版本，可通过官方文档或 API 查询获取。
数据类型规范：
- 字符串类型应使用 str 而非 string
- 数值类型应根据实际需求选择 int32、int64、float32 或 float64
- 布尔类型使用 bool
数据预处理：
- 确保参与计算的两方数据格式一致
- 处理可能的空值问题
- 验证关键列的数据类型匹配
错误排查流程：
- 首先检查组件版本是否匹配
- 然后验证数据类型定义是否正确
- 最后确认两方数据的一致性