PyKAN项目中随机种子固定后结果仍不一致的问题分析与解决方案

2025-05-14 14:34:58作者：伍霜盼Ellen

在机器学习项目中，可重复性是一个非常重要的特性。然而，在使用PyKAN项目进行实验时，即使设置了所有随机种子，不同运行之间仍然会出现结果不一致的情况。本文将深入分析这一问题的根源，并提供有效的解决方案。

问题现象

当用户在PyKAN项目中运行hellokan.ipynb示例时，虽然已经设置了所有随机种子（包括数据集创建和KAN初始化阶段），但在不同运行中，auto_symbolic函数的输出结果仍然不一致。这种现象在Jupyter Notebook环境中尤为明显。

根本原因分析

经过深入调查，发现导致这一问题的原因主要有三个：

浮点精度问题：PyKAN默认使用float32浮点精度，这种精度在多次运算中容易积累微小的数值差异，最终导致结果不一致。
优化算法选择：项目默认使用的LBFGS优化器内部存在一些难以控制的随机性因素，特别是在并行计算时。
运行环境差异：Jupyter Notebook环境本身会缓存一些中间状态，即使重启内核，某些底层状态也可能无法完全重置。

解决方案

针对上述问题根源，我们提出以下解决方案：

1. 提高浮点运算精度

将默认的float32精度提升为float64可以有效减少运算过程中的精度损失：

import torch
torch.set_default_dtype(torch.float64)

注意：同时需要修改KANLayer.py中的相关代码以避免类型错误。

2. 更换优化算法

将LBFGS优化器替换为Adam优化器：

# 在模型训练参数中指定优化器
train_params = {
    'optimizer': 'adam',
    'lr': 0.001,
    # 其他参数...
}

需要注意的是，Adam优化器通常需要更长的训练时间才能达到与LBFGS相当的效果。

3. 使用脚本而非Notebook环境

建议将实验代码迁移到.py脚本中执行，这可以避免Jupyter Notebook环境带来的潜在问题：

python your_script.py

最佳实践建议

为了在PyKAN项目中获得可重复的结果，建议遵循以下实践：

在代码开头统一设置所有可能的随机种子
明确指定浮点精度和优化器类型
在相对干净的环境中运行实验（如新创建的虚拟环境）
对于关键实验，记录完整的运行环境和参数配置

通过以上措施，可以显著提高PyKAN项目实验的可重复性，为科研和工程应用提供更可靠的结果。

pykan

Kolmogorov Arnold Networks

项目地址：https://gitcode.com/GitHub_Trending/pyk/pykan

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

437

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

PyKAN项目中随机种子固定后结果仍不一致的问题分析与解决方案

问题现象

根本原因分析

解决方案

1. 提高浮点运算精度

2. 更换优化算法

3. 使用脚本而非Notebook环境

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

PyKAN项目中随机种子固定后结果仍不一致的问题分析与解决方案

问题现象

根本原因分析

解决方案

1. 提高浮点运算精度

2. 更换优化算法

3. 使用脚本而非Notebook环境

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选