使用KAN模型进行未知函数拟合的技术实践
2025-05-14 14:04:58作者:姚月梅Lane
KAN(Kolmogorov-Arnold Networks)是一种新型的神经网络架构,它基于Kolmogorov-Arnold表示定理,能够有效地学习和表示复杂的非线性函数关系。本文将通过一个实际案例,详细介绍如何使用KAN模型对有限元分析数据集进行函数拟合和符号回归。
数据准备与预处理
在开始建模前,首先需要准备和预处理数据。本案例中使用的数据集来自有限元分析结果,包含3个输入特征和1个输出目标值。数据加载和分割的关键步骤如下:
- 使用pandas读取Excel格式的数据文件
- 将数据转换为NumPy数组格式
- 使用train_test_split将数据划分为训练集和测试集
- 将数据转换为PyTorch张量格式
特别需要注意的是,目标值的形状应为(N,1)而非(N,),这是一个常见的错误点。正确的处理方式是在索引时使用[:,[3]]而非[:,3],以确保维度正确。
KAN模型构建与训练
构建KAN模型时,我们选择了[3,3,1]的网络结构,即3个输入节点、3个隐藏节点和1个输出节点。训练过程分为几个关键阶段:
- 初始训练:使用较小的网格(grid=3)进行初步训练
- 网格细化:逐步增加网格精度(grids=[3,5,10]),通过initialize_from_another_model方法继承之前训练的参数
- 优化器选择:使用LBFGS优化器进行训练
- 正则化设置:设置lamb=0.0表示不使用正则化
训练过程中,我们发现使用torch.use_deterministic_algorithms(True)可以提高结果的可重复性,特别是在使用LBFGS优化器时。
符号回归与公式提取
在模型训练完成后,我们使用auto_symbolic方法自动识别各激活函数的数学表达式。提供的函数库包括:
- 多项式函数:x, x², x³, x⁴
- 超越函数:exp, log, sqrt, tanh, sin
- 其他函数:abs
自动符号回归的输出显示了每个激活函数的拟合优度(R²),大多数都达到了0.999以上的高精度。例如:
- (0,0,0)节点被识别为exp函数,R²=0.9999
- (0,0,1)节点被识别为x³函数,R²=0.99998
- (1,0,0)节点被识别为sin函数,R²=0.9971
模型验证与结果分析
为了验证模型的有效性,我们进行了以下验证步骤:
- 训练/测试损失曲线:观察RMSE随训练步骤的变化,确保没有过拟合
- 蒙特卡洛模拟:将KAN模型预测结果与原始有限元分析结果对比
- 符号公式验证:手动计算符号公式的输出,与模型预测值对比
结果显示,KAN模型能够很好地捕捉数据中的非线性关系,符号公式的预测精度与神经网络预测结果基本一致。
实践中的经验总结
- 数据维度:确保输入和输出的维度正确,特别是目标值应为二维数组
- 可重复性:设置随机种子和确定性算法可以提高结果的可重复性
- 网格细化:逐步增加网格精度可以获得更好的拟合效果
- 符号回归:auto_symbolic后的进一步训练可以优化仿射变换参数
- 工程判断:对于某些必须保留的输入特征,可能需要手动干预符号回归过程
KAN模型在函数拟合和符号回归方面展现出强大的能力,特别适用于从复杂数据中提取可解释的数学表达式。通过本案例的实践,我们验证了KAN在工程应用中的实用价值。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust098- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
项目优选
收起
deepin linux kernel
C
28
16
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
566
98
暂无描述
Dockerfile
707
4.51 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
413
339
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
958
955
Ascend Extension for PyTorch
Python
572
694
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.6 K
940
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
1.42 K
116
AI 将任意文档转换为精美可编辑的 PPTX 演示文稿 — 无需设计基础 | 包含 15 个案例、229 页内容
Python
79
5
暂无简介
Dart
951
235