使用PyKAN预测混凝土抗压强度的技术实践

2025-05-14 16:52:21作者：温艾琴Wonderful

项目背景

PyKAN是一个基于Kolmogorov-Arnold网络(KAN)的Python实现，该项目提供了一种新颖的神经网络架构，特别适用于复杂非线性关系的建模。本文将分享如何使用PyKAN构建混凝土抗压强度预测模型的技术实践。

数据准备与预处理

在混凝土材料研究中，抗压强度是一个关键性能指标。我们使用的数据集包含以下特征列：

水灰比(WCM_ratio)
水泥含量(C_Content)
砂含量(Sand_Content)
粗骨料含量(CA_Content)
水泥类型含量(Cement_Content)

目标变量为28天抗压强度(day28_Compressive_Strength)。数据预处理阶段需要特别注意将输入输出数据正确转换为PyTorch张量格式。

模型构建

我们使用以下配置初始化KAN模型：

model = KAN(width=[5,10,1], grid=500, k=3, seed=0)

其中：

width=[5,10,1]表示输入层5个节点，隐藏层10个节点，输出层1个节点
grid=500设置B样条曲线的网格点数
k=3表示使用三次B样条
seed=0确保结果可复现

训练过程

模型训练采用LBFGS优化器，这是一种准牛顿方法，特别适合中小规模问题的优化。训练参数设置如下：

results = model.fit(dataset, opt="LBFGS", steps=50, lamb=0.01, lamb_entropy=10)

其中：

steps=50设置训练迭代次数
lamb=0.01控制正则化强度
lamb_entropy=10调整熵正则化项

常见问题与解决方案

在实际应用中，开发者可能会遇到预测结果不随输入变化的问题。这通常是由于数据预处理不当导致的，特别是输出数据的维度处理。正确的做法是：

training_outputs = torch.tensor(extracted_data, dtype=torch.float32).unsqueeze(1)

关键点：

必须确保数据类型为torch.float32
unsqueeze(1)确保输出维度为(N,1)而非(N,)
输入输出张量形状要匹配模型预期

模型解释与可视化

PyKAN提供了强大的模型解释工具：

model.plot(beta=1000)

可视化可以展示网络中各节点的激活函数形态，帮助理解模型学习到的特征变换。

符号公式提取功能可以将学习到的复杂关系转化为数学表达式：

lib = ['x','x^2','x^3','x^4','exp','log','sqrt','tanh','sin','tan','abs']
model.auto_symbolic(lib=lib)
formula = model.symbolic_formula()[0][0]

性能评估

训练过程中需要监控以下指标：

训练损失(train_loss)
测试损失(test_loss)
正则化项(reg)

典型性能表现：

| train_loss: 5.38e+00 | test_loss: 5.38e+00 | reg: 8.40e+01 |

实际应用

完成训练后，模型可用于预测新样本的抗压强度。通过符号公式可以直接进行数学计算：

variable_values = {
    'x_1': WCM_ratio,
    'x_2': C_Content,
    'x_3': Sand_Content,
    'x_4': CA_Content,
    'x_5': Cement_Content
}

for var, val in variable_values.items():
    formula = formula.replace(var, str(val))
    
result = eval(formula)