Diffrax项目中的神经控制微分方程回归任务实践

2025-07-10 19:10:37作者：滑思眉Philip

在微分方程求解领域，Diffrax作为一个基于JAX的高性能库，为复杂微分方程的求解提供了强大的支持。本文将通过一个完整的神经控制微分方程（Neural CDE）回归任务示例，展示如何利用Diffrax解决实际问题。

背景与原理

神经控制微分方程是传统神经ODE的扩展，通过引入控制项来处理时间序列数据。其核心思想是将输入数据视为控制信号，通过微分方程的形式建模系统的动态变化。相比于离散的神经网络，这种连续时间建模方式更适合处理不规则采样或长时间依赖的数据。

实现细节

模型架构

示例中构建了一个包含以下关键组件的模型：

函数逼近器：使用MLP网络学习系统的动态变化
控制项处理：通过三次样条插值处理输入控制信号
微分方程求解器：采用Euler方法进行数值求解

class NeuralCDE(eqx.Module):
    def __init__(self, data_size, hidden_size, width_size, depth, *, key):
        self.func = Func(data_size, hidden_size, width_size, depth, key=key)
    
    def __call__(self, ts, y0, coeffs):
        control = diffrax.CubicInterpolation(ts, coeffs)
        term = diffrax.ControlTerm(self.func, control).to_ode()
        solver = diffrax.Euler()
        solution = diffrax.diffeqsolve(term, solver, ts[0], ts[-1], dt0, y0)
        return solution.ys

数据生成

为了验证模型效果，示例中构造了一个非线性振荡器数据集：

生成正弦和余弦组合的时间序列
通过微分方程转换得到目标轨迹
使用Hermite插值生成控制信号系数

def _get_data(ts, *, key):
    # 生成初始条件
    x0 = jr.uniform(key, (2,), minval=-0.6, maxval=1)
    
    # 构造向量场
    def vector_field(t, y, args):
        ys = y[1:]
        F = jnp.array([[ys[0], ys[1]], [ys[1], -ys[0]]])
        return jnp.pad(F, [(1,0),(1,0)])
    
    # 求解微分方程生成轨迹
    sol = diffrax.diffeqsolve(...)
    return sol.ys