优雅SciPy项目中的线性代数应用指南

2025-06-02 23:46:44作者：冯梦姬Eddie

线性代数基础概念回顾

线性代数是科学计算的基础，本章将重点介绍SciPy中用于线性代数运算的模块。在开始之前，我们需要明确一些基本概念：

向量：有序的数字集合，可以表示为列向量或行向量
矩阵：由向量组成的二维数组，可以表示线性变换
矩阵乘法：使用@运算符进行矩阵乘法运算

在Python中，我们通常会遵循线性代数的命名约定，使用大写字母表示矩阵，小写字母表示向量和标量：

import numpy as np

m, n = (5, 6)  # 标量
M = np.ones((m, n))  # 矩阵
v = np.random.random((n,))  # 向量
w = M @ v  # 另一个向量

图的拉普拉斯矩阵

图论中的图可以用邻接矩阵表示，其中节点编号从0到n-1，如果节点i和j之间有边，则矩阵的(i,j)位置为1。

拉普拉斯矩阵定义

拉普拉斯矩阵L定义为度矩阵D减去邻接矩阵A：

L = D - A

其中度矩阵D是一个对角矩阵，对角线元素表示每个节点的度数（连接的边数）。

拉普拉斯矩阵的性质

拉普拉斯矩阵有许多重要性质，特别是它的特征值和特征向量。第二小的特征值对应的特征向量称为费德勒向量(Fiedler vector)，可以用于图的划分。

让我们通过一个简单的网络示例来说明：

A = np.array([[0, 1, 1, 0, 0, 0],
              [1, 0, 1, 0, 0, 0],
              [1, 1, 0, 1, 0, 0],
              [0, 0, 1, 0, 1, 1],
              [0, 0, 0, 1, 0, 1],
              [0, 0, 0, 1, 1, 0]], dtype=float)

计算拉普拉斯矩阵

首先计算度矩阵D：

d = np.sum(A, axis=0)
D = np.diag(d)

然后计算拉普拉斯矩阵L：

L = D - A

特征值与特征向量

计算拉普拉斯矩阵的特征值和特征向量：

val, Vec = np.linalg.eigh(L)

费德勒向量是第二小特征值对应的特征向量：

f = Vec[:, np.argsort(val)[1]]

通过费德勒向量的符号，我们可以将图中的节点分成两组：

colors = ['orange' if eigv > 0 else 'gray' for eigv in f]
nx.draw(g, pos=layout, with_labels=True, node_color=colors)

实际应用：线虫神经元网络分析

让我们看一个实际应用案例：分析线虫的神经元网络。研究人员使用了一种改进的拉普拉斯矩阵——度归一化拉普拉斯矩阵来布局神经元。

数据处理

我们使用预处理好的数据集，包含以下组件：

化学突触网络
电突触网络
神经元位置信息
神经元类型信息

分析方法

构建邻接矩阵表示神经元连接
计算度归一化拉普拉斯矩阵
计算特征值和特征向量
使用特征向量进行可视化布局

这种方法可以有效地展示神经元之间的功能关系，帮助研究者理解神经系统的组织结构。

特征向量与特征值的深入理解

特征向量和特征值是线性代数中的核心概念。一个矩阵M的特征向量v满足：

Mv = λv

其中λ称为特征值。这意味着矩阵M对向量v的作用只是简单地缩放它，而不改变其方向。

旋转矩阵示例

考虑一个绕z轴旋转θ度的3D旋转矩阵R：

theta = np.deg2rad(45)
R = np.array([[np.cos(theta), -np.sin(theta), 0],
              [np.sin(theta),  np.cos(theta), 0],
              [            0,              0, 1]])

z轴向量[0,0,1]是这个矩阵的特征向量，对应的特征值为1，因为旋转不会改变这个向量的方向。