DataForScience/Networks项目解析：图结构的四种表示方法

2025-06-01 17:25:58作者：胡唯隽

前言

图结构是描述复杂系统的重要数学工具，广泛应用于社交网络分析、交通规划、生物信息学等领域。本文将基于DataForScience/Networks项目中的内容，深入讲解图的四种基本表示方法：边列表、邻接表、邻接矩阵和邻接字典，帮助读者掌握不同场景下的最佳选择。

准备工作

在开始之前，我们需要导入必要的Python库：

from collections import Counter
from pprint import pprint
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

这些库将帮助我们实现图的表示和可视化。特别地，NumPy将用于高效的矩阵运算，而Matplotlib则用于图形展示。

1. 边列表(Edge List)

边列表是最直观的图表示方法，它简单地记录了图中所有的边。

基本实现

edge_list = [
    ('A', 'B'),
    ('A', 'C'),
    ('A', 'E'),
    ('B', 'C'),
    ('C', 'D'),
    ('C', 'E'),
    ('D', 'E')]

特点分析

优点：结构简单，易于理解和实现；许多真实数据集都采用这种格式
缺点：
- 无法显式表示孤立的节点（不参与任何边的节点）
- 无法直接体现图是有向还是无向
- 查询特定节点的邻居效率较低

基本统计量计算

计算边数非常简单：

number_edges = len(edge_list)  # 结果为7

计算节点数需要额外处理：

nodes = set()
for edge in edge_list:
    nodes.update(edge)
number_nodes = len(nodes)  # 结果为5

2. 邻接表(Adjacency List)

邻接表通过字典结构，将每个节点映射到其邻居集合，提高了查询效率。

有向图实现

adj_list = {}
for node_i, node_j in edge_list:
    if node_i not in adj_list:
        adj_list[node_i] = set()
    adj_list[node_i].add(node_j)

无向图实现

无向图需要为每条边添加双向连接：

adj_list = {}
for node_i, node_j in edge_list:
    if node_i not in adj_list:
        adj_list[node_i] = set()
    adj_list[node_i].add(node_j)
    
    # 添加反向边
    if node_j not in adj_list:
        adj_list[node_j] = set()
    adj_list[node_j].add(node_i)

特点分析

优点：
- 空间效率高，只存储实际存在的连接
- 查询特定节点的邻居效率高
缺点：
- 检查两个节点是否相连的效率不如邻接矩阵
- 实现带权图需要额外处理

3. 邻接矩阵(Adjacency Matrix)

邻接矩阵使用二维数组表示节点间的连接关系，适合稠密图的数学运算。

实现步骤

建立节点到数字ID的映射：

node_id = {}
node_count = 0
for node_i, node_j in edge_list:
    if node_i not in node_id:
        node_id[node_i] = node_count
        node_count += 1
    if node_j not in node_id:
        node_id[node_j] = node_count
        node_count += 1

初始化并填充邻接矩阵：

adj_matrix = np.zeros((node_count, node_count), dtype='int')
is_directed = False

for node_i, node_j in edge_list:    
    node_i = node_id[node_i]
    node_j = node_id[node_j]
    adj_matrix[node_i, node_j] = 1
    if not is_directed:
        adj_matrix[node_j, node_i] = 1

特点分析

优点：
- 数学运算方便，适合图算法实现
- 检查节点连接性效率高
缺点：
- 空间复杂度高(O(n²))
- 稀疏图时空间浪费严重

4. 邻接字典(Adjacency Dict)

邻接字典是最灵活的表示方法，可以存储节点和边的各种属性。

实现方法

nodes = {}
edges = {}
is_directed = False

for node_i, node_j in edge_list:
    if node_i not in nodes:
        nodes[node_i] = {}  # 可存储节点属性
        edges[node_i] = {}
    if node_j not in nodes:
        nodes[node_j] = {}
        if not is_directed:
            edges[node_j] = {}
    
    edges[node_i][node_j] = {}  # 可存储边属性
    if not is_directed:
        edges[node_j][node_i] = {}

属性添加示例

edges['A']['B']['weight'] = 3
edges['A']['B']['color'] = 'blue'

特点分析

优点：
- 灵活性高，可存储各种属性
- 易于扩展为多重图(允许节点间多条边)
缺点：
- 实现复杂度较高
- 某些操作效率不如专用结构

总结比较

表示方法	空间复杂度	查询邻居	检查连接	灵活性	适用场景
边列表	O(m)	高	高	低	简单图，数据导入导出
邻接表	O(n+m)	低	中	中	大多数算法实现
邻接矩阵	O(n²)	中	低	低	稠密图，数学运算
邻接字典	O(n+m)	中	中	高	属性图，复杂网络

在实际应用中，应根据具体需求选择合适的表示方法。DataForScience/Networks项目推荐使用邻接字典作为默认选择，因其在灵活性和功能性之间取得了良好平衡。

登录后查看全文

DataForScience/Networks项目解析：图结构的四种表示方法

前言

准备工作

1. 边列表(Edge List)

基本实现

特点分析

基本统计量计算

2. 邻接表(Adjacency List)

有向图实现

无向图实现

特点分析

3. 邻接矩阵(Adjacency Matrix)

实现步骤

特点分析

4. 邻接字典(Adjacency Dict)

实现方法

属性添加示例

特点分析

总结比较

热门内容推荐

最新内容推荐

项目优选

DataForScience/Networks项目解析：图结构的四种表示方法

前言

准备工作

1. 边列表(Edge List)

基本实现

特点分析

基本统计量计算

2. 邻接表(Adjacency List)

有向图实现

无向图实现

特点分析

3. 邻接矩阵(Adjacency Matrix)

实现步骤

特点分析

4. 邻接字典(Adjacency Dict)

实现方法

属性添加示例

特点分析

总结比较

相关内容推荐

热门内容推荐

最新内容推荐

项目优选