在 SciPy 中图结构Graph的处理主要依赖于scipy.sparse.csgraph模块。该模块专门用于处理稀疏矩阵表示的图邻接矩阵或拉普拉斯矩阵提供了一系列高效的图算法。注意SciPy 的图功能侧重于数值计算和算法实现如最短路径、连通分量、谱聚类而非通用的图数据结构操作如添加节点、动态修改边。对于复杂的图操作通常推荐使用networkx库但scipy.sparse.csgraph在处理大规模图百万级节点时性能更优。1. 图的表示稀疏矩阵在scipy.sparse.csgraph中图通常用稀疏矩阵表示邻接矩阵 (Adjacency Matrix)A[i, j] w表示节点i到j有权重为w的边。无向图矩阵对称 (A[i, j] A[j, i])。有向图矩阵不对称。距离矩阵A[i, j]表示i到j的距离若不可达则为inf或 0取决于算法。创建示例importnumpyasnpfromscipy.sparseimportcsr_matrix# 定义邻接矩阵 (无向图)# 0-1 (权重 4), 0-2 (权重 2), 1-2 (权重 1), 1-3 (权重 5), 2-3 (权重 8)adj_datanp.array([4,2,1,5,8,1,5,8])# 对称边adj_rownp.array([0,0,1,1,2,2,3,3])adj_colnp.array([1,2,0,2,0,1,1,2])# 构建稀疏邻接矩阵graphcsr_matrix((adj_data,(adj_row,adj_col)),shape(4,4))2. 核心算法模块 (scipy.sparse.csgraph)功能分类函数名描述适用场景最短路径shortest_path计算所有点对或单源最短路径 (Dijkstra, Bellman-Ford, Floyd-Warshall, Johnson)导航、网络路由dijkstra单源最短路径 (Dijkstra 算法)加权有向/无向图bellman_ford单源最短路径 (支持负权边)含负权边的图连通性connected_components找出连通分量 (有向/无向)社交网络社区发现、电路分析is_connected判断图是否连通快速检查最小生成树minimum_spanning_tree计算最小生成树 (MST)网络布线、聚类图排序reverse_cuthill_mckee重排矩阵以减小带宽优化稀疏矩阵存储/计算谱图理论laplacian计算拉普拉斯矩阵谱聚类、图分割流与匹配max_flow最大流算法网络流量优化bipartite_matching二分图匹配任务分配、推荐3. 常用算法详解与示例3.1 最短路径 (Shortest Path)场景计算节点 0 到所有其他节点的最短距离。fromscipy.sparse.csgraphimportdijkstra,shortest_pathimportnumpyasnp# 邻接矩阵 (0 表示无边inf 表示不可达)# 注意dijsktra 默认将 0 视为无边除非 directedFalse 且权重为 0dist_matrix,predecessorsdijkstra(graph,directedFalse,# 无向图return_predecessorsTrue,indices0# 从节点 0 开始)print(距离:,dist_matrix)# 输出: [0. 4. 2. 7.] (0-1:4, 0-2:2, 0-3: 0-2-1-3 2158? 修正: 0-2(2), 2-1(1), 1-3(5) 2158. 但 0-1(4), 1-3(5) 9. 最短是 8)# 实际计算: 0-2 (2), 2-1 (1), 1-3 (5) 总 8.# 修正示例数据: 0-1(4), 0-2(2), 1-2(1), 1-3(5), 2-3(8)# 0-3: 0-2-1-3 215 8. 0-1-3 459. 最短是 8.# 获取路径defget_path(predecessors,start,end):path[]currendwhilecurr!start:path.append(curr)currpredecessors[curr]ifcurr-9999:returnNone# 不可达path.append(start)returnpath[::-1]pathget_path(predecessors,0,3)print(f路径:{path})# [0, 2, 1, 3]3.2 连通分量 (Connected Components)场景找出图中有多少个独立的子图。fromscipy.sparse.csgraphimportconnected_components n_components,labelsconnected_components(graph,directedFalse,connectionweak# 有向图时可用 strong)print(f连通分量数:{n_components})print(f节点标签:{labels})# 输出: 所有节点标签相同 (如 [0, 0, 0, 0])表示全连通3.3 最小生成树 (Minimum Spanning Tree)场景连接所有节点且总权重最小的子图。fromscipy.sparse.csgraphimportminimum_spanning_tree mstminimum_spanning_tree(graph)print(MST 邻接矩阵:\n,mst.toarray())# 输出: 仅保留 MST 中的边其他为 03.4 拉普拉斯矩阵 (Laplacian)场景用于谱聚类、图分割。fromscipy.sparse.csgraphimportlaplacian# 计算归一化拉普拉斯矩阵L_normlaplacian(graph,normedTrue)print(归一化拉普拉斯矩阵:\n,L_norm.toarray())4. 性能与限制特性说明输入格式必须是scipy.sparse矩阵 (CSR, CSC, COO 等)。规模适合大规模图百万级节点因为基于稀疏矩阵运算。限制不支持动态图操作如add_edge需重新构建矩阵。负权边dijkstra不支持负权边需用bellman_ford。有向图默认directedTrue无向图需设directedFalse。5. 与 NetworkX 的对比维度SciPy (csgraph)NetworkX核心数值计算、稀疏矩阵图数据结构、算法库性能极快(C/Fortran 底层)较慢 (纯 Python)规模适合百万级节点适合万级节点功能专注核心算法 (路径、MST、连通性)功能丰富 (生成、可视化、复杂网络分析)易用性需手动构建稀疏矩阵API 友好直接操作节点/边适用大规模数据、科学计算、机器学习原型设计、教学、复杂网络分析最佳实践小规模/复杂逻辑用networkx构建图再转换为scipy.sparse进行计算。大规模/纯数值直接用scipy.sparse构建邻接矩阵调用csgraph。6. 完整示例从 NetworkX 到 SciPyimportnetworkxasnxfromscipy.sparseimportcsr_matrixfromscipy.sparse.csgraphimportshortest_path# 1. 用 NetworkX 构建图 (方便)Gnx.Graph()G.add_edge(0,1,weight4)G.add_edge(0,2,weight2)G.add_edge(1,2,weight1)G.add_edge(1,3,weight5)G.add_edge(2,3,weight8)# 2. 转换为 SciPy 稀疏矩阵adj_matrixnx.adjacency_matrix(G,weightweight)# 3. 用 SciPy 计算最短路径dist,predsshortest_path(adj_matrix,methodD,directedFalse,return_predecessorsTrue)print(距离矩阵:\n,dist.toarray())7. 总结scipy.sparse.csgraph是处理大规模稀疏图的利器尤其适合最短路径(导航、路由)连通性分析(社区发现)最小生成树(网络优化)谱图分析(聚类、分割)关键点图必须表示为稀疏矩阵。算法基于C/Fortran性能极高。适合数值计算场景不适合动态图操作。提示在 Vue 前端项目中图算法通常由后端 Python 服务如 Flask/FastAPI执行计算结果如最短路径、社区标签通过 API 返回前端使用D3.js或ECharts进行可视化。