Google Colab中NumPy数组赋值引用的注意事项

2025-07-02 17:42:33作者：毕习沙Eudora

在Google Colab中使用NumPy进行科学计算时，数组赋值操作有一个重要特性需要特别注意：NumPy数组的切片和索引操作返回的是视图(view)而非副本(copy)。这意味着当您将一个数组切片赋值给新变量时，新变量实际上是对原数组数据的引用，而非独立的数据副本。

问题现象

让我们通过一个具体例子来说明这个问题：

import numpy as np

X = np.array([[-16.1718, 495.4491],
              [-139.3684, 397.6613],
              [81.1637, -201.7584],
              [59.0297, -308.5572],
              [45.7631, -392.7569]])

Fk = X[2,:]  # 这里Fk是X第二行的视图
vv = [320, 500]
X[2,:] = vv + X[2,:]  # 修改X的第二行

print('Fk=', Fk)  # 会发现Fk的值也改变了

在这个例子中，虽然看起来我们是在将X[2,:]的值赋给Fk之后才修改X[2,:]，但实际上Fk的值也会随之改变。

技术原理

这种现象的根本原因在于NumPy的设计哲学：为了提高性能，NumPy的切片和索引操作默认返回的是视图而非副本。视图与原数组共享相同的内存数据，因此对任一方的修改都会影响另一方。

这种设计在大型数组操作时非常高效，因为它避免了不必要的数据复制。但在某些情况下，如果不了解这一特性，可能会导致意外的结果。

解决方案

如果您确实需要创建一个独立的数据副本，可以使用以下方法：

使用copy()方法显式创建副本：

Fk = X[2,:].copy()  # 创建独立副本

使用np.array()构造函数：

Fk = np.array(X[2,:])  # 也会创建副本

使用深拷贝：

import copy
Fk = copy.deepcopy(X[2,:])

实际应用建议

在实际项目中，建议：

明确区分何时需要视图，何时需要副本
对于大型数组，尽可能使用视图以提高性能
当需要保留原始数据时，务必使用copy()方法
在函数参数传递时，注意NumPy数组是"按引用传递"的

理解NumPy的这种内存共享机制，可以帮助您编写出更高效、更可靠的科学计算代码，特别是在Google Colab这样的交互式环境中工作时。

colabtools

Python libraries for Google Colaboratory

项目地址：https://gitcode.com/gh_mirrors/co/colabtools

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140