Python如何调整数组的形状

news/2024/11/17 8:43:32/

文章目录

- 更改维度
- 调整坐标轴
- 牛刀小试
- Numpy函数

调整形状
调整形状	`reshape`, `resize`, `flatten`, `ravel`, `squeeze`
调整坐标轴	`transpose`, `swapaxes`

更改维度

数组中的数据在内存里是固定的，但计算时的排列方式却可以随时更改，这也是数组的强大之处。其中，reshape和resize功能相同，区别是前者返回新数组，后者则直接修改原始数组。

>>> x = np.arange(12)
>>> y = x.reshape(2,6)
>>> print(x)
[ 0  1  2  3  4  5  6  7  8  9 10 11]
>>> print(y)
[[ 0  1  2  3  4  5][ 6  7  8  9 10 11]]
>>> x.resize(2,6)
>>> print(x)
[[ 0  1  2  3  4  5][ 6  7  8  9 10 11]]

-1表示自动规划某一轴的尺寸，例如

>>> x.reshape(3,-1)
array([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])

则flatten和ravel相当于reshape(-1)，即将数组展平为一维数组。

squeeze则比flatten稍微温和一点，会删除尺寸为1的维度，例如

>>> x.resize(1,3,4,1,1)
>>> print(x)
[[[[[ 0]][[ 1]][[ 2]][[ 3]]][[[ 4]][[ 5]][[ 6]][[ 7]]][[[ 8]][[ 9]][[10]][[11]]]]]

上面的这个x有太多层括号，看上去毫无卵用，这个时候可以用squeeze，

>>> x.squeeze()
array([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])

有木有瞬间清爽了许多。

调整坐标轴

transpose和swapaxes用于调整坐标轴，如果用矩阵的视角去理解，那么大致相当于转置。

>>> x
array([[ 0,  1,  2,  3,  4,  5],[ 6,  7,  8,  9, 10, 11]])
>>> x.T
array([[ 0,  6],[ 1,  7],[ 2,  8],[ 3,  9],[ 4, 10],[ 5, 11]])
>>> x.transpose(1,0)
array([[ 0,  6],[ 1,  7],[ 2,  8],[ 3,  9],[ 4, 10],[ 5, 11]])

其中，transpose(1,0)表示将第一个坐标轴和第0个坐标轴交换位置。

牛刀小试

熟练掌握数组形状的变换方法，也就相当于熟悉了张量的运算法则，这对于数据科学来说是非常重要的基础技能。

例如，现有300张图像200x100的图像，想要得到每张图像的列质心。传统思路肯定是跑循环，但众所周知Python的循环效率比较慢，所以最佳方法是300张一起做，无非就是300x200x100的张量，对第二个坐标轴进行质心提取而已

imgs = np.random.rand(300,200,100)
xs = np.arange(100)
xCen = np.matmul(imgs, xs) / np.sum(imgs, axis=2)

其中，xCen就是所要求的质心。

当然，也可以用更加直观的做法

xCen = imgs.reshape(-1,100)@xs / np.sum(imgs.reshape(-1,100), axis=1)
xCen = xCen.reshape(300,200)

Numpy函数

对于上面这几种数组的内置方法，有一些可直接从numpy中调用，这样的好处是可以直接对非数组格式的数据进行操作，例如

>>> x = list(range(12))
>>> np.reshape(x, (3,4))
array([[ 0,  1,  2,  3],[ 4,  5,  6,  7],[ 8,  9, 10, 11]])

其中，x是一个列表，np.reshape会自动将其转化为数组后再行操作。

同样地，flatten也可以完成数组展平的任务

>>> x = [[i, i+1] for i in range(5)]
>>> x
[[0, 1], [1, 2], [2, 3], [3, 4], [4, 5]]
>>> np.ravel(x)
array([0, 1, 1, 2, 2, 3, 3, 4, 4, 5])