numpy模块之axis

news/2024/11/30 20:28:18/

axis的作用即如何理解

numpy是python进行科学计算必不可少的模块,随着深度学习越来越火,numpy也越来越流行。了解numpy的人知道,在numpy中,有很多的函数都涉及到axis,很多函数根据axis的取值不同,得到的结果也完全不同。可以说,axis让numpy的多维数组变的更加灵活,但也让numpy变得越发难以理解。这里通过详细的例子来学习下,axis到底是什么,它在numpy中的作用到底如何。

为什么会有axis这个东西,原因很简单:numpy是针对矩阵或者多为数组进行运算的,而在多维数组中,对数据的操作有太多的可能,我们先来看一个例子。比如我们有一个二维数组:

>>> import numpy as np
>>> data = np.array([
... [1,2,1],
... [0,3,1],
... [2,1,4],
... [1,3,1]])

这个数组代表了样本数据的特征,其中每一行代表一个样本的三个特征,每一列是不同样本的特征。如果在分析样本的过程中需要对每个样本的三个特征求和,该如何处理?简单:

>>> np.sum(data, axis=1)
array([4, 4, 7, 5])

那如果想求每种特征的最小值,该如何处理?也简单:

>>> np.min(data, axis=0)
array([0, 1, 1])

又如果想得知所有样本所有特征的平均值呢?还是很简单:

>>> np.average(data)
1.6666666666666667

由此可以看出,通过不同的axis,numpy会沿着不同的方向进行操作:如果不设置,那么对所有的元素操作;如果axis=0,则沿着纵轴进行操作;axis=1,则沿着横轴进行操作。但这只是简单的二位数组,如果是多维的呢?可以总结为一句话:设axis=i,则numpy沿着第i个下标变化的放下进行操作。例如刚刚的例子,可以将表示为:data =[[a00, a01],[a10,a11]],所以axis=0时,沿着第0个下标变化的方向进行操作,也就是a00->a10, a01->a11,也就是纵坐标的方向,axis=1时也类似。下面我们举一个四维的求sum的例子来验证一下:

>>> data = np.random.randint(0, 5, [4,3,2,3])
>>> data
array([[[[4, 1, 0],[4, 3, 0]],[[1, 2, 4],[2, 2, 3]],[[4, 3, 3],[4, 2, 3]]],[[[4, 0, 1],[1, 1, 1]],[[0, 1, 0],[0, 4, 1]],[[1, 3, 0],[0, 3, 0]]],[[[3, 3, 4],[0, 1, 0]],[[1, 2, 3],[4, 0, 4]],[[1, 4, 1],[1, 3, 2]]],[[[0, 1, 1],[2, 4, 3]],[[4, 1, 4],[1, 4, 1]],[[0, 1, 0],[2, 4, 3]]]])

当axis=0时,numpy验证第0维的方向来求和,也就是第一个元素值=a0000+a1000+a2000+a3000=11,第二个元素=a0001+a1001+a2001+a3001=5,同理可得最后的结果如下:

>>> data.sum(axis=0)
array([[[11,  5,  6],[ 7,  9,  4]],[[ 6,  6, 11],[ 7, 10,  9]],[[ 6, 11,  4],[ 7, 12,  8]]])

当axis=3时,numpy验证第3维的方向来求和,也就是第一个元素值=a0000+a0001+a0002=5,第二个元素=a0010+a0011+a0012=7,同理可得最后的结果如下:

>>> data.sum(axis=3)
array([[[ 5,  7],[ 7,  7],[10,  9]],[[ 5,  3],[ 1,  5],[ 4,  3]],[[10,  1],[ 6,  8],[ 6,  6]],[[ 2,  9],[ 9,  6],[ 1,  9]]])

使用axis的相关函数

在numpy中,使用的axis的地方非常多,处理上文已经提到的average、max、min、sum,比较常见的还有sort和prod,下面分别举几个例子看一下:

  • sort
>>> data = np.random.randint(0, 5, [3,2,3])
>>> data
array([[[4, 2, 0],[0, 0, 4]],[[2, 1, 1],[1, 0, 2]],[[3, 0, 4],[0, 1, 3]]])
>>> np.sort(data)  ## 默认对最大的axis进行排序,这里即是axis=2
array([[[0, 2, 4],[0, 0, 4]],[[1, 1, 2],[0, 1, 2]],[[0, 3, 4],[0, 1, 3]]])
>>> np.sort(data, axis=0)  # 沿着第0维进行排序,原先的a000->a100->a200转变为a100->a200->a000
array([[[2, 0, 0],[0, 0, 2]],[[3, 1, 1],[0, 0, 3]],[[4, 2, 4],[1, 1, 4]]])
>>> np.sort(data, axis=1)  # 沿着第1维进行排序
array([[[0, 0, 0],[4, 2, 4]],[[1, 0, 1],[2, 1, 2]],[[0, 0, 3],[3, 1, 4]]])
>>> np.sort(data, axis=2)  # 沿着第2维进行排序
array([[[0, 2, 4],[0, 0, 4]],[[1, 1, 2],[0, 1, 2]],[[0, 3, 4],[0, 1, 3]]])
>>> np.sort(data, axis=None)  # 对全部数据进行排序
array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4])
  • prod(即product,乘积)
 >>> np.prod([[1.,2.],[3.,4.]])24.0>>> np.prod([[1.,2.],[3.,4.]], axis=1)array([  2.,  12.])>>> np.prod([[1.,2.],[3.,4.]], axis=0)array([ 3.,  8.])

相信通过上面的讲解与例子,你应该对axis有了比较清楚的了解。个人认为,如果没有理解axis的真正含义,很难熟悉的运用numpy进行数据处理


http://www.ppmy.cn/news/400540.html

相关文章

图形界面操作系统发展史

Alto 1973年4月,第一个可操作的Alto电脑在Xerox PARC完成。Alto是第一个把计算机所有元素结合到一起的图形界面操作系统。它使用3键鼠标、位运算显示器、图形窗口、以太网络连接。 Perq 1980年,Three Rivers Computer Corporation推出Perq图形工作站…

fiddler的坑--手机无法安装fiddler证书

解决办法: 1、使用手机自带的浏览器,下载fiddler证书后进行安装。 2、使用第三方浏览器,下载fiddler证书后进行安装。 3、从手机的文件管理器进入,找到下载的fiddler证书后进行安装。 4、使用设置中的“从设备存储空间安装”&…

图新地球加载倾斜模型看不清楚--一次Quadro显卡的问题排查记录

序: 同一份数据,在一台电脑上用图新地球加载查看没有任何问题,在另外一台电脑上加载,就很模糊 1.表现效果 倾斜模型加载不清晰。 2.问题分析与解决 一般遇到这种情况,经验判断: 1.首先反应就是模型数据…

centos7 防火墙设置

centos7 防火墙设置 1 概述2 防火墙服务操作2.1 查看防火墙服务状态2.2 开启防火墙2.3 关闭防火墙2.4 重启防火墙2.5 设置开机自启动2.6 查看防火墙开机启动是否成功 3 防火墙操作3.1 查看防火墙状态3.2 查看规则3.3 查看所有开放端口3.4 查看服务器操作系统端口3.5 开启端口3.…

Matlab的多维数组操作

MATLAB中的多维数组是指具有两个以上维度的数组。在矩阵中,两个维度由行和列表示。 每个元素由两个下标(即行索引和列索引)来定义。多维数组是二维矩阵的扩展,并使用额外的下标进行索引。例如,三维数组使用三个下标。前…

多维度分簇可视化

多维度分簇可视化 前言案例传统二维\三维图二维图三维图N维图pairplotPCA主成分分析多维度量尺(Multi-dimensional scaling, MDS)TSNE(t-distributed Stochastic Neighbor Embedding) 前言 前段时间做各种样本分簇,发…

Matlab-多维数组

示例 %% %1维数组 a1_1[1,2,3,4] a1_2[1 2 3 4] %2维数组a2[][] a_n[1 2 3 4;5 6 7 8] %多维数组,对a2x4数组进行扩展 a_n(:,:,2)[9 10 11 12;13 14 15 16] a_n(:,:,3)[17 18 19 20; 21 22 23 24]%用与其他数据相同的函数进行创建 b ones(4,4,2) c randn(2,2,3)…