Pandas主要处理以下三个数据结构:
序列(Series)
数据帧(DataFrame)
面板(Panel)
数据结构 | 维数 | 描述 |
序列 | 1 | 1维结构,值可变,大小不变 |
数据帧 | 2 | 2维结构,值可变,大小可变,表结构 |
面板 | 3维标记,值可变。大小可变 |
总结了以下几点:
较高的维数据结构是较低维数据结构的容器:例如,DataFrame是Series的容器,Panel 是DataFrame的容器
所有Pandas数据结构值都是不变的
除了序列,其他的Pandas数据结构都是大小可变的,序列是大小不变
最常用的是DataFrame,使用表格数据,在语义上更多考虑行和列,而不是轴0和轴1,比较符合人的思维习惯
这些数据结构构建在Numpy数组基础上
Pandas的核心为两大数据结构:序列、数据帧,数据分析相关的所以事物大多围绕着这两大结构进行的