Pandas介绍与Series创建

news/2024/9/24 7:26:09/

1.Pandas介绍

  • Pandas 是基于 NumPy 的一种工具,该工具是为解决数据分析任务而创建的,Pandas 提供了大量能使我们快速便捷地处理数据的功能

  • Pandas 与出色的 Jupyter 工具包和其他库相结合,Python 中用于进行数据分析的环境在性能、生产率和协作能力方面都是卓越的

  • Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数据数据足以处理金融、统计、社会科学、工程等领域里的大多数案例

  • 处理数据一般分为几个阶段:数据整理与清洗、数据分析与建模、数据可视化,Pandas 是处理数据的理想工具

2.Pandas安装

  • Anaconda 环境:无需安装

  • 普通 Python 环境:pip install pandas -i Simple Index

3.导入 Pandas 模块

import numpy as np

import pandas as pd

4.Series

  • Series 是一种类似于一维数组的对象,由下面两个部分组成

    • Values:一组数据(ndarray 类型)

    • index:相关的数据索引标签

5.Series 的创建

  • 第一种方式:由列表或 NumPy 数组创建

    • 默认索引为 0 到 N-1 的整数型索引


# 列表方式创建
list1 = [11,22,33,44]
s = pd.Series(list1)
s
# 执行结果
0    11
1    22
2    33
3    44
dtype: int32# NumPy数组创建
n = np.array(list1)
s = pd.Series(n)
s
# 执行结果
0    11
1    22
2    33
3    44
dtype: int32# 查看类型
type(s)
# 执行结果
pandas.core.series.Series
    • index和values

# 值是ndarray的一维数组
s.values
# 执行结果
array([11, 22, 33, 44])# 索引
s.index
# 转换成列表
#list(s.index)
# 执行结果
RangeIndex(start=0, stop=4, step=1)# 修改索引index,确保与元素个数保持一致
s.index = ["A","B","C","D"]
# 或者
# s.index = list("BCDE")
s
# 执行结果
A    11
B    22
C    33
D    44
dtype: int32# 通过索引获取值,数字索引只能使用中括号的方式
s.A,s.C,s["D"]
# 执行结果
(11, 33, 44)# 通过索引修改值
s["D"] = 100
s
# 执行结果
A     11
B     22
C     33
D    100
dtype: int32
  • 由字典创建

d = {"a":11,"b":22,"c":33,"d":44
}
s = pd.Series(d)
s
# 执行结果
a    11
b    22
c    33
d    44
dtype: int64# 修改索引
s.index = list("ABCD")
s
# 执行结果
A    11
B    22
C    33
D    44
dtype: int64# 字典值为二维数组
d = {"a":np.random.randint(0,10,size=(2,3)),"b":np.random.randint(0,10,size=(2,3)),"c":np.random.randint(0,10,size=(2,3)),"d":np.random.randint(0,10,size=(2,3))
}
s = pd.Series(d)
s
# 执行结果
a    [[6, 4, 7], [8, 8, 1]]
b    [[3, 1, 8], [9, 1, 1]]
c    [[9, 2, 3], [3, 7, 9]]
d    [[6, 0, 8], [6, 7, 6]]
dtype: object# 通过索引查看值
s["a"]
# 执行结果
array([[6, 4, 7],[8, 8, 1]])pd.Series([1,2,3],index=["鲁班","杜甫","李白"],name="历史人物")
# 执行结果
鲁班    1
杜甫    2
李白    3
Name: 历史人物, dtype: int64


http://www.ppmy.cn/news/1426641.html

相关文章

Linux网络编程--网络传输

Linux网络编程--网络传输 Linux网络编程TCP/IP网络模型网络通信的过程局域网通信跨网络通信:问题总结: Linux网络编程 TCP/IP网络模型 发送方(包装): 应用层:HTTP HTTPS SSH等 —> 包含数据&#xff0…

概念:Android 虚拟机

Android中的Dalvik虚拟机(DVM)和Android运行时(ART)都是运行在内存中的。它们是Android操作系统的一部分,为Android应用提供了一个管理执行代码的环境。具体来说: Dalvik虚拟机 (DVM):Dalvik是…

【Linux】详解如何利用共享内存实现进程间通信

一、共享内存(Shared Memory)的认识 共享内存(Shared Memory)是多进程间共享的一部分物理内存。它允许多个进程访问同一块内存空间,从而在不同进程之间共享和传递数据。这种方式常常用于加速进程间的通信,因…

锦瑟香也MYLOVE:音质与颜值俱佳,入坑HiFi的热门好物!

当下尽管无线耳机大行其道,但有线耳机依旧保有其独特的魅力,特别是在音质表现上,它们拥有无线耳机难以企及的优势。如果对音质要求很高的话,口袋里还是少不了一副有线耳机。国产品牌中就有许多性价比高的有线耳机,它们…

循序渐进丨使用 Python 向 MogDB 数据库批量操作数据的方法

当我们有时候需要向数据库里批量插入数据,或者批量导出数据时,除了使用传统的gsql copy命令,也可以通过Python的驱动psycopg2进行批量操作。本文介绍了使用psycopg2里的executemany、copy_from、copy_to、copy_expert等方式来批量操作 MogDB …

【python】图像边缘提取效果增强方法-高斯模糊

一、介绍 高斯模糊是一种常用的图像处理技术,用于减少图像中的噪声和细节。它通过对图像中的每个像素点进行加权平均来实现模糊效果。具体而言,高斯模糊使用一个高斯核函数作为权重,对每个像素点周围的邻域进行加权平均。这样可以使得每个像…

C++智能指针(二十)

一.RAII(Resource Acquisition Is Initialization) RAII资源获取即初始化,RAII的思想就是在构造时初始化资源,或者托管已经构造的资源。在析构的时候释放资源。一般不允许复制或赋值,并且提供若干的资源访问的方法。比…

如何导出https服务器端证书

如何导出https服务器端证书(即SSL证书中的服务器证书)?要导出https服务器端证书,可以按照以下流程进行操作。 1)登录服务器 使用适当的登录方式登录服务器,以获得访问权限。 定位证书文件 找到证书文件…