Python数据分析系列(五):python数据结构 — Pandas中的Series使用

news/2024/10/19 18:21:16/

文章目录

  • 前言
  • 一、Series创建与属性
  • 二、Series的索引
  • 三、Series的基本运算
  • 四、Series的数据对齐
  • 五、Series操作
    • 1、判断是否是唯一值
    • 2、判断值
    • 3、值计数
    • 4、缺失值处理
      • 1、滤除缺失数据
      • 2、填充缺失数据
    • 5、日期时间列中提取月份和年份


前言

Pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。其中Series和DataFrame是两种最主要的数据结构,本文主要介绍Series的使用。


一、Series创建与属性

  • 基本特征:
    • 类似一维数组的对象
    • 由数据和索引组成
  • 属性:
    • 索引(index):对应是最左侧那一列。
    • 数据(values):每一个索引的右侧对应一个值。
    • name:Series对象及其索引(index)都有一个name属性。

示例1:

python">import pandas as pd
aSeries=pd.Series([1,2,'a'])
aSeries
# 输出:
# 0    1
# 1    2
# 2    a
# dtype: object

Series字符串表现形式为:索引在左边,值在右边。

示例2:自定义Series的index。

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=[1,2,3])
aSeries
# 输出:
# 1     apple
# 2    orange
# 3     lemon
# dtype: objectaSeries.index
# 输出:
# Int64Index([1, 2, 3], dtype='int64')aSeries.index=[4,5,6] #Series索引可以通过赋值的方式就地修改
aSeries
# 输出:
# 4     apple
# 5    orange
# 6     lemon
# dtype: objectaSeries.values
# 输出:
# array(['apple', 'orange', 'lemon'], dtype=object)

示例3:如果数据被存放在一个python字典中,也可以直接通过这个字典来创建Series。

python">import numpy as np
data={'apple':'8.4','orange':'7','lemon':'4'} 
aSeries=pd.Series(data)
aSeries
# 输出:
# apple     8.4
# orange      7
# lemon       4
# dtype: object

示例4:Series及其索引(index)的name属性

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=[1,2,3])
aSeries.name="price"
aSeries.index.name="id"
aSeries
# 输出:
# id
# 1     apple
# 2    orange
# 3     lemon
# Name: price, dtype: object

二、Series的索引

示例1:索引单个值

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=['a','b','c'])
aSeries['a']
# 输出:
# 'apple'aSeries['c']='peach' #Series索引对应的数据可以通过赋值的方式就地修改
aSeries
# 输出:
# a     apple
# b    orange
# c     peach
# dtype: object

示例2:索引一组值

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=['a','b','c'])
aSeries[['c','a']]
# 输出:
# c    peach
# a    apple
# dtype: object

示例3:层次化索引

python">import pandas as pd
aSeries= pd.Series(np.random.randn(10),index

http://www.ppmy.cn/news/1448246.html

相关文章

Faststone Capture:一触即发的效率革命【AI写作】

首先,这篇文章是基于笔尖AI写作进行文章创作的,喜欢的宝子,也可以去体验下,解放双手,上班直接摸鱼~ 按照惯例,先介绍下这款笔尖AI写作,宝子也可以直接下滑跳过看正文~ 笔尖Ai写作:…

前端项目学习记录3:mock接口

1.下载mock接口 pnpm i vite-plugin-mock 2.配置vite.config.ts import { defineConfig } from vite import vue from vitejs/plugin-vue import path from "path"; //引入svg需要用到的插件 import { createSvgIconsPlugin } from vite-plugin-svg-icons //mock插…

数据库原理与应用实验二 SQL SERVER查询分析器的使用

实验目的和要求 熟悉SQL SERVER环境,熟悉查询分析器的使用,能够熟练运用sql命令完成数据库,基本表、主码、外码和其它必要的约束条件的定义。 实验环境 Windows10 SQLServer 实验内容与过程 1 利用sql建立图书管理数据库,并定…

数据结构与算法实验题五道 A一元多项式的求导 B还原二叉树 C 六度空间 D 基于词频的文件相似度 E 模拟excel排序

A (1) 输入格式说明: 以指数递降方式输入多项式非零项系数和指数(绝对值均为不超过1000的整数)。数字间以空格分隔。 (2) 输出格式说明: 以与输入相同的格式输出导数多项式非零项的系数和指数。数字间以空格分隔,但…

MySQL中索引的数据结构

2.3.1. 索引数据结构 索引就是能够提高查询速度的一种数据结构,在数据插入时就进行了排序(会影响插入和更新的性能),索引广泛使用的是B树索引。 B树索引结构: 目前是基于磁盘排序效率最高的数据结构,树非…

农牧渔农业信息网整站源码优化版

下载地址:农牧渔农业信息网整站源码优化版.zip 适合做农产品、农业物资、农活用人信息平台

【開山安全笔记】WAF略知一二

在工作或面试中,网安从业者经常遇到关于各类安全设备的问题。然而,初学者对于安全设备的工作原理,功能和作用大都没有很深入的了解。基于此背景,開山安全笔记将发表关于安全设备的系列文章。 本篇主要论述防火墙的概念、原理和作…

QT:按钮类控件

文章目录 PushButton快捷键Radio Buttion PushButton 这个类继承自QAbstractButton,是所有按钮的父类 创建一个带有图标的按钮: 假设这个图片是这个 那么我们就可以创建按钮并进行设置了: #include "widget.h" #include "u…