Python数据分析系列(五):python数据结构 — Pandas中的Series使用

server/2024/9/23 11:12:29/

文章目录

  • 前言
  • 一、Series创建与属性
  • 二、Series的索引
  • 三、Series的基本运算
  • 四、Series的数据对齐
  • 五、Series操作
    • 1、判断是否是唯一值
    • 2、判断值
    • 3、值计数
    • 4、缺失值处理
      • 1、滤除缺失数据
      • 2、填充缺失数据
    • 5、日期时间列中提取月份和年份


前言

Pandas 是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。其中Series和DataFrame是两种最主要的数据结构,本文主要介绍Series的使用。


一、Series创建与属性

  • 基本特征:
    • 类似一维数组的对象
    • 由数据和索引组成
  • 属性:
    • 索引(index):对应是最左侧那一列。
    • 数据(values):每一个索引的右侧对应一个值。
    • name:Series对象及其索引(index)都有一个name属性。

示例1:

python">import pandas as pd
aSeries=pd.Series([1,2,'a'])
aSeries
# 输出:
# 0    1
# 1    2
# 2    a
# dtype: object

Series字符串表现形式为:索引在左边,值在右边。

示例2:自定义Series的index。

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=[1,2,3])
aSeries
# 输出:
# 1     apple
# 2    orange
# 3     lemon
# dtype: objectaSeries.index
# 输出:
# Int64Index([1, 2, 3], dtype='int64')aSeries.index=[4,5,6] #Series索引可以通过赋值的方式就地修改
aSeries
# 输出:
# 4     apple
# 5    orange
# 6     lemon
# dtype: objectaSeries.values
# 输出:
# array(['apple', 'orange', 'lemon'], dtype=object)

示例3:如果数据被存放在一个python字典中,也可以直接通过这个字典来创建Series。

python">import numpy as np
data={'apple':'8.4','orange':'7','lemon':'4'} 
aSeries=pd.Series(data)
aSeries
# 输出:
# apple     8.4
# orange      7
# lemon       4
# dtype: object

示例4:Series及其索引(index)的name属性

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=[1,2,3])
aSeries.name="price"
aSeries.index.name="id"
aSeries
# 输出:
# id
# 1     apple
# 2    orange
# 3     lemon
# Name: price, dtype: object

二、Series的索引

示例1:索引单个值

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=['a','b','c'])
aSeries['a']
# 输出:
# 'apple'aSeries['c']='peach' #Series索引对应的数据可以通过赋值的方式就地修改
aSeries
# 输出:
# a     apple
# b    orange
# c     peach
# dtype: object

示例2:索引一组值

python">import pandas as pd
aSeries=pd.Series(['apple','orange','lemon'],index=['a','b','c'])
aSeries[['c','a']]
# 输出:
# c    peach
# a    apple
# dtype: object

示例3:层次化索引

python">import pandas as pd
aSeries= pd.Series(np.random.randn(10),index

http://www.ppmy.cn/server/25368.html

相关文章

商城数据库88章表80~83

schooldb库——utf8字符集——utf8_general_ci排序规则 先创建库,再去使用下列的DDL语句。 (80)DDL——商城职员表 CREATE TABLE huang_staffs (staffId int(11) NOT NULL AUTO_INCREMENT COMMENT 自增ID,loginName varchar(40) NOT NULL …

IOPS ;MB/S分别在衡量RAN/SEQ R/W的原因说明

IOPS(Input/Output Operations Per Second) 定义:IOPS是指存储设备每秒可以完成的读写操作的次数。它主要用来衡量随机读写性能。 适用场景:IOPS常用于衡量在大量小文件传输或高并发数据库操作等场景下的性能。在这些情况下&…

费曼学习法个人总结-1

2024年4月27日 1,知道它叫什么和懂得它是什么是两件事,要了解事物的本质,不应该只是了解名字。 2,输出倒逼输入。 3,实施的5步骤 调整心态,开始行动指定目标,养成习惯找对方法,高…

新科技辅助器具赋能视障生活:让盲人出行融入日常

随着科技日新月异的发展,一款名为蝙蝠避障专为改善盲人日常生活的盲人日常生活辅助器具应运而生,它通过巧妙整合实时避障与拍照识别功能,成功改变了盲人朋友们的生活格局,为他们提供了更为便捷、高效的生活体验。 这款非同…

火车头采集怎么发布到Wordpress

火车头采集怎么快速发布到Wordpress系统,可以按照以下步骤操作: 目录 1. Wordpress火车头采集发布模块 2. 发布模块内容参数映射,火车头采集发布数据到Wordpress 3. 简数采集一键发布到Wordpress方法 1. Wordpress火车头采集发布模块 如…

XTuner微调LLM:1.8B、多模态和Agent-笔记四

本次课程由XTuner 贡献者李剑锋、汪周谦、王群老师讲解【XTuner 微调 LLM:1.8B、多模态和 Agent】课程 课程视频:http:// https://b23.tv/QUhT6ni 课程文档:https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md 两种Finetun…

每日一题:Redis 中的内存淘汰机制、有哪些内存淘汰策略❓

💡 Redis 是一种基于内存的键值数据库,由于内存有限,当 Redis 占用的内存达到上限时,就需要进行内存淘汰,以腾出一些内存空间。 Redis 中的内存淘汰机制包括🔍: 1)定期删除&#x…

共享旅游卡项目如何做线上运营?分享运营的3个核心点!

疫情三年下来,还能保持活跃的实体行业,可能就是旅游行业。别看很多美食餐饮的,看起来很赚钱,除开成本,其实也是赚点辛苦钱。 从2023年疫情放开,很多人都涌入到旅游行业。但因为绝大多数都是门外汉&#xf…