pandas——字符串处理【建议收藏】

news/2024/12/31 3:55:16/

pandas——字符串处理

作者:AOAIYI
创作不易,如果觉得文章不错或能帮助到你学习,记得点赞收藏评论一下哦


文章目录

  • pandas——字符串处理
  • 一、实验目的
  • 二、实验原理
  • 三、实验环境
  • 四、实验内容
  • 五、实验步骤
    • 1.cat() 拼接字符串
    • 2.split()切片字符串
    • 3.get() 获取指定位置的字符串
    • 4.contains() 是否包含表达式,返回True或False。
    • 5.replace() 字符串替换
    • 6.slice() 按字符串下标的开始结束位置切割字符串。
    • 7.count() 计算给定单词出现的次数
    • 8.len() 计算字符串的长度
    • 9.strip()去除前后的空白字符
    • 10.lower() 全部小写
    • 11.upper() 全部大写
    • 12.index() 查找给定字符串的位置
    • 13.capitalize() 首字符大写
    • 14.swapcase()大小写互换
    • 15.islower()至少包含一个小写字符, 且不包含大写字符。
    • 16.isupper()至少包含一个大写字符, 且不包含小写字符。
  • 总结


一、实验目的

熟练掌握pandas中字符串操作

二、实验原理

在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多。
在这里插入图片描述

三、实验环境

Python 3.6.1以上

Jupyter

四、实验内容

下面我们来详细了解一下,Series类或DataFrame的字符串String自带的方法有哪些。

五、实验步骤

1.cat() 拼接字符串

import pandas as pd  
pd.Series(['a', 'b', 'c']).str.cat(['A', 'B', 'C'], sep=',')

在这里插入图片描述

pd.Series(['a','b','c']).str.cat(sep=',')  

在这里插入图片描述

2.split()切片字符串

import numpy as np  
s=pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])  
print(s)  
s.str.split('_')  
s.str.split('_',-1)  
s.str.split('_',1) 

在这里插入图片描述

3.get() 获取指定位置的字符串

import numpy as np  
s=pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])  
s.str.get(0)  
s.str.get(1)  
s.str.get(2) 

在这里插入图片描述

4.contains() 是否包含表达式,返回True或False。

s.str.contains('d')

在这里插入图片描述

5.replace() 字符串替换

s.str.replace("_", ".")  

在这里插入图片描述

6.slice() 按字符串下标的开始结束位置切割字符串。

s.str.slice(1,3)  

在这里插入图片描述

7.count() 计算给定单词出现的次数

s.str.count("a")  

在这里插入图片描述

8.len() 计算字符串的长度

s.str.len()

在这里插入图片描述

9.strip()去除前后的空白字符

idx = pd.Series([' jack', 'jill   ', '  jesse  ', 'frank'])  
print(idx)  
idx.str.strip()  

在这里插入图片描述

10.lower() 全部小写

s.str.lower()

在这里插入图片描述

11.upper() 全部大写

s.str.upper()

在这里插入图片描述

12.index() 查找给定字符串的位置

注意,如果不存在这个字符串,那么会报错!

s.str.index('_')

在这里插入图片描述

13.capitalize() 首字符大写

s.str.capitalize()

在这里插入图片描述

14.swapcase()大小写互换

s.str.swapcase()

在这里插入图片描述

15.islower()至少包含一个小写字符, 且不包含大写字符。

s.str.islower()

在这里插入图片描述

16.isupper()至少包含一个大写字符, 且不包含小写字符。

s.str.isupper()

在这里插入图片描述


总结

为什么纸上谈兵不行?纸上谈兵太理想化了,把自己没有发现的问题隐藏了,当成了不存在的问题。只有实际多多亲自动手,才会发现有太多的问题是书上没提到的,也是自己没想到的。才会发现,一个小小的问题也要搞上半天。当然,如果你基础巩固的话,那这些问题应该都是可以被你解决的。熟练后,就不认为这些问题了。
不要看代码不难就感觉会了,只有自己的手打一遍,没有错误,编程的严谨些决定了,你错一个字母都不行。所以大家一定要注意,编程是自己打出来的,不是复制,粘贴你就会了,以后碰到了,还是不会。


http://www.ppmy.cn/news/24509.html

相关文章

详解无线技术标准都使用哪些频段?中国物联网市场又适用哪些频段

由于各行各业都有各自的频段只应用需求,所以一般频段都是由国家来进行分配的。国家设立无线电管理机构,通过拍卖、定价的方法向企业、机构发放频段使用许可。获得许可的机构将会获得拍照。这也就是5G,4G时各运营商获得国家颁发牌照的由来。只…

2022年“网络安全”赛项湖南省赛选拔赛 任务书

2022年“网络安全”赛项湖南省赛选拔赛 任务书2022年“网络安全”赛项湖南省赛选拔赛 任务书A模块基础设施设置/安全加固(200分)B模块安全事件响应/网络安全数据取证/应用安全(400分)C模块 CTF夺旗-攻击 (200分&#x…

C++11可变模板参数

C11可变模板参数一、简介二、语法三、可变模版参数函数3.1、递归函数方式展开参数包3.2、逗号表达式展开参数包一、简介 C11的新特性–可变模版参数(variadic templates)是C11新增的最强大的特性之一,它对参数进行了高度泛化,它能…

Scratch少儿编程案例-丝滑版贪吃蛇

专栏分享 点击跳转=>Unity3D特效百例点击跳转=>案例项目实战源码点击跳转=>游戏脚本-辅助自动化点击跳转=>Android控件全解手册点击跳转=>Scratch编程案例👉关于作者

C++:类和对象(中)

文章目录1 类的6个默认成员函数2 构造函数2.1 概念2.2 特性3 析构函数3.1 概念3.2 特性4 拷贝构造函数4.1 概念4.2 特性5 赋值运算符重载5.1 运算符重载5.2 赋值运算符重载5.3 前置重载和后置重载6 日期类的实现7 const成员8 取地址及const取地址操作符重载1 类的6个默认成员函…

kubernetes集群部署springcloud项目【AL】【未写完】

kubernetes集群部署springcloud项目【AL】 (先手工做,非自动化) #环境: 192.168.73.138 master 192.168.73.139 node1 192.168.73.140 node2 192.168.73.137 harbor、mysqlgit clone https://github.com/lizhenliang/simple-…

【第30天】SQL进阶-查询优化- performance_schema系列实战五:查看最近的事务执行信息(SQL 小虚竹)

回城传送–》《32天SQL筑基》 文章目录零、前言一、 查看最近的事务执行信息数据准备(如果已有数据可跳过此操作)开启第一个会话,配置启用事务事件开启第二个会话,用于执行事务,并模拟事务回滚第一个会话查询活跃事件第…

企业管理者不得不看!现在的大企业都是怎么做文档管理的?

最近有一位朋友问我:“如果是大型企业,文档该怎么管理?” 说实话,很多内部的CIO、CTO对这个问题都是束手无策。信息文件散乱、难以和内部的组织构架关联起来、查找困难、不同版本更新进度不一,确实存在一些管理上的难题…