Python中 re.findAll()、re.sub()、set()的使用

news/2024/11/15 8:34:58/

1. re.findall()

        re.findall():函数返回包含所有匹配项的列表。返回string中所有与pattern相匹配的全部字串,返回形式为list / 数组。

由函数原型代码可知,findall() 函数存在三个参数:

        1. pattern:正则表达式中的 ‘模式字符串’ ;
        2. string:当前需要处理(查找替换)的原始字符串;
        3. flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0      

# 示例代码
import re
text1 = '北京市海淀区不存在的38街区不想工作大厦99号'
res = re.findall(r'\d+', text1)
print(type(res))
print(res)# output
# <class 'list'>
# ['38', '99']

2. re.sub()

        re.sub():函数将所有匹配项,替换为选择的文本,并返回结果。

由函数原型代码可知,re.sub() 函数存在五个参数:

        1. pattern:正则表达式中的 ‘模式字符串’ ;

        2. repl:需要被替换成的字符串,即将匹配到的pattern替换为repl;可以是函数;
        3. string:当前需要处理(查找替换)的原始字符串;
        4. count:可选参数,表示需要替换的最大次数,必须是非负整数;默认值为0,即匹配到的所有子串都进行替换操作;

        5. flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0       

# 将所有匹配到的‘数字串’ 替换为 ’520‘
text1 = '北京市海淀区不存在的38街区不想工作大厦99号'
res = re.re(r'\d+', 520)
print(type(res))
print(res)# output,返回值res结果是str
# <class 'str'>
# 北京市海淀区不存在的520街区不想工作大厦520号

3. set()

        set():python内置函数的其中一个,创建一个无序不重复元素集。支持计算交集、差集、并并集。

# 为list数组l1 去重
l1 = [1, 1, 2, 2, 2, 3, 4]
s1 = set(l1)
print(type(s1))
print(s1)# output,返回类型是 set
# <class 'set'>
# {1, 2, 3, 4}
# 计算l1 和 l2 的交集
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1)
s2 = set(l2)
u = s1 & s2
print(type(u))
print(u)# output,返回结果类型set
# <class 'set'>
# {2, 3, 4}
# 计算l1 和 l2 的并集, 并集符号 ‘|’,intersection
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1) # {1, 2, 3, 4}
s2 = set(l2) # {2, 3, 4, 5, 6}
u = s1 | s2
print(type(u))
print(u)# output,返回结果类型set, 计算 {1, 2, 3, 4} 和 {2, 3, 4, 5, 6} 的并集
# <class 'set'>
# {1, 2, 3, 4, 5, 6}
# 计算差集,diff
l1 = [1, 1, 2, 2, 2, 3, 4]
l2 = [2, 3, 3, 4, 5, 6, 6]
s1 = set(l1) # {1, 2, 3, 4}
s2 = set(l2) # {2, 3, 4, 5, 6}
print(s2)
u = s1 - s2
print(type(u))
print(u)# output,返回结果是set
# <class 'set'>
# {1}
# set内也可以传入字符串,会自动转换成list类型
text1 = '北京市海淀区海淀区不想上班不想上班'
res = set(text1)
print(res) # 内部元素是一个个的字,去重 且 无序# output
# <class 'set'>
# {'上', '北', '班', '海', '淀', '京', '不', '想', '区', '市'}


http://www.ppmy.cn/news/50702.html

相关文章

MQ集群(rabbitMQ)

普通集群: 创建过程 我们先在之前启动的mq容器中获取一个cookie值&#xff0c;作为集群的cookie。执行下面的命令&#xff1a; docker exec -it mq cat /var/lib/rabbitmq/.erlang.cookie 可以看到cookie值如下&#xff1a; EFLYOBKNYFETSAXOUEYI 接下来&#xff0c;停止…

计算机类大学生竞赛经验分享

如果你是作为一个科班出生的学习编程方向的一名在校大学生&#xff0c;那么如果对竞赛感兴趣&#xff0c;可以看看这篇文章 本人作为一名前端开发方向的学生&#xff0c;将自己这几年的参赛经验和比赛相关类型介绍分享给大家 首先我们要知道&#xff0c;竞赛分为三种大概的方向…

数据可视化神器!Matplotlib Python教程 | 从入门到精通绘制各种类型的图形和保存图形

大家好&#xff0c;我是爱吃熊掌的鱼&#xff0c;今天我要给大家带来一篇有趣开朗的Matplotlib Python教程。Matplotlib是Python中最流行的数据可视化库之一&#xff0c;它可以帮助我们将数据转化为易于理解的图表和图形。无论你是初学者还是专业人士&#xff0c;Matplotlib都是…

一个好的前端开发人员必须掌握的前端代码整洁与开发技巧

前端代码整洁与开发技巧 ​ 为保证前端人员在团队项目开发过程中的规范化、统一化&#xff0c;特建立《前端代码整洁与开发技巧》文档&#xff0c;通过代码简洁推荐、开发技巧推荐等章节来帮助我们统一代码规范和编码风格&#xff0c;从而提升项目的可读性和可维护性。 目录 …

3.派生类和抽象类

参考资料&#xff1a;https://github.com/ToshioCP/Gobject-tutorial/blob/main/gfm/sec6.md 抽象类型没有任何实例。 G_DECLARE_DERIVABLE_TYPE宏用来声明抽象类。这类似于G_DECLARE_FINAL_TYPE宏。 比如面的例子&#xff0c;MNuber是抽象类&#xff0c;G_DECLARE_DERIVABL…

基于DistFlow方程求解给定的通用径向单相配电网络的配电功率流方程(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 本文介绍了基于DistFlow方程求解给定的通用径向单相配电网络的配电功率流方程及结果展示。 &#x1f4da;2 运行结果 主函数部…

【U-Net】训练自己的数据集

代码用的是b导的 整个训练流程也是根据b导的视频来的 源码地址&#xff1a;https://github.com/bubbliiiing/unet-pytorch 博客地址&#xff1a;https://blog.csdn.net/weixin_44791964/article/details/108866828 # 一、准备数据集 1、使用labelme软件标注数据&#xff0c;得…

光流法Optical Flow,Lucas-Kanade方法,CV中光流的约束分析

光流法Optical Flow&#xff0c;Lucas-Kanade方法&#xff0c;CV中光流的约束分析 Multiple View Geometry1. Optical Flow Estimation2. The Lucas-Kanade Method2.1 Brightness Constancy Assumption2.2 Constant motion in a neighborhood2.3 Compute the velocity vector2.…