Python---re模块(正则表达式)

embedded/2024/11/12 13:24:18/

1.1、正则表达式所知,简单了解正则匹配
\d:表示一个数字字符
\d{3}:匹配此模式3次
1.2 Regex对象

python">import re
demo=re.compile(r'\d\d\d-\d\d')
#re.compile()传入一个字符串,返回一个Regex对象,正则表达式
mo=demo.search('my num is:345-12')
#search()传入字符串,返回一个Match对象,不匹配返回None
print("my num is:"+mo.group())
#Match对象有group()分组,默认参数为0,返回第一个分组
#输出结果my num is:345-12

1.3用正则表达式匹配更多模式

注:要匹配特殊字符,在其前面加转义符\

分组

使用()来进行分组

python">import re
demo=re.compile(r'(\d\d\d)-(\d\d)')
mo=demo.search('my num is:345-12')
print("my first_num is:"+mo.group(0))
print("my second_num is:"+mo.group(1))
mo1,mo2=mo.groups()
#gruops()可输出全部
print(mo1)
print(mo2)

输出结果

python">my first_num is:345-12
my second_num is:345
345
12

管道

管道符|

python">import re
demo=re.compile(r'demo1|demo2')
#只能匹配其中一个即哪个先被发现,返回哪个,但有办法匹配使得group()可使用
mo=demo.search('demo1 and demo2')
print("my only_num is:"+mo.group())
#输出结果my only_num is:demo1
python">import re
demo=re.compile(r'bat(demo1|demo2)')
mo=demo.search('batdemo2')
print("my only_num is:"+mo.group())
print(mo.group(1))
#可返回含固定前缀
#返回结果为
#my only_num is:batdemo2
#demo2

re.compile()修改匹配形式

(key)?:可选可不选(0次或1次)
*
(key)* :0次或多次
+
(key)+:一次或多次
{}
(key){number}:特定次数
1.4贪心和非贪心匹配

python">import re
demo=re.compile(r'(ha){3-5}?')
#若没有?则会返回的结果为hahahahaha,默认为贪心,添加?非贪心匹配模式
mo=demo.search('hahahahahaha')
print("my string of finding is:"+mo.group())
#返回结果为my string is :hahaha

1.5 findall

Regex.findall()返回一个字符串列表(无分组),若有分组则为元组列表

python">import re
demo=re.compile(r'\d\d\d-\d\d')
cheese=demo.findall('port:333-22   port1:444-34')
print(cheese)
#返回为['333-22', '444-34']

包含元组

python">import re
demo=re.compile(r'(\d\d\d)-(\d\d)')
cheese=demo.findall('port:333-22   port1:444-34')
print(cheese)
#返回为[('333', '22'), ('444', '34')]
#每个元组代表一个字符串

1.6字符分类

字符含义
\d0-9的任意数字
\D除\d以外的任何字符(以下大写均类似)
\w任何字母、数字和下划线
\s空格、制表符、换行符
[0-5]匹配0-5其效果跟(0
[a-zA-Z]字符类仅匹配字母

1.7定位符 ^ $

字符含义
^文本开头
$文本结束

1.8通配符

字符含义
.(句点)匹配换行符以外的其它字符
.*匹配任意文本除换行符
re.DOTALL匹配换行符

.*默认为贪心模式,若要改为非贪心则可在其后加?如下.*?

python">check=re.compile(r'.*',re.DOTALL)
#如此可匹配任意文本,包括换行符

1.9不区分大小写
re.I或re.IGNORECASE

python">check=re.compile(r'hello',re.I)

1.10 sub() 替换字符串

python">import re
demo=re.compile(r'agent (\w)\w*')
cheese=demo.sub(r'\1***','agent aice agent bob agent clic.')
#第一个参数为替换字符串,第二个字符串为原始字符串
print(cheese)
#输出结果为 a*** b*** c***.

1.11管理复杂的正则表达式

python">import recheck = re.compile(r'''(          (\d{3}|\(\d{3}\))?  # 可选部分:匹配3位数字或一个括号内的3位数字C                   # 必须匹配字符'C'(\d{3})             # 必须部分:匹配3位数字
)''', re.VERBOSE)
#re.VERBOSE 忽略正则表达式中空白符和注释

1.12组合使用re.IGNORECASE re.DOTALL re.VERBOSE

re.compile()第二个参数只能放一个,那么如何使用多个呢

python">import re
check=re.compile(r'foo',re.IGNORECASE|re.DOTALL|re.VERBOSE)

http://www.ppmy.cn/embedded/136378.html

相关文章

前端零基础学习Day-Nine

盒子模型 盒子模型概念 盒子模型用来“放”网页中的各种元素 网页设计中内容,如文字、图片等元素,都可是盒子(DIV嵌套) 宽度属性width 宽度: width:长度值 | 百分比 | auto(自动) 最大宽度: max-width:…

windows中docker安装redis和redisinsight记录

创建一个Redis运行容器,命令如下 docker run -it -d --name redis -p 6379:6379 redis --bind 0.0.0.0 --protected-mode no -d 代表Redis容器后台运行 --name redis 给创建好的容器起名叫redis -p 6379:6379 将容器的6379端口映射到宿主机的6379端口,注…

基于matlab的人脸识别系统设计与仿真

第一章 绪论 本章提出了本文的研究背景及应用前景。首先阐述了人脸图像识别意义;然后介绍了人脸图像识别研究中存在的问题;接着介绍了自动人脸识别系统的一般框架构成;最后简要地介绍了本文的主要工作和章节结构。 1.1 研究背景 自70年代以…

防火墙|WAF|漏洞|网络安全

防火墙|WAF|漏洞|网络安全 防火墙 根据内容分析数据包: 1、源IP和目的IP地址 2、有效负载中的内容。 3、数据包协议(例如,连接是否使用 TCP/IP 协议)。 4、应用协议(HTTP、Telnet、FTP、DNS、SSH 等)。 5…

理想汽车Android面试题及参考答案

请解释一下 Android 中的 Handler 是如何工作的 在 Android 中,Handler 主要用于在不同线程之间进行通信,特别是在主线程(UI 线程)和工作线程之间。 Handler 是基于消息队列(MessageQueue)和 Looper 来工作的。首先,Looper 是一个循环器,它会不断地从消息队列中取出消息…

08、Java学习-面向对象中级:

Java学习第十二天——面向对象中级: IDEA: 创建完新项目后,再src里面创建.java文件进行编写。 src——存放源码文件(.java文件);out——存放编译后的字节码文件(.class文件) 在I…

Android 下内联汇编,Android Studio 汇编开发

版权归作者所有,如有转发,请注明文章出处:https://cyrus-studio.github.io/blog/ 内联汇编 Android 内联汇编非常适用于 ARM 架构的性能优化和底层操作,通常用于加密、解密、特定指令优化等领域。 1. 基础语法 内联汇编在 C/C …

数学基础 -- 线性代数之线性无关

线性无关 在线性代数中,线性无关列指的是矩阵中的列向量之间不满足线性组合关系,即无法通过其他列向量的线性组合来表示某一个列向量。简单地说,一组向量是线性无关的,意味着其中任何一个向量不能由其他向量生成。 1. 线性无关的…