正则表达式小结

embedded/2025/3/18 15:04:46/

正则表达式是一种用于描述文本模式的特殊字符串,它由一系列字符和特殊字符组成,用于匹配和操作文本数据。下面是正则表达式的一些常见规则:

  1. 字符匹配:

    • 普通字符:正则表达式中的普通字符(字母、数字、符号)将按照字面意义进行匹配。
    • 元字符:正则表达式中的一些特殊字符具有特殊含义,例如^$.*+?等。
  2. 字符类:

    • 方括号[]:用于定义一个字符类,匹配方括号中列出的任意一个字符。
    • 范围表示:可以在字符类中使用连字符-表示字符的范围。例如,[0-9]表示匹配任意一个数字字符。
  3. 量词:

    • *:匹配前面的元素零次或多次。
    • +:匹配前面的元素一次或多次。
    • ?:匹配前面的元素零次或一次。
    • {n}:匹配前面的元素恰好n次。
    • {n,}:匹配前面的元素至少n次。
    • {n,m}:匹配前面的元素至少n次且不超过m次。
  4. 特殊字符:

    • .:匹配任意单个字符,除了换行符。
    • ^:匹配输入字符串的开始位置。
    • $:匹配输入字符串的结束位置。
    • \:用于转义下一个字符,使其失去特殊含义。
  5. 逻辑操作:

    • |:用于分隔多个模式,匹配任意一个模式。
    • ():用于创建分组,可以对其中的模式进行分组和操作。
  6. 边界匹配:

    • \b:匹配单词的边界,即单词的开始或结束位置。
    • \B:匹配非单词边界的位置。
  7. 特殊字符简写:

    • \d或者[:digit:]:匹配任意一个数字字符,相当于[0-9]
    • \D:匹配任意一个非数字字符,相当于[^0-9]
    • \w:匹配任意一个单词字符(字母、数字、下划线),相当于[A-Za-z0-9_]
    • \W:匹配任意一个非单词字符,相当于[^A-Za-z0-9_]
    • \s:匹配任意一个空白字符(空格、制表符、换行符等)。
    • \S:匹配任意一个非空白字符。
  8. 反向引用:

    • ( ):用于创建捕获组,并将匹配的内容存储在临时变量中。
    • \n:用于引用前面的捕获组中的内容(n表示捕获组的编号)。
  9. 前后查找:

    • (?=...):正向前查找,匹配紧跟在指定模式之前的位置,但不包括该模式。
    • (?<=...):正向后查找,匹配紧跟在指定模式之后的位置,但不包括该模式。
    • (?!...):负向前查找,匹配不紧跟在指定模式之前的位置。
    • (?<!...):负向后查找,匹配不紧跟在指定模式之后的位置。
  10. 贪婪与非贪婪匹配:

    • *+?{}默认是贪婪匹配,尽可能匹配更多的字符。
    • *?+???{}?表示非贪婪匹配,尽可能匹配更少的字符。

这些是正则表达式的一些常见规则和特性。不同的正则表达式引擎和工具可能支持不同的规则和扩展,因此在具体使用时应查阅相关文档以获得更准确的信息和语法。


正则表达式与命令配合使用:

下面是一些在Linux中使用正则表达式的常见命令和示例:

  1. grep命令: grep命令用于在文件中搜索匹配正则表达式的文本行。

示例:

grep 'pattern' file.txt

这将在file.txt文件中查找匹配pattern的文本行。

  1. sed命令: sed命令用于对文本进行模式匹配和替换操作。
sed 's/pattern/replacement/' file.txt

这将在file.txt文件中查找匹配pattern的文本,并将其替换为replacement

  1. awk命令: awk命令是一种强大的文本处理工具,支持使用正则表达式进行模式匹配和操作。
awk '/pattern/ { print $0 }' file.txt

这将在file.txt文件中查找匹配pattern的文本行,并将其打印出来。

这只是一些常见的命令和示例,正则表达式在Linux中的应用非常广泛,可以根据具体的需求和工具使用文档来了解更多用法和选项。


http://www.ppmy.cn/embedded/173622.html

相关文章

嵌入式项目代码架构与分层

代码架构与分层 BSP:板级支持驱动程 BSP: Board Support Package MCU和板上外设器件(比如MPU6050)的通信与交互过程。 有时候分两种: 1.在裸机(有限状态机)情况下,写的驱动程序; 2.在操作系统下,写驱动程序。 Core:MCU驱动程序 面向MCU进行编程,初始化MCU内部的外设(时…

解决QT_Debug 调试信息不输出问题

方式1 &#xff1a;手动通过添加环境变量解决 ->使用命令&#xff1a; QT_LOGGING_TO_CONSOLE1 qtcreator启动 ->如若还未输出qDebug调试信息 则在程序中引<QLoggingCategory>包 #include <QLoggingCategory> ->在程序入口添加 QLoggingCategory::defa…

本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】

目录 一、本地部署DS 二、建立本地知识库 1.安装python和必要的库 2.设置主目录工作区 3.编写文档解析脚本 4.构建向量数据库 三、基于DS,使用本地知识库检索 本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客 安装…

(性能测试)性能测试工具 2.jmeter的环境搭建 3jmeter元件和4使用实例 5jmeter元件和参数化

目录 性能测试工具 性能测试工具 jemeter环境搭建 jmeter的常用目录介绍 jmeter修改语言和主题--jmeter界面的汉化 jmeter元件 jmeter元件和组件的介绍 jmeter的作用域原则 jmeter的执行顺序 案例&#xff1a;执行顺序 jmeter使用案例 jmeter线程组的介绍 jmeter…

365天之第P10周:Pytorch实现车牌识别

365天之第P10周&#xff1a;Pytorch实现车牌识别 Pytorch实现车牌识别 365天之第P10周&#xff1a;Pytorch实现车牌识别一、导入数据1.获取类别名2. 数据可视化3. 标签数字化4. 加载数据文件5. 划分数据 二、自建模型三、 训练模型1. 优化器与损失函数2. 模型训练 四、 结果分析…

深入理解 C++20 中的 `std::shared_ptr` 原子操作

文章目录 1. std::shared_ptr 的线程安全问题2. std::shared_ptr 原子操作函数2.1 原子读取和存储2.2 原子交换2.3 原子比较交换 3. 注意事项4. 示例5. 总结 在多线程编程中&#xff0c;线程安全是一个至关重要的问题。C11 引入了 std::shared_ptr&#xff0c;它通过引用计数机…

【VS小知识】VS如何保存UTF8

之前由于用C#开发服务器&#xff0c;无意间发现VS保存的.cs文件不是UTF8编码的&#xff0c;虽然文件内看着是中文&#xff0c;但服务器传递给客户端的数据不是中文而是乱码。今天就来讲一下如何将VS保存为UTF8。话不多说直接开始。 问题表现 我们拿Unity举例。我们在脚本文件中…

RAGFlow部署与使用(开源本地知识库管理系统,包括kibana配置)

一、RAGFlow 简介 戳我访问RAGFlow RAGFlow 是一款基于深度文档理解构建的开源 RAG&#xff08;Retrieval-Augmented Generation&#xff09;引擎。它可以给我们搭建本地知识库&#xff0c;将用户的知识文档上传到RAGFlow后&#xff0c;通过文档切分、向量入库&#xff0c;在…