正则表达式语法规则
1.普通字符
字符 | 描述 |
---|---|
[ABC] | 匹配 […] 中的所有字符 |
[^ABC] | 匹配除了 […] 中字符的所有字符 |
[A-Z] | [A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母 |
. | 匹配除换行符以外的任意字符 |
[\s\S] | 匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,不包括换行 |
\w | 匹配字母、数字、下划线。等价于 [A-Za-z0-9_] |
2.非打印字符
字符 | 描述 |
---|---|
\cx | 匹配由 x 指明的控制字符 |
\f | 匹配一个换页符 |
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\s | 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v] |
\S | 匹配任何非空白字符。等价于 [^ \f\n\r\t\v] |
\t | 匹配一个制表符 |
\v | 匹配一个垂直制表符 |
3.特殊字符
特别字符 | 描述 |
---|---|
$ | 匹配输入字符串的结尾位置 |
() | 标记一个子表达式的开始和结束位置 |
* | 匹配前面的子表达式 000 次或多次,要匹配 * 字符,请使用 \* |
+ | 匹配前面的子表达式 111 次或多次,要匹配 + 字符,请使用 \+ |
. | 匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 \. |
[ | 标记一个中括号表达式的开始 |
? | 匹配前面的子表达式 000 次或 111 次 |
\ | 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符 |
^ | 匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合 |
{ | 标记限定符表达式的开始 |
| | 指明两项之间的一个选择 |
4.限定符
代码 | 说明 |
---|---|
* | 匹配前面的子表达式 000 次或多次 |
+ | 匹配前面的子表达式 111 次或多次 |
? | 匹配前面的子表达式 000 次或 111 次 |
{n} | nnn 是一个非负整数。匹配确定的 nnn 次 |
{n,} | nnn 是一个非负整数。至少匹配 nnn 次。 |
{n,m} | mmm 和 nnn 均为非负整数,其中 n<=mn <= mn<=m。最少匹配 nnn 次且最多匹配 mmm 次。 |
5.定位符
代码 | 说明 |
---|---|
^ | 匹配输入字符串开始的位置 |
$ | 匹配输入字符串结尾的位置 |
\b | 匹配一个单词边界,即字与空格间的位置 |
\B | 非单词边界匹配 |
代码 | 说明 |
---|---|
?= | exp1(?=exp2) :查找 exp2 前面的 exp1 |
?<= | (?<=exp2)exp1 :查找 exp2 后面的 exp1 |
?! | exp1(?!exp2) :查找后面不是 exp2 的 exp1 |
?<! | (?<!exp2)exp1 :查找前面不是 exp2 的 exp1 |
6.修饰符
修饰符 | 含义 | 描述 |
---|---|---|
i | ignore ,不区分大小写 | 将匹配设置为不区分大小写,搜索时不区分大小写 |
g | global ,全局匹配 | 查找所有的匹配项 |
m | multi line ,多行匹配 | 使边界字符 ^ 和 $ 匹配每一行的开头和结尾,记住是多行,而不是整个字符串的开头和结尾 |
s | 特殊字符圆点 . 中包含换行符 \n | 默认情况下的圆点 . 是匹配除换行符 \n 之外的任何字符,加上 s 修饰符之后,. 中包含换行符 \n |