在JavaScript正则表达式中,大括号 {}、中括号 [] 和小括号 () 都有不同的作用和应用场景。
大括号 {}
在正则表达式中,大括号 {} 表示重复次数。以下是一些常见的应用场景:
{n}:精确匹配出现的次数,例如 \d{3} 匹配三个连续的数字。
{n,}:至少匹配 n 次,例如 \d{4,} 匹配至少四个连续的数字。
{n,m}:匹配 n 到 m 次,例如 \w{2,4} 匹配出现两到四次字母、数字或下划线。
中括号 []
在正则表达式中,中括号 [] 表示一个集合,包含要匹配的字符。以下是一些常见的应用场景:
[abc]:匹配字符 a、b 或 c。
[a-z]:匹配任何小写字母。
[A-Z]:匹配任何大写字母。
[0-9]:匹配任何数字字符。
[^abc]:匹配除了 a、b、c 以外的任何字符。
[a-z&&[^aeiou]]:匹配任何小写字母,但排除元音字母。
小括号 ()
在正则表达式中,小括号 () 表示一个分组。以下是一些常见的应用场景:
(abc)
匹配子字符串 abc。
(a|b|c)
匹配 a、b 或 c。
(?:abc)
非捕获分组,匹配子字符串 abc,但不捕获。
(\d{3}-\d{4})
捕获分组,匹配任何包含一个三个连续数字加短线加四个连续数字的组合
在实际应用中,正则表达式常用于验证输入的格式是否符合要求、替换文本中的部分内容、按照指定格式进行搜索等操作。
小括号详细
在 JavaScript 中,小括号 () 是正则表达式中的分组语法。它的作用是将其中的内容作为一个整体进行处理。
以下是一些小括号在正则表达式中的应用场景:
捕获分组
使用小括号可以创建一个捕获分组,将其内容标记为一个子表达式,并且将其匹配的内容保存到一个自动命名的编号变量中(通常为 $n 或 \n,其中 n 是捕获组的编号)。之后可以在正则表达式中使用捕获分组来引用它的值。
例如,可以使用小括号将一个日期字符串分成年、月和日三个部分:
const regex = /(\d{4})-(\d{2})-(\d{2})/;
const str = '2022-05-01';
const match = regex.exec(str);
console.log(match[1]); // '2022'
console.log(match[2]); // '05'
console.log(match[3]); // '01'
在这个例子中,捕获分组 (\d{4})、(\d{2}) 和 (\d{2}) 分别匹配了年、月和日,并将它们的值保存到了 $1、$2 和 $3 中。
非捕获分组
使用 ?: 语法可以创建一个非捕获分组,该分组不会保存匹配的内容,也不会占用捕获组的编号。这在处理重复子表达式、选择分支或子表达式选项时非常有用。
例如,可以使用非捕获分组来让正则表达式可以处理多个空格或制表符的情况:
const regex = /(?: |\t)+/;
const str = 'foo bar\tbaz qux';
const words = str.split(regex);
console.log(words); // ['foo', 'bar', 'baz', 'qux']
在这个例子中,正则表达式 (?: |\t)+ 匹配一个或多个空格或制表符,通过 split 方法将字符串拆分成多个单词。
向后引用分组
使用 \n 语法可以将正则表达式中之前的某个捕获分组匹配的值作为后面的表达式中的一部分进行匹配。这在处理重复单词或标记等情况时非常有用。
例如,可以使用向后引用分组来匹配重复的单词:
const regex = /\b(\w+)\b\s+\1/;
const str = 'foo foo bar bar baz';
const match = regex.exec(str);
console.log(match[0]); // 'foo foo'
console.log(match[1]); // 'foo'
在这个例子中,捕获分组 (\w+) 匹配一个或多个单词字符;\s+ 匹配一个或多个空格;\1 匹配先前捕获的单词,确保已经捕获的单词重复出现。