《正则表达式必知必会》笔记

下面是一些平时经常会遗忘的正则表达式的知识点：

匹配时使用ASCII码

匹配符号-

匹配非数字字符

匹配特殊符号

\r\n 用于 Windows 系统中的文本行的结束标签，\n 用于 Unix 类系统。
\d 用于匹配数字， \w 用于匹配字母或数字或下划线，\s 用于匹配任意空白字符的含义。注意：当字母 d 、 w 、 s 是大写时，表示取反。

使用特殊符号匹配字符范围

在方括号中使用特殊字符

默认情况下， + 、 * 、 ? 、 { 、 } 等元字符会使用贪婪法则去匹配尽可能多的字符，在这些符号后面增加 ? 可以启用这些匹配模式的懒惰型版本来防止过度匹配。

懒惰版本的模式匹配

贪婪版本的模式匹配

单词边界匹配

(?m) 可以用于多行匹配，多用于已经指定了 ^ 或 $ 的正则表达式。在 JavaScript 中，使用标签 m 来指定这一模式。除此以外，还有正向前 (?=) 和负向前 (?!) 等匹配方式。

多行匹配模式

或匹配

在有些实现的回溯引用中，\0 代表整个正则表达式。在 JavaScript 中，当执行替换时，如果使用到回溯引用，在替换语句中需要使用 $ 代替 \。

使用回溯匹配

注意回溯引用是和前面的实际匹配完全相同。例子：如果第一次匹配到2个空字符，那么以后所有的相同引用都只认2个空字符！！。

有一些元字符用于替换的表达式中，如：\U$1\E 、$1\U$2\L 等。
任何一个子表达式都可以转换为一个向前查找表达式，只要加上 ?= 前缀即可，同一个搜索模式里可以使用多个向前查找。向后查找操作符为 ?<=。很多正则表达式的实现均不支持。

注意：这里的向前和向后的具体含义，因为匹配文本相对于模式的方向与文本阅读方向正相反。向前/向后操作符必须放在一个子表达式里。向前查找模式的长度是可变的，可以包含 . 和 + 之类的，但是向后查找模式只能是固定长度。

在线测试正则表达式的网站： https://regexr.com/
编写正则表达式真正困难的地方在于把不需要匹配的情况也考虑周全并确保它们都被排除！
https://medium.com/@jitbit/cool-regex-performance-hacks-i-bumped-into-83c9fdd1976b

See Also: