正则表达式
1 正则表达式
正则表达式 (regular expression) 是处理字符串的一个非常有效的工具,本文中做所叙 述的正则表达式的相关知识是一些常用的使用总结
2 元字符
2.1 分界符
字符 | 匹配 |
---|---|
^ | 行开头 |
$ | 行结束 |
\< | 词开头,这里的词即为 word, 一般连续的字母活数字前面是一个词开头 |
\> | 词结束 |
2.2 字符占位符
字符 | 匹配 |
---|---|
. | 一个任何的字符 |
[…] | 一个方括号中所列的字符 |
[^…] | 一个方括号中没有列的字符 |
2.3 分组
字符 | 匹配 |
---|---|
(…) | 给正则表达式分组,可以使用竖线来区分分组 |
例如: (apple|banana)
可以匹配 apple 或者 banana 这两个词。
2.4 重复
字符 | 匹配 |
---|---|
c? | c 字符出现一次或不出现 (one optional) |
c* | c 字符出现无数次或不出现 (any amount OK) |
c+ | c 字符出现无数次或出现一次 (at least one) |
c{min,max} | c 字符重复次数在 [min, max] 区间中 |