正则相关常用指令
用于备忘常用的正则表达式
元字符
元字符 | 说明 |
---|---|
. | 匹配除换行符以外的任意字符 |
\w | 匹配数字、字母、下划线,相当于[a-zA-Z0-9] |
\s | 任意空白符 |
\d | 数字,相当于[0-9] |
| | 或匹配 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
特殊
$1保留一部分前置匹配的字符
举例
字符 | 说明 |
---|---|
(imgur.com/(\w+))->$1.png | 变更为imgur.com/xxxxx.png |
re.findall(‘“id”:(.*?),’, id_content) | 正则匹配”id”:和,之间的内容 |
re.findall(“<b>.*?(\d{6})”, mail_content) | 正则匹配<b>后面的6位数字 |