Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。
re.sub(pattern, repl, string, count=0, flags=0)
参数:
- pattern : 正则中的模式字符串。
- repl : 替换的字符串,也可为一个函数。
- string : 要被查找替换的原始字符串。
- count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
- flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。
- flags=re.I ,不区分大小写
正则表达式基础
基础里面呢主要有6需要记忆的东西,分别是:
.:匹配除了换行以外其他所有字符a:匹配字符a,衍生为匹配单个字母ab:匹配字符串ab,衍生为匹配字符串a|b:匹配a或者b,就是或者的意思a*:匹配0次或者是多次a- :转义符号,转义一个特殊的字符
正则表达式字符类
[ab-d]:a,b,c,d四个字符中的一个,衍生为使用[],那就是匹配其中的一个
[^ab-d]:除了a,b,c,d四个字符其他的任意字符,衍生为使用[^]可以排除[]里面的东西
[b]:退格字符,了解
d:一个0-9的数字
D:一个非数字
s:一个空白字符
S:一个非空白字符
w:匹配一个字母,数字或者是下划线
W:匹配一个除字母,数字,下划线之外的任意字符
正则表达式量词
*:匹配0次或者多次。等价于{0,}+:匹配一次或者多次。等价于{1,}?:匹配0次或者一次。等价于{0,1}{2}:只匹配2次{2, 5}:匹配2-5次{2,}:匹配2次或者多次
正文完