python 正则表达式菜鸟教程(详解Python正则表达式re模块)
python 正则表达式菜鸟教程
详解Python正则表达式re模块正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。
正则大同小异,python 中的正则跟其他语言相比略有差异:
1、替换字符串时,替换的字符串可以是一个函数
2、split 函数可以指定分割次数,这会导致有个坑
3、前项界定的表达式必须定长
下面详细描述下 re 模块的使用方法,其实,注意上面提到的三点差异就好
1、match
说明:
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None。
语法:
re.match(pattern, string, flags=0)
flags为可选标识,多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识:
修饰符 |
描述 |
re.I |
使匹配对大小写不敏感 |
re.L |
做本地化识别(locale-aware)匹配 |
re.M |
多行匹配,影响 ^ 和 $ |
re.S |
使 . 匹配包括换行在内的所有字符 |
re.U |
根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. |
re.X |
该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。 |
匹配成功re.match方法返回一个匹配的对象,可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0),返回整个正则表达式的匹配结果。
举例:
|
s = 'abc123abc' print (re.match( '[a-z]+' , s)) # <_sre.SRE_Match object; span=(0, 3), match='abc'> print (re.match( '[a-z]+' , s).group( 0 )) # abc print (re.match( '[\d]+' , s)) # None print (re.match( '[A-Z]+' , s, re.I).group( 0 )) # abc print (re.match( '[a-z]+' , s).span()) # (0, 3) |
2、search
说明:
re.search 扫描整个字符串并返回第一个成功的匹配。
语法:
re.search(pattern, string, flags=0)
匹配成功re.search方法返回一个匹配的对象,否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
|
s = 'abc123abc' print (re.search( '[a-z]+' , s).group()) # abc print (re.search( '[a-z]+' , s).span()) # (0, 3) print (re.search( '[\d]+' , s).group()) # 123 print (re.search( '[\d]+' , s).span()) # (3, 6) print (re.search( 'xyz' , s)) # None |
groupdict
groupdict 返回匹配到的所有命名子组的字典。
|
print (re.search( '[a-z]+' , s).groupdict()) # {} print (re.search( '(?P<letter>[a-z]+)(?P<num>\d+)' , s).groupdict()) # {'num': '123', 'letter': 'abc'} |
3、sub 和 subn
说明:
re.sub用于替换字符串中的匹配项。
re.subn返回一个元组,包含替换后的字符串及替换次数。
语法:
sub(pattern, repl, string, count=0, flags=0)
repl: 替换的字符串,也可为一个函数。
count: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
举例:
|
s = 'abc123abc' print (re.sub( '[\d]+' , '数字' , s)) # abc数字abc print (re.sub( '[a-z]+' , '字母' , s, 1 )) # 字母123abc # 将匹配的数字乘以 2 def double(matched): value = int (matched.group( 'value' )) return str (value * 2 ) # repl是一个函数 print (re.sub( '(?P<value>\d+)' , double, s)) # abc246abc print (re.subn( '[\d]+' , '数字' , s)) # ('abc数字abc', 1) print (re.subn( '[a-z]+' , '字母' , s,)) # ('字母123字母', 2) print (re.subn( '[a-z]+' , '字母' , s, 1 )) # ('字母123字母', 1) |
4、compile
说明:
re.compile 用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。
语法:
compile(pattern, flags=0)
举例:
|
s = 'abc123abc' p = re. compile ( '[\d]+' ) print (p.match(s, 4 , 5 ).group( 0 )) # 2 从位置4开始匹配到位置5 print (p.search(s).group( 0 )) # 123 |
5、findall
说明:
re.findall 在字符串中查找正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
语法:
findall(pattern, string, flags=0)
举例:
|
s = 'abc123abc' print (re.findall( '[a-z]+' , s)) # ['abc', 'abc'] print (re.findall( '[h-n]+' , s)) # [] |
6、finditer
说明:
finditer和 findall 类似,在字符串中查找正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。
语法:
finditer(pattern, string, flags=0)
举例:
|
s = 'abc123def' it = re.finditer( '[a-z]+' , s) for match in it: print (match.group()) |
7、split
说明:
re.split 方法按照能够匹配的子串将字符串分割后返回列表。
语法:
split(pattern, string, maxsplit=0, flags=0)
maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。
举例:
|
print (re.split( 'a' , '1A1a2A3' , re.I)) # ['1A1', '2A3'] # 输出结果并未能区分大小写,这是因为re.split(pattern,string,maxsplit, flags)默认是四个参数,当我们传入的三个参数的时候,系统会默认re.I是第三个参数,所以就没起作用。 # 如果想让这里的re.I起作用,写成flags=re.I即可。 print (re.split( 'a' , '1A1a2A3' , flags = re.I)) # ['1', '1', '2', '3'] |
8、escape
说明:
re.escape对字符串里面的特殊字符串进行转义。
语法:
escape(pattern)
举例:
|
print (re.escape( 'www.dxy.cn' )) # www\.dxy\.cn |
9、正则
“(?P<name>…)”:分组,并将其命名为<name>。
“(?P=name)”:引用别名为<name>的分组匹配到的串。
10、前项(否定)界定中的特殊
正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错:look-behind requires fixed-width pattern,原因是 python 中前项界定的表达式必须是定长的,例如
|
(?< = aaa) # 正确 (?< = aaa|bbb) # 正确 (?< = aaa|bb) # 错误 (?< = \d + ) # 错误 (?< = \d{ 3 }) # 正确 |
以上所述是小编给大家介绍的Python正则表达式re模块详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://www.cnblogs.com/gl1573/p/9649880.html
- Visual Studio中使用正则表达式替换
- html正则表达式案例(关于html字符串正则判断和匹配的具体使用)
- python 正则表达式在代码里的使用(python中正则表达式与模式匹配)
- python正则表达式处理教学(使用Python正则表达式操作文本数据的方法)
- python正则表达式入门(Python正则表达式实现简易计算器功能示例)
- C#正则表达式验证是否日期
- python 正则表达式语法大全(python re库的正则表达式入门学习教程)
- SqlServer类似正则表达式的字符处理问题(SqlServer类似正则表达式的字符处理问题)
- python3正则表达式详解(Python正则表达式和re库知识点总结)
- sql server 字符串处理(SQL Server中利用正则表达式替换字符串的方法)
- python怎么导入beautifulsoup元素(python使用BeautifulSoup与正则表达式爬取时光网不同地区top100电影并对比)
- 正则表达式在python的中的应用(Python中正则表达式的用法总结)
- python 正则表达式菜鸟教程(详解Python正则表达式re模块)
- python正则表达式该怎么学习(Python面向对象总结及类与正则表达式详解)
- C#正则表达式Regex类的用法
- Oracle正则表达式的用法
- 吉善缘《聚宝金蟾》金蟾招财摆件 三足全铜蟾蜍客厅店铺开业礼品(吉善缘聚宝金蟾金蟾招财摆件)
- 招财化煞神兽,金蟾变了(招财化煞神兽金蟾变了)
- 26岁杨紫的白素贞遇上24岁鞠婧祎,哪个最美(26岁杨紫的白素贞遇上24岁鞠婧祎)
- 鞠婧祎和杨紫两种风格的女生,你心里谁比较美(鞠婧祎和杨紫两种风格的女生)
- 三千年第一美女鞠婧祎出演白素贞pk杨紫,颜值胜赵雅芝王祖贤(三千年第一美女鞠婧祎出演白素贞pk杨紫)
- 成都轨道交通13号线一期工程最新进展(成都轨道交通13号线一期工程最新进展)
热门推荐
- docker安装nginx如何配置(docker部署nginx并且挂载文件夹和文件操作)
- linux下启动tomcat服务(Linux系统安装Tomcat并配置Service启动关闭)
- iis服务器的配置(win7下配置使用IIS搭建自己的WEB服务器)
- servu权限设置(Serv-U防溢出提权攻击解决设置方法)
- html5+canvas动画(解析html5 canvas实现背景鼠标连线动态效果代码)
- php上传图片视频代码(详解PHP素材图片上传、下载功能)
- css可以控制网页背景图片吗(CSS实现网页背景图片自适应全屏的方法)
- linuxdocker启动报错提示参数无效(docker 报错 Exited 1 4 minutes ago的原因分析)
- mysql数据库丢失怎么办(MySQL 数据丢失排查案例)
- 微信小程序ui聊天窗口(微信小程序实现简单聊天室)