盘点Python正则表达式中的贪婪模式和非贪婪模式

Python进阶者
• 阅读 743

大家好,我是我是皮皮。

一、前言

前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题,其中涉及到Python正则表达式中的贪婪模式和非贪婪模式,讨论十分火热,这里拿出来给大家分享下,一起学习。

盘点Python正则表达式中的贪婪模式和非贪婪模式

二、解决过程

这里分享【小王】大佬的解答,一起来看看吧,下面是他给的一个示例代码。

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."
pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")
result1 = re.findall(pattern1, txt)
result2 = re.findall(pattern2, txt)
print(result1)
print(result2)

输出结果如下图所示:

盘点Python正则表达式中的贪婪模式和非贪婪模式

关于输出的解析如下:

我想匹配HTML标签中的数据,也就是<>之间的数据。

pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")

这两种只相差了一个?,但是区别却很大。解析如下图所示:

盘点Python正则表达式中的贪婪模式和非贪婪模式

直到什么时候停止呢?

盘点Python正则表达式中的贪婪模式和非贪婪模式

这个就是贪婪模式的匹配方式,那么非贪婪模式呢?

盘点Python正则表达式中的贪婪模式和非贪婪模式

小彩蛋

分享一个【小王】大佬的代码,实现的效果是将正则匹配结果写成命名分组Python代码。

常规写法如下所示:

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<([A-Za-z0-9]+)>.*?</\1>.*")
print(re.findall(tag, txt))

写成命名分组的写法如下所示:

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<(?P<tag_mark>[A-Za-z0-9]+)>.*?</(?P=tag_mark)>.*")
print(re.findall(tag, txt))

总结

大家好,我是皮皮。这篇文章基于粉丝提问,针对Python正则表达式中的贪婪模式和非贪婪模式问题,给出了具体说明和演示,顺利的帮助粉丝解决了问题。

最后感谢粉丝【杰】提问,感谢【小王】大佬给出的解答和示例,感谢【(这是月亮的背面)】、【dcpeng】、【wangning】、【Chloé P.】等大佬们参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Python进阶者 Python进阶者
2年前
Python匿名函数lambda x: x-0 and x-1代表的意思是什么...
大家好,我是我是皮皮。一、前言前几天在Python最强王者交流群有个叫【ChloéP.】的粉丝问了一个关于Python匿名函数的问题,讨论十分火热,这里拿出来给大家分享下,一起学习。题目如下图所示:下面是给出的答案,乍看有点难懂。二、解决过程这个这里给出【杰】大佬的答案,一起来看看吧。下面是fliter这个函数的含义:不过看上去还是有点晦涩难懂,后来【德善
Python进阶者 Python进阶者
2年前
分享一场Python正则表达式中的特殊序列问答交流
大家好,我是我是皮皮。一、前言前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个关于Python正则表达式的问题,讨论十分火热,这里拿出来给大家分享下,一起学习。下图是原始题目:下面是给出的答案,乍看有点难懂,不过有正则狂魔【小王】大佬在,问题不大。二、解决过程这个这里给出【小王】大佬的解答,一起来看看吧,下面是他给的一个示例代码。import
Python进阶者 Python进阶者
2年前
编写一个闭包函数,要实现的功能是计数功能
大家好,我是皮皮。一、前言前几天在Python最强王者交流群有个叫【杰】的粉丝问了一个Python装饰器的问题,这里拿出来给大家分享下,一起学习下。二、解决过程这里【东哥】给出了解答,其实这个题目就是在考你装饰器的内容。代码如下:count0defwrapper(func):definner(args,kwargs):g
Python进阶者 Python进阶者
2年前
Python中的and和or,结果让人出乎意料之外
大家好,我是皮皮。一、前言前几天在Python最强王者交流群有个叫【Chloe】的粉丝问了一个Python基础的问题,关于and和or,这里拿出来给大家分享下,一起学习下。二、解决过程这里【杰】给出了解答,其实Python中,除括号外,and优先级较高,那么这里的话【瑜亮老师】也给出了解答,确实没有括号,表达式从左往右运算,and比or优先级高,先算an
Python进阶者 Python进阶者
2年前
selenium如何添加代理IP?
大家好,我是皮皮。一、前言前几天在Python钻石群有个叫【进击的python】的粉丝问了一个关于Python中selenium如何添加代理IP的问题,这里拿出来给大家分享下,一起学习。二、解决过程这里给出【PI】吴老板大佬的解答,一起来看看吧!直接上图了,如下图所示:他写这个已经是3年前的时候。当年还是个实习生呢,现在是吴老板了。三、总结大家好,我是
Python进阶者 Python进阶者
1个月前
如何把一个python列表(有很多个元素)变成一个excel表格的第一列?
大家好,我是Python进阶者。一、前言前几天在Python最强王者群有个叫【麦当】的粉丝问了一个关于Python如何把一个python列表(有很多个元素)变成一个excel表格的第一列的问题,这里拿出来给大家分享下,一起学习。二、解决过程这里给出【dcp
Python进阶者 Python进阶者
2年前
盘点一个Pandas数据清洗题目
大家好,我是皮皮。一、前言前几天在Python白银交流群有个叫【冻豺】的粉丝问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。如何才能把pandasserise里乱七八糟的字符清理干净呢?二、解决过程【dcpeng】解答这里给出了一个示例的代码,使用了apply和lambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数
Python进阶者 Python进阶者
1年前
盘点一个Python正则表达式的问题
大家好,我是皮皮。一、前言前几天在Python白银群【whoisme】问了一个Python正则表达式的问题,这里拿出来给大家分享下。下图是他的正则表达式:二、实现过程这个正则表达式还是蛮复杂的,在Python中,正则表达式中的问号?表示前面的字符出现0次或
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这